随着我国人工智能技术不断演进,算力基础设施已成为中国数字经济的“新基建”。智算中心,作为新型算力基础设施,已成为中国现今社会经济发展阶段和企业数字化转型的关键,同时将推动人工智能在大语言模型、自动驾驶、生物医药、工业制造和城市管理等行业的深度落地。
近日,优刻得推出了资源丰富、高效可靠的智能算力平台——“孔明”智算平台(以下称为“孔明”),能够面向各行业领域用户,提供更加卓越的智能算力和资源智慧管理服务。
值得一提的是,优刻得是最早一批响应国家“东数西算”战略的企业,已建成青浦和乌兰察布两大智算中心,目前管理的算力规模超过3000P,两个数据中心稳步扩建发展,为后续的算力部署提供了强有力的支撑。
功能及优势
基于优刻得的算力资源支持,“孔明”智算平台具备三大产品优势。使其能够胜任在AI领域内的大部分业务,帮助大模型公司提高训练效率、优化模型性能、降低开发成本,进一步推动AI大模型在各行业领域的发展和应用。
一、支持同构和异构卡训练的统一调度和管理
对于智能计算,通常需要大规模的数据集来进行AI模型的训练,常达到千卡的训练集群规模。基于优刻得多年公有云运营的成熟架构体系,“孔明”智算平台支持同构和多种异构卡型的接入,包括但不限于NVIDIA、AMD、Intel等品牌,甚至是各类国产GPU卡型,同时支持训练集群的统一调度和管理。这样的设计允许企业根据自身需求选择最适合的硬件设备,从而显著提高计算效率并获得更好的性能。
不仅如此,“孔明”智算平台还提供软硬件协同交付,支持私有化和公有云等多种交付方式。这意味着,无论企业需要在哪种环境中进行计算任务,都可以无缝接入大模型业务,轻松应对复杂的计算需求。
二、支持多样化组网方式接入
“孔明”智算平台具备强大的网络接入能力,支持多种组网方式,包括但不限于IB、RoCE、TCP/IP协议。这样的多样化网络接入方式,使得在AI智算场景下,不同业务场景的需求能够得到充分满足。无论是需要低延迟和高吞吐量的数据传输,还是对网络安全性的严格要求,“孔明”智算平台都能提供相应的网络支持。
三、支持分布式训练及断点续训
大模型通常需要大量的计算资源和可扩展的存储系统来支持其训练和推理过程。“孔明”智算平台全面拥抱大模型业务,为大语言模型提供分布式训练和断点续训的能力。智算集群支持弹性扩展,可根据客户当前的资源数量进行集群动态管理。这使得模型开发者能够更充分地利用算力资源,以更高的效率来训练和优化模型。
同时,平台还接入了高性能存储UPFS,该存储系统支持GPU Direct Storage,显著提升了存储吞吐性能,Checkpoint速度较传统存储提升了近10倍。以上功能特性,为大模型的开发和应用提供了强有力的支持,帮助客户更高效地处理大规模数据和加速深度学习训练。
此外,“孔明”智算平台还提供智能运维功能,例如故障告警和节点自愈等,以确保计算环境的稳定性和可靠性。这为模型开发者提供了一个稳定而强大的模型开发环境,使其能够专注于算法和模型的创新,而不需要过多关注基础设施的管理和维护。
基于优刻得云主机、裸金属、高性能存储、低延迟网络等基础设施,搭配“孔明”的资源调度、多用户管理、分布式训练的能力,以及模型推理服务平台UModelVerse,优刻得将服务大模型开发者、提供商、应用厂商、高校及科研机构等合作伙伴,提供一站式的AI计算开发服务,为大模型产业发展赋能。
适用领域及应用
“孔明”智算平台在大模型分布式训练、自动驾驶、生物医药、工业制造、城市治理等领域具有广泛的应用,并且为这些领域的AI模型训练和应用提供了显著的效率提升和便捷性。
一、大模型分布式训练
“孔明”智算平台积极响应大模型客户需求,提供分布式计算和断点续训的能力。通过智算平台,用户可以轻松调配和管理大规模的训练任务,快速迭代和优化模型。
二、自动驾驶领域
基于“孔明”智算平台和优刻得自建的乌兰察布和青浦数据中心,可为客户提供高达千卡并行的训练集群,高效稳定且性价比高,显著提高自动驾驶模型训练速度,大幅缩短模型迭代周期。
三、生物医药领域
“孔明”智算平台针对AI制药行业的需求,通过提升集群性能和训练效率,为诸如分子动力学仿真模拟训练等任务的执行提供了强力支持。借助“孔明”智算平台,生物医药领域的研究人员和开发者能够更快速地进行复杂的分子模拟和仿真训练,从而加速药物研发和优化过程。
四、工业制造领域
利用“孔明”智算平台的高性能计算能力,可以显著提高工业仿真、工业复核等任务的效率。通过高性能计算和快速数据处理,加速复核过程,减少错误和瑕疵,并提高整体生产效率。工业制造企业能够更高效地进行工艺优化、资源规划和生产调度,从而实现更加智能化和高效的工业制造,为产业升级和发展提供有力支撑。
五、城市治理领域
借助“孔明”智算平台强大的计算能力和数据处理能力,城市管理者可以实时监测和分析城市的各项指标,如交通流量、环境污染、垃圾管理等。基于这些数据,他们能够制定更有效的城市规划和资源分配策略,提升居民生活质量、促进城市智慧、可持续发展。
写在最后
在不久的将来,“孔明”智算平台希望发展成为一个智能计算的核心枢纽,而且成为推动产业数字化发展的重要引擎。优刻得将持续践行创新精神,积极响应市场需求,以稳定可靠的平台和全链路的服务支持,助力企业实现数字化转型和智能化升级。