专栏观察

从理想照进现实,中国凭什么快速落地人工智能算力网络?

文|智能相对论

作者|曾响铃

2021年5月底,国家发展改革委、中央网信办、工业和信息化部、国家能源局共同印发了《全国一体化大数据中心协同创新体系算力枢纽实施方案》,在这个方案中,关于算力资源的统筹协同发展在宏观层面定下了调,一个未来网络新愿景浮现出来;

仅仅时隔四个月,在刚刚举办的华为全联接2021上,中国科学技术信息研究所、AITISA(新一代人工智能产业技术创新战略联盟)、鹏城实验室联合发布了《人工智能计算中心发展白皮书2.0——从人工智能计算中心走向人工智能算力网络》,这个未来网络新愿景完成了宏观的构想与路线图设计,开始迈出步子付诸实践。

人工智能算力网络,正在成为“新基建”浪潮中最大的浪头之一,驱动中国AI产业发展进入史诗级加速进程,让智能社会这一人工智能发展的终极目标离得更近。在这个过程中,中国在发展AI产业方面的独特优势也展现得淋漓尽致。

关于算力的答案一步步“升维”,人工智能算力网络的出现是一种必然

要理解人工智能算力网络究竟是什么、为什么会出现,还要从产业对算力需求不断满足的进程看起。

随着AI场景化应用的加速落地,AI三驾马车之中,创新算法不断涌现、数据越来越丰富,而算力的挑战却日益严峻——AI“产业链条”上游的算力供给开始出现不足,逼迫着各种算力提供形式的进化,一步步“升维”。

阶段一:基础软硬件创新

一开始,专门针对AI计算的基础软硬件大发展,这包括专门的芯片产品(如NPU)推出,或者更进一步的,底层计算架构创新基础上的异构计算(例如昇腾AI),这些在本地或云端为AI提供相对于过去更充沛的算力。

阶段二:人工智能计算中心建设

然后,随着AI产业的进一步发展,在更强烈的算力需求面前,即便是有基础软硬件的创新,单一企业在部署或采购算力时,也会面临算力资源紧缺或价格高昂的难题。

于是,在那些有AI产业集群的地方,由政府主导建设的人工智能计算中心开始出现,通过集约化的方式为企业提供相对更合理的算力价格与更灵活的供给方式,最典型如已经落地的深圳鹏城云脑II和武汉人工智能计算中心,在昇腾AI加持下,其算力资源都在满负荷运行,可见需求之旺盛。

同时发生的,还有人工智能计算中心的产业化布局。

与同样集约化部署的超算中心只要单纯服务好科研不同,人工智能计算中心带有产业使命,要帮助智慧城市、智慧金融、智能制造、智慧交通等产业的发展,单纯的算力还需要与产业发展协同,所以,地方政府建设人工智能计算中心,已经形成了一中心四平台的格局:依托人工智能计算中心,打造了公共算力服务平台(普惠算力)、行业应用创新孵化平台(打造AI应用示范标杆)、产业聚合发展平台(推动AI产业集约化发展)以及科研创新和人才培养平台。

阶段三:人工智能算力网络

在包括人工智能计算中心在内的算力基础设施不断发展后,新的问题冒了出来:

不同区域的AI算力也有自己的波峰波谷,且在更充沛算力基础上发展的AI大模型对算力的使用又是阶段性、高密度的,自然而然,业界人士就开始思考跨区域调配算力资源的问题,把各地人工智能计算中心之间算力网络互连,实现资源共享、协同调度。

于是,人工智能算力网络应运而生,它用新型网络技术将各地分布的人工智能计算中心节点连接起来,在区域内感知、分配、调度人工智能算力,根据各中心算力资源的情况和各地区的需求情况进行算力动态调配。

考虑到当前人工智能计算中心的发展实际和中国区域经济状况,未来人工智能算力网络在具体互联方式上,或可以参照有关专家提出的“三加一”政策:依托长三角、粤港澳大湾区、京津冀、成渝经济圈等区域的互联建设,循序渐进。

值得一提的是,除了算力,通过人工智能算力网络,数据、算法资源也在全国范围内汇聚与融合,“一网络,三汇聚”的价值构想也在白皮书中提出,简单说就是:

一网络,即人工智能算力网络;

算力汇聚,即节点高速互联、统一管理与运维;

数据汇聚,即实现不同节点公共数据资源的安全开放,建设高质量人工智能公共数据集;

生态汇聚,即不同节点的大模型能力开放与应用创新成果共享,其目的是为了强化跨区域科研和产业协作。

可以看到,从基础软硬件创新到人工智能算力网络,一步步走下来,算力资源供给越来越充足,且算力与算法、数据的协同,与产业的融合也越来越紧密。当然,这三个阶段并没有严格的时间先后顺序,目前也在同时进行当中。

为什么只有中国能建设好人工智能算力网络?

人工智能算力网络的出现是产业需求发展的一种必然,只不过,这种必然只可能发生在中国,它是中国独特的AI技术与产业发展现实所决定,也是独属于中国的优势所在。

其原因,至少包括四个方面:

1、新基建同步发展的大背景

一方面,人工智能算力网络本身作为一种新型基础设施而存在,另一方面,它的背后还需要更底层的新型基础设施建设来支撑。

例如,不同节点算力的统筹,需要能够支撑海量数据的传输与接入的通信网络,按照规划,在其落地过程中的未来十年,宽带要实现从千兆到百G的跨越,而IP等资源要支撑百倍的容量提升。此外,还需要强大的边缘计算软硬件基础设施来实现中心+边缘分布式的算力模式实现百倍容量的增长。

而从人工智能算力网络到产业应用,这个过程中也需要大量新基建,从出产算力到最终用上、用好算力,没有一个很好的新基建底子是无法落地的。

而中国的新基建从宏观政策到具体落地已经在轰轰烈烈进行当中,人工智能基础设施被明确成为新基建的核心任务,在政策层面也是支撑科技自立自强和数字经济发展的基础设施,5G、wifi6、IPv6等技术正在广泛普及,这在全球范围内是独一无二的。

2、“节点”本身的快速发展

从人工智能算力网络的形成可以发现,这是一个宏观层面的统筹规划,其实现过程并不是从一无所有到全面具备的建设过程,人工智能计算中心“节点”成为核心资源,如果不具备大量的“节点”或者无法推动“节点”的快速建设和落地,人工智能算力网络只能是空中楼阁。

这也是为什么关于人工智能算力网络的讨论也有很多了,但能付诸行动的却几乎没有。

而在中国,人工智能计算中心早已是国务院《新一代人工智能发展规划》“建设高效能计算基础设施”的落地实体。到目前为止,在地方政府主导建设、华为等科技企业的参与下,深圳、武汉、西安等城市均已建成人工智能计算中心并投入运营,成都、中原等人工智能计算中心正在建设中,此外还有北京、南京等地的人工智能计算中心建设也陆续规划中。

这些只有在中国才出现的密集的节点,推动着人工智能算力网络快速落地。

3、产业集群化发展的需求汇聚

没有庞大需求的支撑,或者市场上存在的需求无法对接起来将算力有效“供给”出去,人工智能算力网络就无法落地,或者说,落地的过程本身就是一种资源和精力的浪费。

这时候,中国社会经济发展过程中独有的产业集群化发展路径的价值显露出来。

一方面,由于各地AI产业的发展都以集群化的方式进行,需求庞大而集中,将地区有效的需求都汇聚起来,可以实现供与需的充分对接;

另一方面,产业集群需求的庞大,使得各地一般都会存在属于自己的算力波峰波谷,在人工智能算力网络下,有效的算力供给需求总能在本地或跨区域找到恰当的使用者。

这使得人工智能算力网络可以做到“物尽其用”,最大化价值落地而远离“屠龙之术”,形成良性发展。

最终,人工智能算力网络的高效率运行,又将推动全国各个产业集群得到高速发展,一个正反馈循环就此形成。

4、具备突围内驱力的科技企业在努力

进一步往落地的细节看,人工智能算力网络需要大量技术创新来支撑,例如,仅在算力网络的一体化标准方面,就要完成算力网络架构及接口、应用及算力感知研究、算力需求量化与建模研究、算网资源可信与协同等标准的建设。

这些实打实的技术如果不突破,就会成为木桶的短板,严重影响人工智能算力网络的算力和产业推进效果。

但是,由于人工智能算力网络本身就是全新的事物,很多匹配技术也都是全新的,在全球范围内很难找到可参照的对象。这时候,在特殊复杂的局势下具备自主创新内驱力的中国科技企业,将更愿意在这些技术上进行投入,这是赶超世界、树立技术话语权的重要机会。

不是说国外的科技企业们就做不出这些技术,只不过,以人工智能计算中心的解决方案提供方华为为代表,中国科技企业一方面在动机上更为强烈,另一方面,在全新的领域,基于已有算力新基建经验(例如昇腾全栈AI)在技术理解方面将更胜一筹。

从技术创新、产业推进到科技高地,人工智能算力网络的价值凸显

手握利剑,人工智能算力网络到底能起到什么作用,答案有太多难以详述,但至少,有三个方面的价值是一定的。

首先,是对突破性技术创新的大力支持。

这方面,多模态大模型是典型。作为面向未来强人工智能、通用人工智能的重要技术创新,多模态大模型已经在人工智能领域提出了很多年,业界也有不少技术突破,但是,多模态大模型进一步往下走,算力需求呈几何式上升,一般的算力基础设施很快将难以胜任。

从图像、文字、语音单独一项的训练,到双模态、三模态的跃迁,让人工智能可以灵活应对不同模态的转化、像人与世界交互一样自然,这方面,由人工智能算力网络来驱动将有明显优势。

同理,还有很多需要爆发式增长的算力来支撑的技术创新,将在人工智能算力网络支撑下快速推进。

然后,是对产业发展全链条需求的全面满足。

众所周知,广泛的应用市场是中国发展一切科技的重要优势所在,将技术投放市场产生价值又反哺技术研发,滚动上升,已经成为很多产业技术进步的标准模式。

只是,在人工智能这里,上游的供给和下游的需求变得一样重要,人工智能算力网络的出现,意味着中国AI产业和技术的发展,一方面仍然拥有庞大的场景应用空间来实现商业价值驱动,另一方面又有着领先全球的算力供给能力,相对优势更加明显,推动AI产业的繁荣加速。

最后,是打造形成真正的科技高地。

过去人工智能的发展,算力、算法和数据这三驾马车虽然都在快速进步,但归根究底,突破性的发展并不算多,多数都是在已有的框架下进行不断优化、提升,例如,硬件不行就提升芯片性能,再不行就堆叠起来,以量取胜。

而人工智能算力网络的出现,可能与算法层面的基础模型创造(例如,NLP领域的BERT模型)有类似的突破性意义,直接以协同化的方式拉升了AI发展维度,在人工智能计算中心之后进一步突破了旧有算力供给的普遍形式,让AI真正摆脱算力的桎梏,迎接新的思维和实践。这也表明,在整体化的力量下,中国正在占领属于人工智能的新科技高地。

总而言之,过去很多年,中国已经在互联网科技、人工智能等领域持续领先全球,现在,这种领先正在延续和加深,在人工智能算力网络支持下,中国有望最先走入智能社会,真正获得睥睨全球的技术和产业链话语权。

*本文图片均来源于网络

 

希望看到您的想法,请您发表评论x