作者 | 曾响铃
文 | 响铃说
“有了大算力,就能够产生系列大模型,应用创新就有了坚实基础。”
刚刚举办的世界人工智能大会(WAIC)上,华为轮值董事长胡厚崑做主旨发言时,对当下以及未来的人工智能产业落地做了如此表述。
过去一年,人工智能基础设施以肉眼可见的速度快速铺设,成为最显眼的新基建领域,全国20多个城市规划和建设人工智能计算中心,其中,深圳、武汉、中原、西安、成都、南京、杭州等多地的人工智能计算中心已相继上线。
在人工智能计算中心成为领先城市“标配”的同时,大模型的加速发展又让人直观看到这些基础设施在推进AI产业落地这件事上的现实意义——通过被充分支撑的大模型,AI将更快速进入到产业。
胡厚崑并非只是给出一个链条式的逻辑论断,更重要的是,在华为推动的昇腾AI产业生态之上,大模型正在快速发展,AI应用正在尝试进入“工业化大生产”的新阶段,这将是一个AI应用真正实现爆发的时代。
产业应用走向“工业化大生产”,驱动“AI向上的力量”
在经典经济学中,各种产品的“工业化大生产”是现代社会的重要表现,从作坊到工厂到全产业链,由手工、单一产品生产到批量化的生产线,生产力得到解放后,人类社会的进步速度远远快于过去数千年。
在大模型的推动下,AI应用的“生产”也在呈现这样的“工业化大生产”过程,只不过出产的不再是一个个实体产品,而变成了AI创新应用。
这一切,要从大模型的价值谈起。
超大规模的参数、海量训练的数据,让大模型形成了两大能力:
一是其所在领域AI应用不需要再从0开始,开发者只要基于大模型进行简单的参数调整和数据再训练,即可以实现场景的个性化应用适配;
二是大模型具备良好的泛化性,在一定领域内,众多场景都可以适配,不需要单独再做一个模型。
于是,一个“分工”就此形成:大模型提供底层通用的能力(因此在国外文献中大模型也被称作Foundation Model),而各场景的具体AI任务只要专注本场景下的专业应用需求进行“微调”即可,一个大模型管一片、一个场景简单调整就有一个应用,AI开发避免重复造轮子、效率更高,且对数据的需求只限定在特定的范围内不再需要巨量的数据来源,降低了门槛。
例如,在药物研发领域,由于场景复杂多样,每一个场景都单独训练AI模型,效率非常低。胡厚崑介绍,医药行业的盘古预训练大模型可以适配药物研发的多个关键场景,大大缩短药物研发周期,这就是分工价值的体现。
而恰恰,经典理论中的“工业化大生产”的关键前提即实现了“社会化大分工”,一个岗位只专注于做好某件事,通过流程链条串联起高效率的社会产品生产体系。大模型的底层通用能力与场景任务“分工”属性,让AI应用的“工业化大生产”成为可能,用胡厚崑的话说,是“实现从小作坊式向工业化开发转变”。
不过,这其中还存在一个症结问题:大模型固然可以解决众多场景的AI模型重复开发问题、实现AI应用的批量化产出,但如果大模型本身的开发也存在“重复造轮子”的问题,不同的主体扎堆、重复投入资源,那么AI应用创新的“社会化大分工”就失去了基础,“工业化大生产”也就失去了前提。
这时候,避免大模型开发本身的重复投入,就成为行业必须关注的事。华为呼吁全产业链的力量,与产业界共同规划“大模型沙盘”,就是在尝试解决这个问题。
这个“沙盘”,其价值可以概括为在AI发展的重要方向引导下,对大模型有序规划牵引、提升创新有效性、避免简单重复。
大模型沙盘出现的背景,在于大模型的开发过程十分复杂、门槛很高,一方面需要更体系化的行业引导与帮扶,另一方面一旦出现重复造轮子,对整个社会、对AI的发展来说,资源的浪费量也将更为巨大,必须及时规避。
现在,大模型沙盘规划了基础大模型和行业大模型两大模块,进行创新方向的牵引:
基础大模型,主要任务在于将科研创新的成果落地到行业具体场景,例如CV、NLP、多模态、博弈智能等。较为典型的,如在本次世界人工智能大会上获得SAIL大奖的紫东.太初大模型,由中科院自动化所和华为共同基于昇腾AI基础软硬件平台打造,是全球首个图文音三模态大模型,已经陆续孵化出新媒体内容检索平台、智能座舱、南宋御街数字人、手语教考一体机等场景化行业应用。
行业大模型,聚焦于具体的行业属性、加速行业智能化升级。较为典型的,如本次世界人工智能大会期间发布的“东方.御风”大模型,由中国商飞公司联合华为基于昇腾AI打造,据中国工程院院士、中国商飞首席科学家吴光辉在大会上介绍,它是业界首个工业级流体仿真大模型,主要应用于大型客机翼型流场的高效高精度AI仿真预测。
在华为的呼吁下,行业正在不断让这个大模型沙盘变得更加精细化、在更细分的领域避免“重复造轮子”的现象,并通过政、产、学、研、用联合,集中优势资源推出更优质的大模型——这同样是一种AI创新过程中“分工”的体现。
总结起来,大模型沙盘推动大模型创新实现“社会化大分工”,而大模型则推动AI应用创新的“社会化大分工”,双重“分工”之下,AI产业应用的“工业化大生产”有了更充分的基础。
随着大模型加速孵化行业应用创新,使能千行百业智能化升级,产业变革将全面开花,蓬勃向上的气氛也将形成,而这,正如支撑大模型发展的昇腾所强调的,是一种属于技术时代“AI向上的力量”。
“工业化大生产”三维联动,AI向上的力量彰显
当然,回顾历史,“工业化大生产”的形成不只有靠“社会化大分工”,还需要一系列条件促成并推动不断前进。
在AI的产业应用这里同样如此。具体来说,这包括三个维度,也是当下华为、昇腾与行业参与者在共同完成的事。
1、提供生产所需要的充足资源保障——算力基础设施广泛建设
电、石油等资源是工业化大生产的必备资源,类比到AI应用的生产,算力就成为这种不可或缺的资源。
这其中,算力网络统筹全国AI算力资源,形成如同水、电一样的基础设施,对需要大算力才能支撑的大模型至关重要。
2021年9月,中国科学技术信息研究所联合鹏城实验室、AITISA发布《人工智能计算中心发展白皮书2.0》,2021年底,鹏城实验室牵头成立了人工智能算力网络推进联盟,推进各地人工智能计算中心联接成网,2022年6月,“中国算力网”正式上线。
就在本次世界人工智能大会上,沈阳、广州、重庆、昆明、福州、长沙、廊坊7个新增节点接入中国算力网,至此网络中已有超过20个节点。再加上,技术层面多个人工智能计算中心间的AI算力调度与协同训练已完成初步验证,在业界的共同努力下,全国AI算力一张网已经初具雏形。
事实上,鹏城实验室的行动,一直处在国家“东数西算”工程与全国一体化算力网络的布局下,按照国家有关部委要求在进行。现在中国算力网初步落地,将推动自主创新的算力网络技术体系的成熟,实现全国大型算力的协同调度与高效计算,“让用户像用电一样使用算力服务”,这不仅仅让大模型的创新发展更有底气,更为数字经济时代打造了一个关键的算力底座。
2、提供高效“生产”的全程辅助——大模型开发使能平台、AI开发框架加速创新
现代科技创新与工业化大生产同频共振,前者推动后者不断提升效率和效果。在AI这里,平台和工具的创新同样推动着大模型快速发展,成为重要的辅助力量。
这方面,昇腾为产业界提供的完整的大模型开发使能平台最为典型。
从基础模型到应用开发的全流程,该平台推动大模型易开发、易适配、易部署,在其支持下,已有覆盖语音、视觉、多模态等多个领域的数十个全球领先的大模型问世,包括鹏程.盘古、鹏程.神农、紫东.太初、武汉.LuoJia、华为云盘古系列等有影响力的大模型。
此外,大模型的开发还需要具备能力适配的AI开发框架。这方面,2020年开源、作为昇腾AI全栈体系重要一环的昇思MindSpore并非只是为了大模型而生,却充分展现原生支持大模型开发的能力,一跃成为大模型开发的重要“操作系统”,紫东.太初等知名大模型的开发过程都使用了昇思MindSpore AI框架。
3、加速最终“产品”的市场推广与有效利用——产业联合体让快速对接的产业场景
工业化大生产与工业产品的消费始终互为因果,前者推动后者有更好的体验和价值,后者推动前者有不断前行的动力。AI应用面向产业的相互关系于此类似,只有能够深入到产业、产生改变与进化的价值,才有动力持续创新与迭代。
因此,大模型的产业化落地就成为AI产业应用“工业化大生产”最后的、关键的环节,华为与业界共同推动的围绕特定大模型的“产业联合体”,应运而生。其价值,按胡厚崑在WAIC上的发言,是“很好的打通科研创新与场景应用之间的断点,让懂AI的人了解行业,让懂行业的人也了解AI”。
就在不久前,智能遥感开源生态联盟(武汉.LuoJia)作为一个产业联合体就举办了第二次会议,联盟成员企业上海数慧、汉达瑞、航天宏图、武汉珈和科技等分享了基于联盟创新成果的最新行业方案,36家成员单位加入联盟当中。
类似的,还有多模态人工智能产业联盟(紫东.太初),在遥感和多模态两个领域,已经有70多家科研机构和企业加入,孵化了20多个行业新应用。
此外,本次世界人工智能大会上,由学术界、产业界领军人物和30多家全球头部流体力学高校、科研院所与龙头企业共同组建,智能流体力学产业联合体宣告成立,旨在推动飞机、高铁、汽车的设计中AI与传统流体力学的深度融合,加速大制造产业智能化升级。
可以料想的是,未来随着大模型的发展,将有更多与之匹配的产业联合体运作起来,其意义,在于更多创新与应用力量将汇聚起来,推动大模型直通产业,孵化出大量具体的行业应用成果,展现AI的变革力、开创产业新空间。
结语
挖掘大模型的优势,让AI产业应用实现“工业化大生产”,从基础设施建设、技术创新到产业落地,在华为、昇腾以及行业参与者的多方努力下,多层次的动作已经开始,基本的发展框架已经搭建好,剩下的,是每个“模块”持续深化下去。
当然,这其中有些补充的环节还需要跟随完善,例如,就像实体产品的“工业化大生产”需要更高素质的劳动力一样,AI产业的人才队伍建设也必不可少,无论是华为联合教育部推动人工智能人才培养计划,还是昇腾社区为开发者人才提供“学-练-训-赛”全周期成长路径,都是这个目标下的产物。
一个个“补丁”被打上后,大模型时代人工智能产业正迎来科研突破,行业应用落地进入了关键的加速期,昇腾AI将最终赋能产业、改变千行百业,展现出向上的力量。
*本文图片均来源于网络