互联网

从技术出发or从场景出发:大模型开始“路线分化”?

文 | 智能相对论

作者 | 叶远风

大模型时代,厂商们狂奔突袭,技术创新一浪高过一浪。

在这个过程中,先赶上风口做出一个大模型产品,宣传一波、站稳脚跟,再慢慢谈场景应用、价值落地,是很多厂商的做法——从技术出发再往场景切入,成为业界普遍的“路线图”。

但是,随着场景落地变得越来越重要,越来越成为业界尤其是政企客户的普遍关切,一种新的路线正在出现。

2023世界人工智能大会期间,大数据基础设施提供商爱数在“大模型时代的领域认知智能”分论坛上宣布全面升级AnyShare智能内容管理平台,推出AnyShare认知助手和AnyShare大模型一体机,并发布领域认知中台方案,正式布局大模型。

在直观上,爱数的这次发布,并没有像很多大厂那样推出一个有名字的大模型产品,而是强调“助力行业客户解决数据治理、数据运营、内容管理难题,加速业务智能化”。

换言之,大模型“产品”不是爱数的布局重点,把大模型“能力”嵌入已有的数据服务业务才是关键。

在这里,从场景需求出发再思考技术的融合,成为大模型一种新的发展路线。

聚焦落地后,大模型的路线分化是必然结果

每个明星大模型产品的发布,往往都是先展示一套面向C端的“聊天能力”,然后再公布其发展的“宏伟蓝图”——拉拢合作伙伴往各大场景布局落地。

数字化、智能化过去已经玩过的全场景构想,在大模型这里又来了一遍。

在千行百业都将被大模型占领的预期下,创造一个能够实现这样的市场机会的大模型,就成为从大厂到中小创业者的普遍理想。

而这,就是一种典型的“跟风”,先做出来画个大饼再说,管它后边如何。

实际上,既然大模型是注定要走向千行百业的,那么从千行百业原生出契合各自场景需求的大模型,某种程度上才应该是最恰当的方式之一。

这正是爱数在做的。

从2021年起,爱数就在推出数据智能产品,并与德国汉堡大学、复旦大学、天津大学等建立联合实验室。领域认知智能是爱数帮助客户实现数智化转型的重要着力方向,已经持续耕耘多时。

现在,当大模型东风吹起来,除了火热的、更容易被大众直接感知的AIGC,实际上最根本带动的是AGI(通用人工智能)的发展,而这与爱数实现领域认知智能的方向是一致的。

对爱数这样已经从事数据服务、认知智能的厂商来说,积极拥抱大模型,将全域数据能力及领域认知智能积累的优势与大模型技术深度结合,就成为一种自然而然的选择。

不需要跟风,不需要刻意,场景的价值基础一开始就具备,大模型带来的是直接落地的强化能力。

过去,爱数虽然着力推动客户实现业务智能化,但仍然面临一些挑战,例如在业务运营、决策方面缺乏高质量数据;由于业务不标准、执行不规范导致数据难治理;以及信息、知识的共享还需要人力繁琐的操作积累原始的数据,等等。

在业界,这种先需要大量的人力投入然后再创造智能化价值的过程,被称为“有多少人工就有多少智能”。大模型的介入,让爱数得以解决过去企业智能化转型在业务、知识、数据等层面大量需要人力工作的问题,全过程都不再需要太多人力的介入,而实现“有多少数据就有多少智能”。

如此,爱数的数据资产化、数据知识化、数据服务化和数据要素化努力就将事半功倍,帮助客户更好地实现业务智能化。

例如,在城市招商的过程中,爱数原本就能帮助政务客户实现领域认知智能,自动化整理各种产业链对象的知识,根据城市园区建设需求匹配对应的潜在合作对象。

大模型的加入,让这些知识的获取也不再需要繁琐的、长周期的大量人力投入,而是可以通过AGI能力大大加速,并在资源匹配上变得更加精准。

可以看到,爱数的大模型完全起源于场景业务的需求,是对创新技术的充分利用,推动原有数字化、智能化服务的效率和质量提升,而这,正好也符合广大政企客户对大模型的价值期待。

一窝蜂式的搞概念,带来的只有看客,而不是真正的接纳。

新的路线选择,“附带”解决了大模型落地三大场景痛点

当大模型开始从场景出发而不是从技术出发,大模型过去在落地层面所面临的三大痛点问题也在得到解决。

1、解决数据安全的核心关切

任何的大模型要走向应用,在庞大的公域数据预训练后,都必须要有一个根据政企业务需求进行再训练的过程。这其中就存在数据泄露等安全隐患,成为很多政企客户在选择大模型时的首要关注因素。

而如果长期耕耘场景,知道政企客户的痛点所在,大模型能力就能以恰当的方式“植入”。

爱数联合行业生态伙伴共创的大模型一体就是如此。

此次大会上,爱数推出了AnyShare领域大模型一体机AS19000,该设备独立部署于政企客户的私有云环境下,领域大模型训练和推理实现了分离(即一体机本身自带有已经训练好的大模型,接入即可投入使用)。

这种物理上的隔离,一方面解决了数据安全的问题,另一方面,基于强大的预训练过程+硬件高配置又具备强大的大模型能力,能为政企客户带来一体化的智能内容管理体验。

此外,一体机模式还解决了大模型推理所耗费算力成本高昂的问题,实现更经济性的部署。

2、解决大模型与业务割裂问题

几乎所有数字化、智能化转型,都会面临外部服务商不了解内部业务实际、技术与场景割裂的痛点问题。

大模型进入行业和场景,在根本上也是一种转型升级,也在面临相同的问题,那些手举所谓优质大模型的厂商虽然确实在技术创新上有所建树,但真正要深入场景却未必懂企业具体的业务和需求。

这时候,原本就深耕场景的厂商其优势就凸显出来。

前文提到爱数通过大模型解决业务、数据治理、知识运营过程中耗费人工的问题,其主要方式,就是推出一套数据驱动业务的领域认知中台,以领域认知智能赋能数据资产化,实现业务智能化。

领域认知中台的核心逻辑在于理解业务目标、流程、标准、规则和指标,建立一套统一的业务模型。具体而言,即在数据资源化的基础上,基于领域知识网络和领域大模型实现数据知识化,通过爱数领域认知助手落地具体应用场景,以AnyFabric智能运营中心和AnyShare知识中心为载体,实现业务智能化。

这个中台不仅仅能够覆盖所有的业务,还能够确保数据安全、访问控制安全、安全运维及安全灾备,进一步回应政企客户的安全关切。

如此,大模型能力、爱数的数据服务、政企业务场景实际实现了三位一体的融合。

典型如,爱数发布的“领域认知助手”,提供创新的智能搜索、智能问答、辅助创作、辅助阅读等认知能力,将大模型能力具象化,直接贴合员工的日常工作,让内容生产实现真正的“智能化”。

3、解决大模型“黑箱”难题

在内容输出上瞎编乱凑已经成为全球大模型的技术顽疾,无论GPT-4还是国内一众大模型产品,把信息张冠李戴的现象都十分严重,例如李白的诗句被说成是杜甫作的。

目前为止,包括OpenAI在内的厂商都在“寻找最合适的解决办法”,但在一些测试中,这种现象也只是得到部分缓解。

在根本上,这是因为通用大模型无法针对性识别某个具体领域的信息之间的逻辑联系进行针对性处理,要解决这个问题,可能需要很多针对性的知识进行“校正”,其技术实现难度较大,或者说训练参数量需要更加庞大。

现在,当场景业务经验积累在前,大模型的“黑箱”造成信息输出偏差的问题得到了自然而然的解决。

爱数在过去就为不同行业、场景建立了一套系统的领域知识网络,作为其领域认知智能的重要智力来源。现在,这套领域知识网络与大模型结合,用正确的场景知识逻辑作为“同步评审”,让大模型可实现可控可干预可解释,直接推动大模型输出结果的精确化。

实际上,爱数领域知识网络与大模型的结合,也是大模型深入场景的一种必要。

例如,在化工等“容错率”极低的行业,大模型的结果输出必须做到精准无误,无法容忍重要的信息张冠李戴。而爱数的领域知识网络中,任何一个材料的工艺都来自于大量实践,属于最省成本、最安全可控的流程方法,精确到了数量、比例、时间等每一个可度量的单位条件,形成了结构化、规范化的数据,最终通过大模型实现用户查询、引用,指导技术人员操作,降低成本、防范风险。

明星产品风光过后,大模型落地呼唤产业生态

除了爱数,最近很多有关大模型的行业动作,都逐步脱离“快速打出明星产品”的做法。

例如,AI计算领域的昇腾全栈体系中,开源的昇思AI开发框架推出专门推动大模型开发的新版本,并邀请来自客户企业、伙伴、高校的开发者一起做大模型,推动大模型生态的繁荣。

也即,昇思不再寻求自己做一个大模型产品,而是让那些更接近场景的主体去做大模型——不只有爱数,整个行业都开始通过融合场景的方式推动大模型产业落地。

在这个过程中,大厂、创业者、数字化服务商、高校、科研院所、基础软件、基础硬件、整机厂甚至政企客户本身……大模型的生态会在场景需求导向下,变得越来越丰富,生态主体之间也在不断相互协同。

例如,爱数就宣布要开放合作通用大模型,以及与客户共创垂直领域的大模型,以合作姿态推动大模型能力进化。

当这种普遍的氛围形成,大模型风口下“赢家通吃”的野心将消散。

以场景落地为目标,将有不同的大模型在各自领域创造属于自己的价值,除了爱数这样的已经有深厚场景业务积累的玩家,那些新晋创业者的大模型可以只服务一家公司,例如美团收购光年之外,后者的产品将直接面向美团,获得“最好的归宿”;大厂的大模型也可以只作为业务的强化,例如字节的大模型专注于服务好自身的内容、电商业务,等等。

只有从场景出发的百花齐放,才有大模型繁荣的未来,一个深刻改变世界的未来。

*本文图片均来源于网络

 

[!--page.stats—]
希望看到您的想法,请您发表评论x