专栏观察

从“会聊天”到“干实事”,亚马逊云科技让Agent“长出了手脚”

美国西部时间12月2日的2025 亚马逊云科技re:Invent上,亚马逊云科技首席执行官Matt Garman在开场演讲中抛出了一个观点:AI Agent时代已来,未来将出现数十亿AI Agent,为企业提效10倍以上!

现场兴奋和焦灼情绪交织,数万名开发者和企业高管都在等一个答案。

因为在很多人的印象里,AI Agent的现实体感并不乐观:开发门槛高、编排逻辑复杂、安全治理缺位、上下文记忆像金鱼……导致了一个尴尬的行业现状——90%的Agent项目停留在概念验证阶段。

想要从概念验证走向生产可用,中间隔着的不仅仅是代码行数,而是一道道深不见底的“工程鸿沟”。

悬念并未持续太久。

亚马逊云科技 Agentic AI副总裁Swami Sivasubramanian,在12月3日的主论坛上,用严谨且务实的演讲给出了答案——怎么把AI Agent从概念验证推向生产环境。

01 对症下药,解决POC到生产环境的五大顽疾

为什么不少企业的Agent“看起来很美,用起来很废”?

剥开光鲜的Demo外衣,在生产环境中面临着五个棘手的痛点:

1、部署难、扩展难,一上生产就不稳定;

2、记忆缺失,Agent 无法跨任务学习,无法持续执行大型流程;

3、身份、权限、凭证管理太难,易出安全事故;

4、工具、数据、系统碎片化,集成成本极高;

5、无法观测、无法调试,Agent成为黑箱。

Swami在演讲中一针见血地指出:“大多数实验和PoC并未按生产就绪的标准来设计。我们需要弥合这一差距,打破PoC的桎梏。”相对应的,亚马逊云科技对Agent在生产环境中遇到的顽疾,通过Amazon Bedrock AgentCore进行了对症下药。

AgentCore Runtime提供了一个无服务器、强隔离、长时运行的环境,彻底让开发者告别用拼凑的Lambda函数和脚本手搓的运行环境,实现了Serverless托管执行、强会话隔离、长时会话等能力,解决了“状态管理”的老大难问题,让Agent能够像人类员工一样长期在线,随时待命。

AgentCore Memory构建了短期+长期+情景记忆的三层体系,让Agent具备了“记住→学习→改进→再执行”的闭环能力。特别是“情景记忆”,可以让Agent记住“发生过什么事”以及“为什么那次流程很混乱”,并自动学习策略、优化下一次行动路径,实现企业Agent所需的“连续性”与“可学习性”。

AgentCore Identity赋予了Agent“可控、可审计、可授权”的企业级身份体系,实现从“人类身份体系”向“Agent 身份体系”的扩展。毕竟在真实的生产环境中,最可怕的不是Agent不工作,而是拿着CEO的权限去读HR的数据库,需要精准控制Agent的权限,把潜在的安全隐患锁死在笼子里。

AgentCore Gateway扮演了“协调枢纽”的角色,自动扫描分散在数据库、SaaS应用、旧系统里的数据,自动生成Agent的“工具地图”,让Agent能安全、智能、自动地“发现→连接→使用”所有工具与数据。

AgentCore Observability解决的是“黑盒”问题,让企业能实时看到Agent的推理、工具调用、状态流、错误、上下文与决策路径等工作流程,提前验证Agent会不会搞砸,避免出了问题却找不到原因。

亚马逊云科技开出的“药方”是否奏效呢?

可以佐证的是汽车服务与技术提供商Cox Automotive的例子,使用AgentCore搭建了一个名为Fleet Mate的Agent,原本需要2天时间的车辆评估被压缩到了30分钟。

02 瞄准靶心,让模型定制成为产品化工程

解决Agent的工程落地只是第一步,大模型同样是制约生产力的瓶颈,很多企业面临的障碍不亚于生产环境。

譬如通用大模型不懂企业业务,而且模型参数规模大、推理成本高、延迟难以满足业务要求;业务规则经常变、新场景不断出现,导致模型上线后效果会衰退;模型定制需要MLOps、SRE、算法、数据团队协作,需要专业的团队才能做……能力强、速度快、成本低几乎成了不可能三角。

监督微调、模型蒸馏、强化学习是业内公认的“三大法宝”,亚马逊云科技的解题思路也不例外。

不同的是,亚马逊云科技打出了一套组合拳,从“微调”到“预训练”,把模型定制从玄学变成了工程学。

一是Amazon Bedrock强化微调。

传统的微调(SFT)只是教模型“怎么说话”,而强化学习(RL)是教模型“怎么做对”。但强化学习需要构建复杂的奖励模型,难度太大了。

亚马逊云科技的强化微调(RFT)功能,直接把强化学习的门槛踏平了,只需要提供数据,就能自动处理奖励建模和策略优化,能够将模型的准确性提升66%,让一个小模型通过针对性的强化训练,在特定任务上吊打通用大模型。

二是Amazon SageMaker AI无服务器定制。

以前训练一个模型,需要配环境、调参、洗数据,准备工作就需要几个月,Amazon SageMaker AI提出了新的思路——用AI来制造AI。

企业用自然语言描述需求,SageMaker内置的Agent会自动分析场景、推荐微调技术、甚至直接帮企业生成合成数据,然后自动跑完训练流程。把“需要大团队、长周期、重投入”的模型定制,变成了“几天完成的自动化任务”。

三是Amazon Nova Forge。

像医药、金融等行业,不仅需要微调大模型,还要模型在底层就理解行业逻辑,但在传统的流程里,企业数据无法进入预训练阶段。

Amazon Nova Forge全球首创了“开放训练模型”体系,允许企业在模型的“中途训练阶段”介入,注入自己的专有数据,不再是打补丁式的微调,而是让企业以极低的成本,拥有了一个“流淌着自己血液”的预训练模型。

四是Amazon SageMaker HyperPod无检查点训练。

在大模型训练的过程中,断点续训一直是噩梦,一次GPU故障可能导致数小时的进度回滚,造成真金白银的损失。

Swami在演讲中提到了HyperPod无检查点训练的“黑科技”,通过实时保存模型状态,在硬件故障时,能在几分钟内自动恢复,不需要回滚到几个小时前的Checkpoints,大大降低了大规模训练的沉没成本。

做一个总结的话,亚马逊云科技开启了一场从“把模型训练好”,到“把模型训练得起、用得好”的全链路效率革命,让模型定制从技能工程,进化为可复制的产品化工程。

03 落地为王,打通可信、可靠、可协作闭环

企业把Agent推向生产环境后,CEO们最担心的问题,可能不是“它能不能做”,而是“我敢不敢让它做”。

摆在案头的是更深层次的挑战:Agent是否可信,在和客户沟通时会不会乱讲?Agent是否可靠,业务成功率能否达到企业要求?Agent能否与人类协同,融入已有客服/运营/业务流程?

喊出“为企业提效10倍以上”的亚马逊云科技,不只要帮企业打造生产环境、训练更聪明的大脑,还要打消“敢不敢用”的疑虑。亚马逊云科技没有回避,在主题演讲中留出了相当长的篇幅。

首先是可信。

亚马逊云科技杰出科学家Byron Cook讲了一个深刻的逻辑:大模型是基于统计学的,是概率性的,天生存在幻觉;而企业的规则(尤其是GDPR等合规要求的出海企业)是逻辑性的、是确定的。

怎么解决这个矛盾呢?答案是神经符号AI。

简单来说就是把“左脑的逻辑”和“右脑的直觉”结合起来。亚马逊云科技引入了“自动推理”技术,带来了三大能力:

验证输出:自动推理工具验证 LLM 的答案是否满足逻辑和规则。

训练结合:使用定理证明器训练,使模型天然具备逻辑正确性。

约束解码:推理层嵌入验证器,使模型不能越界生成内容。

目前神经符号AI已经应用到Amazon Kiro、AgentCore Policy等产品中,让 Agent既聪明又听话。

然后是可靠。

Agent落地的最大障碍之一在于,“大脑”和“手脚”是分离训练的,导致模型懂流程,但操作起来“笨手笨脚”。

亚马逊云科技正式发布了Amazon Nova Act,一个专门为“行动”而生的模型,在训练中进行了数百个环境+数千工作流程+数十万交互的强化学习,进行了成千上万次的试错。结果超出了不少人的预期:在企业自动化工作流中,Amazon Nova Act实现了90%的成功率。

也就是说,企业可以放心地把点按钮、填表单、跑流程这些活儿交给Agent,不必担心它卡在某个弹窗时不知所措。

最终是可协作。

Agent的终局是什么?是替代人类吗?亚马逊云科技的回答是“Teammate”(队友)。

折射到技术层面上,Amazon Connect新增了8项AI能力,包括让AI像真人一样说话的神经声音集成(Sonic)、基于对话自动建议下一步的实时推荐Agent、结合点击流数据个性化建议的AI驱动预测洞察等。

正如2025 亚马逊云科技re:Invent上所演示的:在一个信用卡盗刷的场景中,Agent不仅自动验证了身份,还通过分析地理位置和交易模式,预判了欺诈风险,并在后台默默地为人类客服准备好了所有资料。人类客服接起电话的那一刻,问题已经解决了一半。

Agent不再只是工具,而是和人类一起协作的队友。

04 写在最后

2025年的亚马逊云科技re:Invent,更像是一个时代的分水岭。

过去两年里,行业对Agent的热情大多停在愿景层;现在,亚马逊云科技给出了一套从基础设施到模型、从安全到协作、从执行到治理的落地体系。

第一层:AgentCore(让Agent能跑起来),解决了部署、管理、记忆、安全、工具接入、可观测性等基础工程问题。

第二层:模型定制(让Agent跑得好),通过RFT、无服务器定制、HyperPod等把模型从“通用”变成“企业专属”。

第三层:可信+可靠+协作(让企业敢用),让Agent变得可控、可靠、可协作,成为一个可托付的数字员工。

如果说2023年是生成式AI的元年,2024年是Agent的试验期,2025年则正式宣告:AI Agent进入企业级生产阶段的时代,已经到来。

正在生成海报, 请稍候
从“会聊天”到“干实事”,亚马逊云科技让Agent“长出了手脚”
2025-12-04 19:10:07
2023年是生成式AI元年,2024年是Agent试验期,2025年正式宣告AI Agent进入企业级生产阶段的时代,已经到来。
长按识别二维码
Techsir.com
希望看到您的想法,请您发表评论x