一朵诞生众多独角兽的云,正在用AI落地Agent

36氪品牌·2025年12月03日 22:12
从AI基础设施、推理平台,再到数据层、开发工具,亚马逊云科技革新了Agent开发的“全家桶”。

一个毋庸置疑的事实是,所有企业都在拥抱AI。 

当动画电影《鬼灭之刃》在全球揽获近8亿美元票房,制作方Aniplex的母公司索尼,正在用大模型,将项目合规审查和评估流程的效率,提高了100倍; 

在创意设计软件市场拥有近30%份额的Adobe,今年以来推出的AI创意设计生成工具Adobe Firefly,已经创造了290亿个创意资产; 

你在开发者社区Reddit上看到内容,如今都经过Reddit研发的社区管理AI的审核和筛选。 

但在人们无法感知的幕后,这些Agent的构建和运行,离不开更为精密、庞大、复杂的服务系统。 

索尼和Reddit的模型,是基于亚马逊云科技的模型定制平台Amazon Nova Forge训练而成;用于训练Adobe Firefly的数据,都存储在亚马逊云科技的存储服务Amazon S3和Amazon FSx。 

这些拥抱AI的故事,每天都发生在亚马逊云科技的云上。 

过去一年里,亚马逊云科技的生成式AI开发平台Amazon Bedrock,服务了全球超过10万客户,其中50多家企业每天的Token处理量,超过了1万亿;发布仅4个月,Agent开发工具Amazon AgentCore SDK的下载量已经超过了2亿次——值得关注的是,Matt Garman在2025 亚马逊云科技re:Invent大会上透露,在亚马逊云科技上,诞生的独角兽初创企业数量,是断层第一。 

客户的选择,也体现在高速增长的营收上。一年来,亚马逊云科技的营收达1320亿美元,同比增加了20%。营收的绝对增长额,220亿美金,超过了《财富》杂志半数以上500强企业的年收入。 

对一家已经诞生近20年的云企业而言,不断革新服务并非易事。 

什么是创新的源头?2025亚马逊云科技re:Invent大会给出的答案是:和前沿科技、客户需求走在一起。 

今年,亚马逊云科技看到的新方向是:Agent。 

在2025亚马逊云科技re:Invent上,亚马逊云科技CEO Matt Garman判断,Agent将成为AI价值释放的拐点。 

在深入客户需求的过程中,他看到了Agent加速了医疗保健领域的研发、改善客户服务、提升账单处理效率,“未来每家公司内部以及各个可能想象到的领域,都将有数十亿个Agent——这一变革对业务的影响,与互联网和云服务一样深远。” 

Agent带来的新机会下,诞生的是海量的新需求。12月1日,2025亚马逊云科技re:Invent开幕的第一天。亚马逊云科技用起重机吊起了一台退役的旧服务器,并将它炸毁。 

这项用于庆祝客户告别传统平台、对系统进行现代化改造的仪式,对如今的亚马逊云科技而言,也有别样的意涵——在2025亚马逊云科技re:Invent上,亚马逊云科技的AI新发布,多达12项。 

卖水人和买水人,正在达成AI时代的共赢。 

亚马逊云科技的66个“Why Not”

2024年,亚马逊云科技团队推出系统现代化转换服务Transform后,解决痛点的成就感并没有持续多久——团队很快坐下来思考:下一个需要解决的问题在哪里? 

需求的持续变化,与AI行业的飞速变革不无关系。一年来,AI模型层快速从预训练过渡向强化学习等后训练范式。在应用层,Agentic AI快速成为共识,也让模型、Infra和应用开发,快速与之同频。 

“现在似乎每天都有新的东西。”Matt表示。但在这条欣欣向荣的赛道上,他亲眼看到了AI落地现状的“B面”:“当我与客户交谈时,许多人还没看到与AI承诺相匹配的回报,AI的真正价值还没有被释放。” 

即便被Matt视作AI价值真正被释放的里程碑,不可否认,Agent的落地,还处在初期。 

麦肯锡在2025年11月发布的报告《2025年人工智能的发展现状:Agent、创新与转型》中提到,目前仍有32%的企业,对AI的应用停留在试点阶段;仅7%的企业真正实现了AI的规模化落地。 

然而,当Agent进入落地狂飙的上半场,一连串新的痛点、新的需求,又会随之而来。 

Agent对生产力的革新,体现在其规划和执行的自主性上。但一旦越过边界,自主就成了失控。 

Matt将Agent的落地,比喻为抚养一个青少年:随着Agent能力的成长,一方面需要给其更多的自由和自主权,让它自主思考和学习,但你同时也需要制定基本的规则,确保Agent访问工具和数据的权限。 

愈是深入产业上下游,愈能看到更多的真问题。 

在2025亚马逊云科技re:Invent的演讲中,Matt至少提了66次“Why Not”。每一个“Why Not”背后,既对应着行业的新需求,又成了亚马逊云科技逼迫自己解决的新课题。 

比如,开发者花了大量时间采购服务器、管理基础设施,开发的时间却被挤占。为什么不能把管理的时间和成本降到0? 

每家企业都有庞大的知识产权和数据语料库,但采用外挂RAG或向量数据库的解决方案,并不能让模型真正理解企业数据。为什么不开发一个定制模型训练工具呢? 

在实际落地场景中,Agent是否做了正确的决定,是否选择了最好的工具、输出是否正确、是否理解品牌,都是难以衡量的问题。为什么不做一个可以实时评估和监管Agent的工具呢? 

这些“Why Not”,都推动亚马逊云科技拓展基础设施的极限,为生成式AI系统和应用,发明新的开发模块。这一切都和Matt的愿景有关:“Everyone has the freedom to keep inventing.” 

从“Why Not”中,诞生一条构建Agent的链条

让Agentic AI落地,不仅仅关乎交付服务的“最后一公里”。 

这是一条从AI基础设施,到模型训练,到数据融合,再到开发工具精密链条,任何一个环节的脱节,都有可能造成AI落地效果的瑕疵,进而催生企业对AI的信任危机。 

当然,这并不意味着人类需要深度介入每一个环节。AI自主学习、灵活泛化的特性,让它们可以成为AI应用的搭建者、调试者、运营者、管理者,将人类从琐碎的流程中解放出来,让他们去探索如何进一步释放AI价值等更有意义的问题。 

在Matt看来,要想构建真正能为企业带来价值的Agent,必须关注四个层面:AI基础设施、推理平台、数据、Agent开发工具。 

先看基础设施。 

GPU和服务器,在链条中离应用落地最遥远,但分量举足轻重。一个具有可扩展性和性能强大的AI基础设施层,不仅能降低模型训练、定制和推理的成本,还能给模型的训练和运行提供安全、稳定的环境。 

随着生成式AI的落地规模、速度和智能的提升,基础设施的“多快好省”,就显得愈发重要。在去年re:Invent上发布的自研AI芯片Amazon Trainium3 UltraServers,曾作为大规模AI训练和推理的业界超佳性价比,惊艳了业界。这也让Amazon Trainium快速成长为一项价值数十亿美元的业务。 

今年,亚马逊云科技新推出的服务器Amazon Trainium3 UltraServers,再次“杀死”了性价比比赛。这款服务器将计算能力提升到了4.4倍,将内存带宽提升到了3.9倍,每兆瓦功率能处理的Token数量增加到了5倍。 

具体到运行效果,当OpenAI的开源推理模型GPT-oss-120B分别在AmazonTrainium2 UltraServers和Amazon Trainium3 UltraServers上运行,在相同的交互延迟下,后者每兆瓦的Token输出量高出了5倍——同样的效果,还出现在其他开源模型上。 

当然,优化永无止境。Matt透露,下一代芯片Amazon Trainium 4已经开始设计。相较于3,Amazon Trainium 4将提供6倍的FP4计算性能、4倍的内存带宽,以及2倍的高内存带宽容量。这一切,都是为了“支持世界上最大的模型”,Matt表示。 

再看推理层。 

在大谈AI落地的当下,模型依然重要——作为AI应用的“大脑”,模型的选型和组合,决定了应用的效果上限和成本下限。MaaS服务商的竞争力,本质上是谁的货架上,有更多元、丰富的高性能模型。 

相较于去年,亚马逊云科技的生成式AI开发平台Amazon Bedrock上,模型数量几乎翻了一番。其中,中国模型玩家的数量,也从原来的Qwen和DeepSeek,增加到了4个——中国大模型两家初创企业,月之暗面和MiniMax的模型,也出现在了Amazon Bedrock上。 

模型层另一个与Agent爆发有紧密关系的趋势,是开源。模型的开源,相当于将训练所需的数据、算力,以及训练得到的智力资源,平等地开放给开发者,让他们以更低的成本,做新AI应用的探索。 

今年,亚马逊云科技推出了全新的自研Amazon Nova 2开源模型系列,并上架了Amazon Bedrock。旗下三款模型Nova 2 Lite、Nova 2 Pro、Nova 2 Sonic,分别适用于经济高效场景、复杂任务处理,以及语音转语音的实时拟人对话场景。 

另一款自研模型Amazon Nova 2 Omni,则是业界首款统一的多模态推理和生成模型,支持文本、图像、视频、语音四个模态的输入,以及文本和图像的生成——这意味着,复杂模态的处理,不用再通过模态转换的低效形式,而是转向了更像人的高效并行理解。 

接着看数据层。 

AI时代,一家企业的壁垒,毫无疑问是长期积累的业务知识数据。但构建壁垒的前提,是“数尽其用”,去构建一个真正理解业务的AI模型。 

据Matt观察,传统的企业定制模型训练方式,无非是将企业数据作为外挂的RAG或者向量数据库,抑或是基于现有的第三方模型做微调或者强化学习。 

但这些方法的短板也很明显:外挂RAG或向量数据库的模型,本身并不理解更深层次的领域知识,以及业务决策所需要的专业知识;微调或强化训练后的模型,由于无法获得预训练数据的访问权限,训练难度并不低。 

基于数据从头预训练的成本,对多数公司而言是高昂的。为此,亚马逊云科技推出了定制模型训练平台Amazon Nova Forge。 

“开放式训练”,这是这一平台开创的全新模型定制范式。通过开放Nova模型预训练、中期训练、后训练检查点的独家访问权限,Amazon Nova Forge支持用户在模型训练的每个阶段,将自己的专有业务数据,与Nova的训练数据集结合。这一模式既降低了预训练的门槛,还提升了定制模型的性能。 

让Agentic AI从模型,变为可以对外提供服务的应用,还少不了作为“脚手架”的开发工具。 

当下,低代码、无代码的Agent开发工具,已经形成了成熟的业态。这也意味着,Agent的开发门槛越来越低。但新的问题也接踵而来: 

当Agent发展到对外服务的阶段,如何实时保证Agent的执行效果和可靠性?当愈来愈多的Agent投入使用,开发者如何高效运营和管理这些Agent? 

亚马逊云科技敏锐捕捉到了Agent玩家们的痛点。今年,他们在Agent开发平台Amazon Bedrock AgentCore上,针对Agent的管理和评估,推出了两个新服务:Gateway(策略控制)和Evaluations(行为评估)。 

通过Gateway功能,用户可以自定义Agent访问数据、调用工具的权限、执行任务的范围、执行任务的环境等条件,来控制和规范Agent的行为。至于Evaluations,就好比是Agent的绩效考核,通过自定义的考核体系,用户可以轻松评估Agent的效果。 

“没有捷径。”Matt如此形容今年的产品发布。针对新痛点和新需求,革新升级一条构建和交付Agent的完整路径,对亚马逊云科技而言,是一件难而正确的事。 

这些创新,最终指向的是Matt的一个展望:未来,每个公司内部、每个可以想象的领域,都会有数十亿的Agent。 

Agent时代,企业需要怎样的新开发范式?

在2025亚马逊云科技re:Invent的现场,一家初创公司的分享,吸引了不少目光。 

这家名为Audio Shake的公司,是2024年亚马逊云科技独角兽创投大赛的冠军。他们研发了一个AI多扬声器分离器,可以将采集到的音频,分离成不同的声流。 

这一项技术,已经被应用到ALS(渐冻症)相关领域的NGO组织中,帮助分离并克隆病人的本音,让病人在出现语言障碍前,还用自己原来的声音说话。 

初创公司,是亚马逊云科技平台上,一群新鲜却重要的用户。“我对创业客户有特殊的感情。”Matt见证了AI创业浪潮的席卷——如今,85%的福布斯“2025 AI 50”企业、85%的CNBC“Disruptor 50”企业,以及全球超半数的初创企业,都运行在亚马逊云科技的云上构建。 

在这股年轻的力量中,“十人规模公司”、“一人公司”是AI时代尤为瞩目的创业组织形式。 

比如,上述提到的Audio Shake,成立时只有三人。海外,一份名为“顶尖精益AI Native公司排行榜”的名单,罗列了33家团队规模在50人以内,但ARR超过500万美元的公司——这些公司的平均规模仅27人,但单个员工的平均产值,超过了1亿美金。 

Agent对生产力的提高,正在深刻改变创业公司的组织形式。一名开发者,在Agent工具的辅助下,可以同时是CEO、CFO、CMO——人的生产力被大幅提高。 

但同时,开发者受到的挑战,也是前所未有的。AI的爆发固然令人兴奋,但开发者生产力的解放空间还有多大?Agent还没介入哪些开发环节?以及,如何让开发者一直保持创新和开发的热情? 

这些问题都对开发范式,提出了全新的要求。 

如今,Agent是最重要的开发工具。在大会上,Matt强调了一个概念:前沿Agent(Frontier Agent)。冠以“前沿”的Agent,需要具备自主性和可扩展性,并且最重要的是,能在无人类干预的情况下,连续长时间工作——这些特征,都指向对开发者生产力的进一步解放。 

在大会上,亚马逊云科技推出了三款全新的前沿Agent:Amazon Kiro Autonomous Agent、Amazon Security Agent、Amazon DevOps Agent。 

它们分别在自主开发、安全评估、解决/预防故障场景中,承担了传统开发团队的工作,让人类开发者将精力,投入到更有价值的创造工作中。 

不只是初创企业,任何领域、规模的公司,都正在从这一场开发革命中受益。 

包括亚马逊云科技自身。Matt分享了一个案例:在一次重要项目的执行中,团队最初评估,这一项目需要约30名开发者,工作18个月才能完成。不过,基于AI Coding工具Amazon Kiro,团队仅用了6人,耗时76天就完成了架构重建。 

但在自身的实践,以及和客户交流的过程中,Matt深刻意识到,要让Agent真正对开发流程产生变革,仅仅使用Agent是不够的,还必须改变公司原有的工作流。 

他学到的三课是:首先,赋予Agent更多自主性,让人从任务中抽身出来,仅仅承担指导的角色;其次,想要提高开发速度,就意味着不能线形处理任务,而是要并行处理;最后,要拓展Agent的自主性,让它能同时处理更多的任务。 

当时间来到AI浪潮席卷的第三年,技术和应用形态瞬息万变。时代变革的机会,从是留给最先用前沿科技武装自己的人。而亚马逊云科技,用一年一度的科技盛会,给开发者们递上最新鲜的弹药。 

“The freedom to invent”,就像Matt最初提到的愿景,在更长远的未来,亚马逊云科技正在持之以恒地,将宏大的科技变革,用更务实的方式送到每一个人手中。 

2025亚马逊云科技re:Invent中国行即将启幕!12月18日开始,北京、上海、深圳、成都四城线下巡演及线上专场将同步开启,无论你是云计算新手还是技术老兵,都将从高阶演讲、实战内容、技术分享和专家互动中受益。立即注册,抢占席位,把握Agentic AI时代的新机遇! 

https://events.amazoncloud.cn/reinvent-online-20251218?trk=811631fa-539a-41c3-8fed-f23e4f9919dc&sc_channel=el 

#亚马逊云科技  #生成式AI  #出海

本文来自微信公众号“36氪”,36氪经授权发布。

+1
7

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

12月2日,联想百应智能体凭借在企业AI服务领域的技术突破、场景落地能力及行业价值,斩获“WISE2025年度焦点产品(企服类)”荣誉。

48分钟前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业