AI Agent是2025年最大风口还是泡沫?

IT时报·2025年07月25日 17:55
AI市场格局或将风云突变

ChatGPT不仅能“说”,更开始“做”了。

7月18日凌晨,Sam Altman携四位OpenAI研究员在直播中正式发布ChatGPT Agent——一款通用型AI Agent。这让许久未有“大动作”的OpenAI,再次引发关注。

从功能来看,ChatGPT Agent与市面上已有的Agent产品相差不大,能做表格、查资料、执行任务,但仍有许多人将其视为OpenAI的又一次“王炸”,因为它验证了一个正在成为主流的新方向——模型即Agent。

今年以来,越来越多的大模型公司押注“模型即Agent”概念,xAI、月之暗面(Kimi)、零一万物、阿里云先后推出的新产品,都或多或少与它有关。

什么是“模型即Agent”?为何大模型公司都趋之若鹜?

1

“模型即Agent”

通往AGI的必经之路?

2025年之前,大模型和Agent似乎走的是两条路。

惯常的解释是,大语言模型像一个知识渊博的助手,能够回答问题和生成文本,但缺乏主动性和执行力;“Agent智能体”则更像一个目标明确、具备独立思考能力的虚拟员工,不仅能够理解需求,还能主动行动、执行任务,甚至与外部环境互动。

以去年广受关注的全球首款通用AI助手Manus为例,它通过调用多个底层模型,实现了从规划到执行、再到输出的闭环能力,就像将多个工具整合在一个智能体内,虽然是个“缝合怪”,但“缝合”水平还不错。

不过,彼时便有业内人士指出,通用智能体的壁垒并不高。面壁智能联合创始人、CEO李大海曾提到:“每当大模型版本迎来质的飞跃时,往往会吞没上一代模型所支撑的全部应用生态。

2025年,“模型即Agent”的路径越来越明显。

所谓“模型即Agent”,是指大模型本身成为Agent的核心大脑和驱动引擎,与过去依赖复杂工作流编排或外部模型整合不同,AI将从单纯的“能说会道”进化为“能做会干”,这种转变使得AI成为能够实际帮助用户完成任务的智能助手。

以ChatGPT Agent为例,不同于Manus,它在单一模型内部完成了所有技能调用与任务执行的全过程。在这一过程中,用户可以实时看到AI在虚拟电脑上的操作路径,体验它从理解需求、选择工具、执行操作到交付结果的全过程。这种“可观察、可互动”的Agent形态,正是OpenAI在技术底座上的独特创新。

此前,全球公认编程能力最强的大模型是Anthropic的Claude 4系列,它在编程、推理和Agent方面“树立了全新标准”,能够处理复杂且长时间运行的任务,甚至很多智能体的背后就是“套壳”Claude 4。

这也让Claude 4成为“众矢之的”。7月9日,马斯克旗下的人工智能初创公司xAI发布新一代大模型Grok 4,包括单智能体、多智能体两个版本,具备工具使用、实时搜索等功能,对标的正是Claude 4 Opus。

国内不少大模型公司业已转向。

去年年底,面壁智能联合清华大学发布了新一代主动Agent交互范式,Agent不再是简单的指令执行者,而是升级为具有“眼力见”的智能助手。李大海认为,模型本身而非工作流,才是未来AI智能体的发展方向,“模型即Agent,模型即产品,模型即交互”。

今年7月11日,月之暗面时隔半年推出新一代基座模型Kimi K2,据官方介绍,Kimi K2是一款具备更强代码能力、更擅长通用Agent任务的MoE架构基础模型,模型自身就集成了自主决策和执行任务的能力,能够作为智能体解决复杂任务。

7月23日清晨,阿里开源全新的通义千问AI编程大模型Qwen3-Coder,同样强调Agent能力,尤为擅长解决多步骤的长任务,不仅能通观全局自主安排工作内容,支持Agent调用各种工具深入钻研,最终解决复杂编程任务。

2

“幻觉或许不是坏事”

这些大模型公司,为什么都押注“模型即Agent”?

“‘模型即Agent’这个概念体现了我们对AI认知的根本转变,不仅仅是技术架构的变化,更是人机协作关系的变化。”特赞科技 Tezign 创始人及 CEO范凌告诉《IT时报》记者,在他看来,“模型即Agent”的核心价值在于大语言模型可以模拟真实用户行为,AI不仅能回答问题,更能主动构建用户画像、驱动决策流程。

比如,如果将《哈利·波特》所有故事输入到大语言模型里,那大语言模型可以变成“哈利·波特”,甚至模拟哈利·波特来想问题。

这种逻辑的更迭会给行业带来一个显著的变化,就是Agent要从“工具思维”向“协作伙伴思维”转变,甚至会对以往的一些AI认知形成冲击。“以前人们担心幻觉,但实际上幻觉反而可能是好事,当我们需要AI能够主动思考时,那么在推理层面,要从现在的‘收敛优先’转向‘发散优先’,尽可能让AI的思维更开放。”范凌认为,这条路是能走通的,但当下的关键在于找准应用场景。

中金研报指出,基础大模型仍是决定Agent能力上限的关键,大模型的编程及智能体能力是各家厂商竞争关注的焦点。

不过,相较难度更大的“模型即Agent”,C端Agent具有更大的市场想象空间,类似Manus的多智能体协作模式——通过不同角色的智能体分工,实现多样化任务处理,在当前更为普遍。

ChatGPT Agent发布后,Manus第一时间放出10个实测案例,试图通过财务建模、生活规划、行程安排、消费购物、航班筛选等不同场景任务,证明ChatGPT Agent在任务闭环和可视化交付上并不占优。

不过,无论是ChatGPT Agent,还是Manus,当前业内普遍共识是,通用智能体的应用仍处于早期阶段,处于业务场景探索和技术验证的过程中。

Gartner也认为,这一市场仍存在“泡沫”问题,预计到2027年底,超过40%的智能体项目将被取消。

范凌对此表示认同。他认为,正如任何新技术的发展过程一样,Agent领域也会经历“过度期待”和“理性回归”的周期,“生存的关键在于Agent是否能解决商业核心问题,同时要在技术和成本之间找到平衡。在Atypica.AI实践中,我们发现,AI能够直接交付结果时,用户的付费意愿显著提升”。

3

市场格局已变

AI技术还在加速奔跑,但现实情况是,2025年以来,大模型公司所处的市场格局已经发生巨大的变化。

年初,DeepSeek凭借低成本、高性能的开源模型强势入场。去年备受关注的“六小虎”——智谱AI、MiniMax、月之暗面、阶跃星辰、百川智能和零一万物,融资、流量以及市场份额方面都出现了不同程度的变化。除智谱AI和阶跃星辰外,其余几家公司自2024年下半年以来便未再获得融资。

与此同时,用户流失、高管出走、裁撤业务线等消息也伴随而来,特别是零一万物和百川智能,早早放弃了基座大模型训练,并进行了战略收缩,百川智能聚焦于AI医疗,而零一万物则重点押注AI行业落地。

能够直接“动手”的智能体,成为全球科技圈最快形成共识的第二个风口,市场咨询机构Gartner将AI Agent列为2025年十大战略技术趋势之首。

对于如何实现AI Agent,有人向左,有人向右。

图源:unsplash

早在今年年初,《IT时报》记者就Agent的未来采访了多位行业专家,泛微副总裁杨国生彼时接受《IT时报》记者采访时表示,通用大模型应用于垂直领域时,其稳定性难以令人满意,这意味着,在B端市场,精准度尤为关键,“需要大量的工程技术介入,才能确保其真正实现企业级应用的效果”。

如今半年过去,Agent仍然是风口,但似乎又不是那个Agent。

“今年以来,Agent领域出现了根本变化。”范凌指出,在特赞的Atypica.AI实践中,他发现很多人仍将Agent视为传统工具的升级版,但实际上,Agent的内涵早已发生了变革,尤其随着大模型的推理能力得到显著提升后,可以结合多种工具调用直接给出执行结果,Multi-Agent(多智能体)将是一个更大的机会。

不过范凌也认为,通用Agent并不能“包打天下”,当技术遇到未被满足的需求,就有了生长的土壤,垂直Agent的价值在于它能解决特定的行业痛点。

4

便捷与风险并存

与此同时,一些风险也不容小觑。

从技术角度看,AI模型可能面临偏差风险。例如,算法歧视可能导致不公平结果,训练数据不足或应用不当也可能导致模型失效。此外,网络安全问题也不容忽视,DeepSeek便曾遭遇过DDoS攻击。

《IT时报》记者也注意到,OpenAI在发布ChatGPT Agent后,随即发布了长篇警告,提示用户使用AI Agent可能带来的风险。虽然ChatGPT Agent在处理复杂任务方面表现强大,但OpenAI强调,产品的潜在风险仍然存在。例如,不法分子可能尝试“诱骗”AI代理提供不该提供的私人信息,或采取不当行动。

图源:unsplash

为此,OpenAI加强了对高风险任务的控制,推出了多项安全措施:关键操作必须经过用户明确授权;高风险任务(如发送邮件)需要启用“监督模式”,要求用户全程监控;对于银行转账等高风险指令,AI会主动拒绝执行;用户可以随时清除浏览数据并注销会话,或在不联网的情况下禁用连接器。

达观数据CEO陈运文也坦言,AI Agent的全民普及仍面临瓶颈。大众对其功能和价值的理解不深,接受度较低,且专业人才匮乏,尤其缺少既懂技术、产品,又熟悉商业和生态的复合型人才。同时,在伦理、法律与安全方面,AI决策往往缺乏可解释性,责任归属不清晰,且存在隐私泄露和被攻击的风险。

无论如何,ChatGPT Agent仍需在解决实际问题上更进一步,AGI(通用人工智能)依然是众所瞩目的“星辰大海”,而屡次跳票的GPT-5,是“全村的希望”。

本文来自微信公众号“IT时报”(ID:vittimes),作者:贾天荣,编辑:钱立富、孙妍,36氪经授权发布。

+1
13

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000
36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业