AI Agent是2025年最大风口还是泡沫?
ChatGPT不仅能“说”,更开始“做”了。
7月18日凌晨,Sam Altman携四位OpenAI研究员在直播中正式发布ChatGPT Agent——一款通用型AI Agent。这让许久未有“大动作”的OpenAI,再次引发关注。
从功能来看,ChatGPT Agent与市面上已有的Agent产品相差不大,能做表格、查资料、执行任务,但仍有许多人将其视为OpenAI的又一次“王炸”,因为它验证了一个正在成为主流的新方向——模型即Agent。
今年以来,越来越多的大模型公司押注“模型即Agent”概念,xAI、月之暗面(Kimi)、零一万物、阿里云先后推出的新产品,都或多或少与它有关。
什么是“模型即Agent”?为何大模型公司都趋之若鹜?
1
“模型即Agent”
通往AGI的必经之路?
2025年之前,大模型和Agent似乎走的是两条路。
惯常的解释是,大语言模型像一个知识渊博的助手,能够回答问题和生成文本,但缺乏主动性和执行力;“Agent智能体”则更像一个目标明确、具备独立思考能力的虚拟员工,不仅能够理解需求,还能主动行动、执行任务,甚至与外部环境互动。
以去年广受关注的全球首款通用AI助手Manus为例,它通过调用多个底层模型,实现了从规划到执行、再到输出的闭环能力,就像将多个工具整合在一个智能体内,虽然是个“缝合怪”,但“缝合”水平还不错。
不过,彼时便有业内人士指出,通用智能体的壁垒并不高。面壁智能联合创始人、CEO李大海曾提到:“每当大模型版本迎来质的飞跃时,往往会吞没上一代模型所支撑的全部应用生态。”
2025年,“模型即Agent”的路径越来越明显。
所谓“模型即Agent”,是指大模型本身成为Agent的核心大脑和驱动引擎,与过去依赖复杂工作流编排或外部模型整合不同,AI将从单纯的“能说会道”进化为“能做会干”,这种转变使得AI成为能够实际帮助用户完成任务的智能助手。
以ChatGPT Agent为例,不同于Manus,它在单一模型内部完成了所有技能调用与任务执行的全过程。在这一过程中,用户可以实时看到AI在虚拟电脑上的操作路径,体验它从理解需求、选择工具、执行操作到交付结果的全过程。这种“可观察、可互动”的Agent形态,正是OpenAI在技术底座上的独特创新。
此前,全球公认编程能力最强的大模型是Anthropic的Claude 4系列,它在编程、推理和Agent方面“树立了全新标准”,能够处理复杂且长时间运行的任务,甚至很多智能体的背后就是“套壳”Claude 4。
这也让Claude 4成为“众矢之的”。7月9日,马斯克旗下的人工智能初创公司xAI发布新一代大模型Grok 4,包括单智能体、多智能体两个版本,具备工具使用、实时搜索等功能,对标的正是Claude 4 Opus。
国内不少大模型公司业已转向。
去年年底,面壁智能联合清华大学发布了新一代主动Agent交互范式,Agent不再是简单的指令执行者,而是升级为具有“眼力见”的智能助手。李大海认为,模型本身而非工作流,才是未来AI智能体的发展方向,“模型即Agent,模型即产品,模型即交互”。
今年7月11日,月之暗面时隔半年推出新一代基座模型Kimi K2,据官方介绍,Kimi K2是一款具备更强代码能力、更擅长通用Agent任务的MoE架构基础模型,模型自身就集成了自主决策和执行任务的能力,能够作为智能体解决复杂任务。
7月23日清晨,阿里开源全新的通义千问AI编程大模型Qwen3-Coder,同样强调Agent能力,尤为擅长解决多步骤的长任务,不仅能通观全局自主安排工作内容,支持Agent调用各种工具深入钻研,最终解决复杂编程任务。
2
“幻觉或许不是坏事”
这些大模型公司,为什么都押注“模型即Agent”?
“‘模型即Agent’这个概念体现了我们对AI认知的根本转变,不仅仅是技术架构的变化,更是人机协作关系的变化。”特赞科技 Tezign 创始人及 CEO范凌告诉《IT时报》记者,在他看来,“模型即Agent”的核心价值在于大语言模型可以模拟真实用户行为,AI不仅能回答问题,更能主动构建用户画像、驱动决策流程。
比如,如果将《哈利·波特》所有故事输入到大语言模型里,那大语言模型可以变成“哈利·波特”,甚至模拟哈利·波特来想问题。
这种逻辑的更迭会给行业带来一个显著的变化,就是Agent要从“工具思维”向“协作伙伴思维”转变,甚至会对以往的一些AI认知形成冲击。“以前人们担心幻觉,但实际上幻觉反而可能是好事,当我们需要AI能够主动思考时,那么在推理层面,要从现在的‘收敛优先’转向‘发散优先’,尽可能让AI的思维更开放。”范凌认为,这条路是能走通的,但当下的关键在于找准应用场景。
中金研报指出,基础大模型仍是决定Agent能力上限的关键,大模型的编程及智能体能力是各家厂商竞争关注的焦点。
不过,相较难度更大的“模型即Agent”,C端Agent具有更大的市场想象空间,类似Manus的多智能体协作模式——通过不同角色的智能体分工,实现多样化任务处理,在当前更为普遍。
ChatGPT Agent发布后,Manus第一时间放出10个实测案例,试图通过财务建模、生活规划、行程安排、消费购物、航班筛选等不同场景任务,证明ChatGPT Agent在任务闭环和可视化交付上并不占优。
不过,无论是ChatGPT Agent,还是Manus,当前业内普遍共识是,通用智能体的应用仍处于早期阶段,处于业务场景探索和技术验证的过程中。
Gartner也认为,这一市场仍存在“泡沫”问题,预计到2027年底,超过40%的智能体项目将被取消。
范凌对此表示认同。他认为,正如任何新技术的发展过程一样,Agent领域也会经历“过度期待”和“理性回归”的周期,“生存的关键在于Agent是否能解决商业核心问题,同时要在技术和成本之间找到平衡。在Atypica.AI实践中,我们发现,AI能够直接交付结果时,用户的付费意愿显著提升”。
3
市场格局已变
AI技术还在加速奔跑,但现实情况是,2025年以来,大模型公司所处的市场格局已经发生巨大的变化。
年初,DeepSeek凭借低成本、高性能的开源模型强势入场。去年备受关注的“六小虎”——智谱AI、MiniMax、月之暗面、阶跃星辰、百川智能和零一万物,融资、流量以及市场份额方面都出现了不同程度的变化。除智谱AI和阶跃星辰外,其余几家公司自2024年下半年以来便未再获得融资。
与此同时,用户流失、高管出走、裁撤业务线等消息也伴随而来,特别是零一万物和百川智能,早早放弃了基座大模型训练,并进行了战略收缩,百川智能聚焦于AI医疗,而零一万物则重点押注AI行业落地。
能够直接“动手”的智能体,成为全球科技圈最快形成共识的第二个风口,市场咨询机构Gartner将AI Agent列为2025年十大战略技术趋势之首。
对于如何实现AI Agent,有人向左,有人向右。
图源:unsplash
早在今年年初,《IT时报》记者就Agent的未来采访了多位行业专家,泛微副总裁杨国生彼时接受《IT时报》记者采访时表示,通用大模型应用于垂直领域时,其稳定性难以令人满意,这意味着,在B端市场,精准度尤为关键,“需要大量的工程技术介入,才能确保其真正实现企业级应用的效果”。
如今半年过去,Agent仍然是风口,但似乎又不是那个Agent。
“今年以来,Agent领域出现了根本变化。”范凌指出,在特赞的Atypica.AI实践中,他发现很多人仍将Agent视为传统工具的升级版,但实际上,Agent的内涵早已发生了变革,尤其随着大模型的推理能力得到显著提升后,可以结合多种工具调用直接给出执行结果,Multi-Agent(多智能体)将是一个更大的机会。
不过范凌也认为,通用Agent并不能“包打天下”,当技术遇到未被满足的需求,就有了生长的土壤,垂直Agent的价值在于它能解决特定的行业痛点。
4
便捷与风险并存
与此同时,一些风险也不容小觑。
从技术角度看,AI模型可能面临偏差风险。例如,算法歧视可能导致不公平结果,训练数据不足或应用不当也可能导致模型失效。此外,网络安全问题也不容忽视,DeepSeek便曾遭遇过DDoS攻击。
《IT时报》记者也注意到,OpenAI在发布ChatGPT Agent后,随即发布了长篇警告,提示用户使用AI Agent可能带来的风险。虽然ChatGPT Agent在处理复杂任务方面表现强大,但OpenAI强调,产品的潜在风险仍然存在。例如,不法分子可能尝试“诱骗”AI代理提供不该提供的私人信息,或采取不当行动。
图源:unsplash
为此,OpenAI加强了对高风险任务的控制,推出了多项安全措施:关键操作必须经过用户明确授权;高风险任务(如发送邮件)需要启用“监督模式”,要求用户全程监控;对于银行转账等高风险指令,AI会主动拒绝执行;用户可以随时清除浏览数据并注销会话,或在不联网的情况下禁用连接器。
达观数据CEO陈运文也坦言,AI Agent的全民普及仍面临瓶颈。大众对其功能和价值的理解不深,接受度较低,且专业人才匮乏,尤其缺少既懂技术、产品,又熟悉商业和生态的复合型人才。同时,在伦理、法律与安全方面,AI决策往往缺乏可解释性,责任归属不清晰,且存在隐私泄露和被攻击的风险。
无论如何,ChatGPT Agent仍需在解决实际问题上更进一步,AGI(通用人工智能)依然是众所瞩目的“星辰大海”,而屡次跳票的GPT-5,是“全村的希望”。
本文来自微信公众号“IT时报”(ID:vittimes),作者:贾天荣,编辑:钱立富、孙妍,36氪经授权发布。