谷歌阿里集体转向:为人服务时代过去了
摘要:
一行代码指令取代了传统官网。5月20日,阿里云上线“千问云”,首页只有一句让Agent自己安装技能的指令。同一时间,谷歌开发者大会抛出同样信号:云计算的主要用户,正在从人变成智能体。
如果打开“千问云”网站,首页只有一句:安装 Skills npx skills add QianWen-AI/qianwen-ai。
没有产品列表,没有控制台入口,没有移动互联网过去十几年早已习惯的繁复导航。这是阿里云成立17年来,首次在主站之外推出的全新产品官网“千问云”的首页全貌——一条Agent可读的prompt指令,意思是请智能体自己安装千问云技能。云的用户正在从人类工程师变成智能体,而阿里云决定为此将整个技术体系重塑。
“阿里云正在进行全栈技术革新,从底层芯片、Agentic Cloud、模型到推理平台全面升级,阿里云要建设成中国最大的AI工厂。”5月20日,阿里云智能集团资深副总裁、公共云事业部总裁刘伟光在2026阿里云峰会上宣布。
同一时间,大洋彼岸的谷歌也在其年度开发者大会上给出了相似的主题。“这两天谷歌也在开会,主题跟我们好像是一样的,我们都想到一起去了。”在会后的一场小范围群访中,刘伟光对凤凰网科技在内的媒体答道。
这并非巧合。据谷歌官方披露,两年前谷歌旗下各产品每月处理token总量为9.7万亿,去年I/O时增长到约480万亿,今年直接跳到每月超过3.2千万亿,增长了7倍。全球权威IT研究与顾问机构Gartner则给出了一个更直观的预测:到2026年底,40%的企业应用将集成AI Agent——一年前,这一比例还不足5%。
在“想到一起”和陡峭的增长曲线背后,是一场关于云计算增长引擎的丝滑切换,以及一条被迫加速的、决绝的自研之路。
入口重构:当人类不再是云的主要消费者
“未来的云计算产品,主要使用对象将逐渐从人类工程师变成Agent。”年初,阿里云内部达成的一个关键判断。
阿里云官网自2009年诞生起,界面逻辑就没变过:人类登录,浏览菜单,在庞杂的产品线中找到云主机、数据库、存储,手动配置参数。但这条路径对Agent毫无意义。Agent不看网页,不点按钮,它需要的是结构化的能力描述、明确的调用协议和可预期的反馈机制。
刘伟光透露了一个细节,当春节“龙虾”爆火后,阿里云有一些外部的客户,也上线了类“龙虾”产品。而当龙虾这样的Agent诞生时,“不需要人来开通了,龙虾自动就在后台把云计算资源激活了”。过去,人类工程师要花两周才能完成的资源开通,一天之内就完成了。“Agent在默默自动地使用云。”
基于这一观察,阿里云做出了千问云的决策。
千问云的定位是“一个纯粹for AI的、for Agent的官网”,设计更加简洁,以售卖模型及相关应用为主,全面Skill化,“让Agent直接去调用,就会比使用阿里云的官网体验要好很多”。
以前人进网站先找数据库,未来Agent进来先找模型。千问云的诞生,是阿里云全面 for Agent 的转向决心:当应用都被AI重写,当Everything for AI,入口的优先级必须被颠倒过来。
Token经济:从“锦上添花”到“核心引擎”的15倍跃进
入口的变迁只是表象,驱动这场重构的核心动力,是Token经济的爆炸性增长。
其中,Coding能力的跃迁让云厂商看到了新的服务空间。
“去年我说Token支出在企业的IT预算里不到1%。那时候AI是‘提效’,没有改变业务的本质。”刘伟光复盘道,“但Coding能力出现后,这是一个巨大的分水岭——AI开始创造人类做不了的工作了。”
他举了个例子:大量70年代、80年代编写的COBOL、C、Java老应用,注释早已丢失,程序员早已退休,但AI能够解构这些“代码化石”并将其搬上云。
“AI coding出现不仅是生成新应用,对老代码的老应用的解构更会带来一波新应用出现。”刘伟光判断道。
更大的变化来自推理模型和视频模型的能力跃迁。曾有客户基于开源模型加独有数据调优,做了三个月。结果新一款大尺寸模型出现后,“几乎碾压式地把过去东西全部推掉了。今天大模型的价值比自己用开源模型加数据调优的要大很多。”
而在视频领域,他认为未来中国广告业都会有很大的改变,“每个人都可以做广告、做制片”。
AI能力带来的价值跃迁直接体现在了付费意愿上。
当前,AI原生创业企业,Token支出可以占到IT成本的100%;互联网类企业达到15%—20%;传统企业还在5%以下。
与此同时,刘伟光特别澄清了一个市场认知的误区,目前市场上存“强行把视频token跟推理token放在一块统计,但从技术原理看,这是两种不同的统计方式,今天应该“分模态、分模型去看市场空间”。
因此,阿里云对销售团队提出了更多维的目标,包括:付费Token客户数的增长数和覆盖率;客户是否用Token解决刚需、接入核心系统;通过阿里模型生成的Agent自主完成闭环的效率等等。
而被问及AI商业模式究竟应该按“消耗”收费还是按“成果”收费时,刘伟光对凤凰网科技回答道:“终极目标一定是结果付费。目前还是按照量收费比较多,但已经看到客户愿意为结果付费的苗头。”
芯模暗战:为何必须走“谷歌TPU之路”
然而,支撑Token经济大厦的底座——芯片,面临着前所未有的不确定性。
在本次阿里云峰会上,首次高调公布了真武系列芯片路线图。最新亮相的M890芯片,144GB显存,片间互联带宽800GB/s,性能是上一代810E的3倍。
平头哥半导体副总裁高慧在峰会上表示,Agent在执行任务时可能在毫秒间连续发起数十次模型调用,需要CPU、GPU、网络和存储的紧密协同,全栈自研芯片矩阵就是为了实现算力、网力、存力的系统级协同。平头哥同时公布了未来两年的迭代路径:V900与J900将陆续推出。
当被问到为何选择这个时间点亮出底牌时,刘伟光回答道:“跟初创芯片公司最大的不同是,我们是在市场验证了很久之后才推向市场。”他表示,在正式发布之前,真武芯片已经在阿里巴巴内部、蚂蚁、智能驾驶、金融行业、政务行业、运营商等领域得到市场的广泛认可。
这几乎是复刻了谷歌TPU与Gemini结合的经典路径。刘伟光毫不避讳对“谷歌路线”的认同:“自己的芯片和自己的模型一定能达到最好性价比。谷歌TPU和Gemini的结合就跑出了最高的性能。”
他进而给出了自己的判断:“如果未来把每一块芯片都能跑出比竞争对手更多token、更高质量token,那我们就胜利了。”
值得注意的是,就在一个月前,谷歌同样连发自研芯片——发布了针对预训练优化的TPU 8t与针对推理优化的TPU 8i,“对抗”英伟达。随后, CFO在最新财报电话会上,披露了谷歌年度资本支出预计将上调至约1800亿至1900亿美元。
同一时间的谷歌I/O 2025开发者大会上,谷歌同样亮出了一套完整的全栈协同牌:从Ironwood到Gemini 2.5,从Vertex AI到浏览器内置Agent,谷歌同样在走芯片-模型-推理-Agent入口全栈协同的闭环。
Sundar Pichai在主旨演讲中直言:“我们正处于AI平台转变的新阶段”,谷歌要做的就是“降低门槛、加速创造”,宣布要让智能体全面进驻谷歌的主打业务搜索以及AI助手Gemini,并通过Gemini与搜索结合,推出全新的AI模式搜索。
中美两家头部云厂商在同一节点押注自研芯片与全栈协同,揭示了行业竞争的逻辑转向:Token经济的底层竞争,已经从“谁有更多GPU”转向“谁能用更低的芯片成本产出更高质量的Token” 。
这种“芯模咬合”的效能已在实战中显现。峰会披露,Qwen3.7-Max仅凭一份任务说明,在从未接触过的M890芯片上自主工作了35小时,独立完成了一个生产级AI计算内核的编写与调优,最终性能较官方版本提升10倍。
在被问及去年底提出“拿下80%的AI云增量市场”目标进展时,刘伟光给出了一个更具体的数据:“目前,推理市场我们已经拿到了20%以上。所有的大客户账我们没有输过。”但他也承认,“新兴市场增速太快了,一个季度的收入甚至比过去几年都大,看过去意义不大,关键是打赢未来。”
据阿里云统计数据,过去五个月,阿里云百炼平台LLM的Token ARR增长了15倍。
阿里云的底气部分来自存量的转化——Coding客户恰恰就是阿里云过去的存量客户,因为有开发者才会用云,今天100%都是token的客户。此外,爆发的Agent也在辅助识别客户方向,比如MiniMax龙虾业务背后就是阿里云,一批龙虾都诞生在阿里云上,使得云资源有了很大的提升。
在供应端,刘伟光用一组换算关系来强调云厂商的优势:“Token和GPU是有换算比例的,卖多少Token等于售卖了多少GPU。”他举例,“如果把Token换算成GPU,假设1000个Token换算成一卡GPU的话,会发现一卡GPU带来的增长基本代表着1:1的CPU增长。”换言之,使用Token就意味着同时消耗GPU和CPU,而且产生放大效应——“产生100块钱的CPU,同时变成200块钱的GPU+CPU,这是云和AI的结合。”
这意味着,AI Agent的爆发将同时拉动GPU、CPU和存储的增长——正如阿里财报中揭示的,阿里云未来的业务增长空间来自三个方向:公共云MaaS、私有部署,以及“因为AI Agent的爆发,也在同比飞速增长”的CPU云。
从千问云那行面向Agent的代码开始,阿里云和谷歌在这个5月不约而同地选择了一场全栈重构。入口改变,是因为用户变了;Token爆炸,是因为价值变了;芯片加速,是因为命脉不能放在别人手里。而当卖出的每一个Token都在同步拉动GPU和CPU的消耗,Token经济与云基础设施之间那条一度模糊的逻辑链,正在被一场全行业的重构工程彻底改写。
本文来自微信公众号“凤凰网科技”,作者:凤凰网科技,36氪经授权发布。















