阿里咬住字节,为卖Token拼了

中国企业家杂志·2026年05月27日 17:29
阿里缠斗字节,两种方法论与两种体系的对抗。

年初的字节跳动,一度主导了“Token”的叙事权。如今,轮到阿里巴巴全面反攻了。

《中国企业家》获悉,阿里在4月制定了一项旨在提升Token规模的“530 Token战役”。具体的内容为:以MaaS为核心,到5月底前,Token收入较4月初翻5倍,到年底要翻30倍。这个任务,截至5月15日已经超额完成。

为了达成目标,阿里云也向一线销售施压,并给予了丰厚的激励。

一位阿里云销售告诉《中国企业家》:最近每卖出1万元Token,阿里云会给予1:1的绩效奖励。有人开玩笑,如果从字节挖来一个大客户,奖励金额可以直接提一辆车。

同时,阿里云也在鼓励第三方合作伙伴,用Agent产品一起卖Token,“只要把数拉起来就行”。一款产品中的MaaS含量越高,奖励也越高。比如100元营收里如果包含5元的MaaS消耗,阿里云抽成30%之外,合作伙伴还可以获得1.5倍的系数奖励。

但字节的增长也同样迅猛。截至今年3月底,豆包大模型日均调用量突破120万亿Tokens,3个月翻了一倍。

在收入端,字节的增速更快。知情人士告诉《中国企业家》,由于抖音生态以及Seedance 2.0的带动,火山引擎在第一季度就完成了全年Token收入指标的10倍。

高额的销售补贴,只是阿里巴巴和字节跳动两家公司在AI战场竞争的缩影。更大的竞争发生在从芯片底层、大模型,到产品、生态合作伙伴的各个层面。Token的对攻,已经演变为一场全面的“集团战”。

超额激励卖Token

5月20日的“阿里云峰会”现场,阿里云邀请了智谱、月之暗面、MiniMax、阶跃星辰、爱诗科技、生数科技等头部AI厂商,与之共建“百炼开放模型”服务——除了阶跃星辰,其他厂家均获得过阿里系的投资。

相比之下,字节跳动更倾向于单打独斗,对头部大模型公司鲜有投资,并坚持闭源模型策略——这也让阿里看到了生态层的竞争机会。

据《中国企业家》了解,对于行业大客户,接近阿里云人士态度明确:没有跟字节跳动深度合作的大模型厂商,阿里云就会“砸”资源,包括云服务、投资、生态合作等等。

春节后,企业端对Agent和Coding的付费意愿大增。阿里CEO吴泳铭在财报电话会上表示:“理论上,只要AI帮助员工完成的工作任务在企业内创造的价值大于Token成本,企业对API Token的需求就会是无限的。”

但企业端规模更大的同时,也是更难攻克的市场。

一位阿里云的业务人员颇为感慨:“字节占据了抖音这样的C端入口,整个视频产业的AI化转向都会围着字节转,它们的销售可以‘躺赢’。但阿里只能下苦功夫,从办公和Coding场景进入。”

Token理论值消耗高的具身智能赛道,成为阿里的布局重点。

一位行业人士告诉《中国企业家》:过去一段时间,一位阿里云高层走访了30多家具身智能公司,并且让其中的大部分用上了Qwen。他跟这些厂商推荐Qwen的理由很简单:开源并且能力可以快速迭代,尺寸多样。阿里投资也功不可没——目前,阿里已经投资了自变量、宇树科技、逐际动力等具身智能公司。

视频生成也是AI消耗最集中的赛道之一。一位短剧行业人士告诉《中国企业家》:在Seedance 2.0的代理费涨至1000万元时,阿里的欢乐马(HappyHorse)将API代理费下调至500万元,用“打骨折”来挖字节跳动的墙角。

在激进的“开发客户+高额补贴”动作下,阿里云MaaS目标超额完成。阿里云峰会上,接近阿里云人士告诉媒体:阿里云MaaS业务的Token收入,在2026年的前5个月里,增长了15倍。

另据2026年第一季度阿里财报:包含百炼MaaS平台在内的AI模型与应用服务年化经常性收入(ARR)将突破100亿元,今年底将突破300亿元。

与阿里相似,字节也给MaaS销售开出了超额绩效激励。2023年,字节跳动就布局了MaaS的产品和销售体系,行业传闻,销售卖Token比起卖云产品奖励高出10倍、20倍之多。甚至有人指出,火山引擎对销售的考核很严格,AI的Token调用量如果不够,哪怕你其他云业务做得再好,也没用。

新人接棒,模型迭代找回节奏

4月,阿里Qwen大模型负责人林俊旸离职,掀起轩然大波。资深人士对《中国企业家》表示,虽然林俊旸对离职的处理方法不成熟,但外界仍担心他的离职会影响到阿里高端人才招募。

经过一个多月的沉淀,阿里正在找回节奏。

阿里巴巴通义大模型事业部负责人周靖人 来源:受访者

当天,阿里发布了Qwen3.7 Max,距离上次Qwen3.6 Max-Preview的更新发布仅有一个月时间。

Qwen核心技术负责人刘大一恒介绍,Qwen3.7 Max的训练初始阶段比Qwen3.6-Plus效果差,但训练了1000多个环境后,达到了3.6-Plus的水平;训练了2000多个环境后,达到了Kimi K-2.6的水平;超过4000个环境时,达到了DeepSeek V4的水平。

“把它扩展到8000个环境之后,它超越了国内的模型,只离Anthropic有一点差距,如果继续去Scaling它的RL(强化学习),模型能走得更远。”

阿里云技术团队表示,长程任务是语言大模型迈向真实世界非常重要的能力,这意味着需要模型有极强的上下文管理和记忆能力等。

阿里云让Qwen3.7 Max从0到1写了一个记英文单词的App,它运行了超过1万行代码,最后用11个小时做出了App。这个过程中,模型可以自主创建测试,执行,进行版本迭代,比如增加消消乐记单词、挑战记单词等功能。最后,该App实现了供1000多个用户的流畅使用。

值得注意的是,Qwen3.7 Max也拓展到了物理边界。研究人员可以用其控制机器狗寻找物品。刘大一恒说:“语言模型是扮演大脑智能的关键一环,它可以把视频生成以及物理世界的机器狗串联起来。”

阿里云也提到了模型的自主进化,用Qwen3.7自己训练自己。比如在模型的强化学习里,模型已经会想办法作弊。这时候,研发团队会让模型自主进化一个框架。经过80多个小时的RL实验,该框架归纳出了各种作弊模式,并作出迭代优化。最终,Qwen3.7 Max实现了多轮自进化。

“我们预感,Qwen接下来的模型进步速度会越来越快。”刘大一恒总结。

聚焦编程、办公场景

在AI视频领域,阿里也未停下探索脚步。今年4月,欢乐马(HappyHorse)模型火爆网络,性能直逼Seedance 2.0。

短剧业内人士告诉《中国企业家》,目前行业C端需求旺盛,整个产业链已经跑通,上下游玩家只需快速接入工具,便可开展生产。

但他也表示:目前行业演化还在初期,外界可能高估了AI视频领域的Token天花板。“一部AI漫剧里,Token的成本可能只有5%甚至更低,更大成本在于平台投流与创意团队。不过需求井喷下,大部分AI漫剧公司要扩充更多员工,整体利润微薄,Token涨价也有可能成为压死骆驼的最后一根稻草,许多玩家可能撑不到6月。”

不同于字节跳动更多押注AI视频生成行业与API模式,阿里云在AI产品侧更聚焦B端,尤其在编程、办公等场景形成多产品矩阵,整体推进。

以阿里旗下Coding产品Qoder为例,它在5月20日推出了国内版,除了CLI以及插件的产品形态外,今年1月上线了AI桌面助手QoderWork,目前正在内测数字员工Qoder wake。

另一支专注办公效率提升的团队是MuleRun(骡子快跑),该团队的负责人陈宇森告诉《中国企业家》等媒体,它们并不认为自己是一个“类龙虾”的产品,MuleRun以web端为核心的产品形态,嫁接到用户原来的办公流程。

他认为,AI应用赛道不同于传统软件,更接近制造业逻辑:团队无需自研底层模型,大量技术来自开源生态,像手机厂商一样整合多方资源,快速组装成可用产品。“办公AI比拼的是产品品位、细节打磨与精准定位。”

一位行业人士表示:“与字节依赖API调用不同,阿里更强调‘环境+工具’的整体搭配。企业端AI落地,单靠API远远不够,必须配套完整工具链与运行环境。”

这意味着,企业采购真正完成数字化转型,需要的是涵盖算力、数据安全、系统对接、组织协同的完整解决方案——也就是企业级AI“生态环境”。

阿里云CTO李飞飞总结:2026年阿里云核心改造方向,是让所有云产品支持Agent快速开发、调用与部署,全面推进Skill化与MCP化,构建面向Agent时代的智能控制界面。

全栈竞争:从芯片到Infra层

不过阿里要想打造企业级的AI生态环境,进化为面向Agent的智能云,也必须要从芯片底层的重构开始。

阿里云智能集团资深副总裁、公共云事业部总裁刘伟光说,今天的AI特别像新型制造业,要获得AI收入,必须同时建设两个工厂:AI训练工厂和AI推理工厂。

在模型训练阶段,大模型对云的基础设施要求是高并发、高吞吐、大规模算力、单集群;但到了推理阶段,意味着AI工厂要适配多种多样的芯片,高速的网络传输效率,用最高效率吞吐Token,以支撑Agent网络的高速运转。

5月20日,阿里平头哥发布了两款芯片——训推一体的AI芯片“真武890”和ICN Switck互联芯片,这两款芯片搭载在AL128超节点上,搭载了128张真武890芯片。平头哥官方透露,2027年3月计划发布真武V3系列,2028年计划发布J900系列。

一位芯片从业者对《中国企业家》说:“华为384超节点采用的是光连接,成本高。AL128超节点采用的是高速电互连,优势是稳定。此外,‘真武890’兼容主流芯片,不用做单独适配。”

除了真武系列的AI芯片,平头哥还布局了倚天系列Arm服务器CPU、磐脉系列智能网卡、镇岳系列存储主控芯片、ICNSwitch互联芯片等数据中心核心芯片,实现算力、网力和存储的全栈自研。

一位投资人曾告诉《中国企业家》:大模型竞争到最后,不是大模型参数规模的竞争,也不是算法的竞争,而是Infra层,尤其是芯片、互联和算力的整体Token输出效率。

从上述布局来看,从底层芯片到Agentic Cloud,从全模态模型矩阵到模型服务平台,再到Agent应用,阿里云已成为国内唯一完整打通五层全栈能力的云厂商与AI厂商。

本文来自微信公众号 “中国企业家杂志”(ID:iceo-com-cn),作者:闫俊文,36氪经授权发布。

+1
1

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

讲好企业家故事,弘扬企业家精神

下一篇

酒庄也可以是光谷

1小时前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业