阿里咬住字节，为卖Token拼了

中国企业家杂志·2026年05月27日 17:29

阿里缠斗字节，两种方法论与两种体系的对抗。

年初的字节跳动，一度主导了“Token”的叙事权。如今，轮到阿里巴巴全面反攻了。

《中国企业家》获悉，阿里在4月制定了一项旨在提升Token规模的“530 Token战役”。具体的内容为：以MaaS为核心，到5月底前，Token收入较4月初翻5倍，到年底要翻30倍。这个任务，截至5月15日已经超额完成。

为了达成目标，阿里云也向一线销售施压，并给予了丰厚的激励。

一位阿里云销售告诉《中国企业家》：最近每卖出1万元Token，阿里云会给予1:1的绩效奖励。有人开玩笑，如果从字节挖来一个大客户，奖励金额可以直接提一辆车。

同时，阿里云也在鼓励第三方合作伙伴，用Agent产品一起卖Token，“只要把数拉起来就行”。一款产品中的MaaS含量越高，奖励也越高。比如100元营收里如果包含5元的MaaS消耗，阿里云抽成30%之外，合作伙伴还可以获得1.5倍的系数奖励。

但字节的增长也同样迅猛。截至今年3月底，豆包大模型日均调用量突破120万亿Tokens，3个月翻了一倍。

在收入端，字节的增速更快。知情人士告诉《中国企业家》，由于抖音生态以及Seedance 2.0的带动，火山引擎在第一季度就完成了全年Token收入指标的10倍。

高额的销售补贴，只是阿里巴巴和字节跳动两家公司在AI战场竞争的缩影。更大的竞争发生在从芯片底层、大模型，到产品、生态合作伙伴的各个层面。Token的对攻，已经演变为一场全面的“集团战”。

超额激励卖Token

5月20日的“阿里云峰会”现场，阿里云邀请了智谱、月之暗面、MiniMax、阶跃星辰、爱诗科技、生数科技等头部AI厂商，与之共建“百炼开放模型”服务——除了阶跃星辰，其他厂家均获得过阿里系的投资。

相比之下，字节跳动更倾向于单打独斗，对头部大模型公司鲜有投资，并坚持闭源模型策略——这也让阿里看到了生态层的竞争机会。

据《中国企业家》了解，对于行业大客户，接近阿里云人士态度明确：没有跟字节跳动深度合作的大模型厂商，阿里云就会“砸”资源，包括云服务、投资、生态合作等等。

春节后，企业端对Agent和Coding的付费意愿大增。阿里CEO吴泳铭在财报电话会上表示：“理论上，只要AI帮助员工完成的工作任务在企业内创造的价值大于Token成本，企业对API Token的需求就会是无限的。”

但企业端规模更大的同时，也是更难攻克的市场。

一位阿里云的业务人员颇为感慨：“字节占据了抖音这样的C端入口，整个视频产业的AI化转向都会围着字节转，它们的销售可以‘躺赢’。但阿里只能下苦功夫，从办公和Coding场景进入。”

Token理论值消耗高的具身智能赛道，成为阿里的布局重点。

一位行业人士告诉《中国企业家》：过去一段时间，一位阿里云高层走访了30多家具身智能公司，并且让其中的大部分用上了Qwen。他跟这些厂商推荐Qwen的理由很简单：开源并且能力可以快速迭代，尺寸多样。阿里投资也功不可没——目前，阿里已经投资了自变量、宇树科技、逐际动力等具身智能公司。

视频生成也是AI消耗最集中的赛道之一。一位短剧行业人士告诉《中国企业家》：在Seedance 2.0的代理费涨至1000万元时，阿里的欢乐马（HappyHorse）将API代理费下调至500万元，用“打骨折”来挖字节跳动的墙角。

在激进的“开发客户+高额补贴”动作下，阿里云MaaS目标超额完成。阿里云峰会上，接近阿里云人士告诉媒体：阿里云MaaS业务的Token收入，在2026年的前5个月里，增长了15倍。

另据2026年第一季度阿里财报：包含百炼MaaS平台在内的AI模型与应用服务年化经常性收入（ARR）将突破100亿元，今年底将突破300亿元。

与阿里相似，字节也给MaaS销售开出了超额绩效激励。2023年，字节跳动就布局了MaaS的产品和销售体系，行业传闻，销售卖Token比起卖云产品奖励高出10倍、20倍之多。甚至有人指出，火山引擎对销售的考核很严格，AI的Token调用量如果不够，哪怕你其他云业务做得再好，也没用。

新人接棒，模型迭代找回节奏

4月，阿里Qwen大模型负责人林俊旸离职，掀起轩然大波。资深人士对《中国企业家》表示，虽然林俊旸对离职的处理方法不成熟，但外界仍担心他的离职会影响到阿里高端人才招募。

经过一个多月的沉淀，阿里正在找回节奏。

阿里巴巴通义大模型事业部负责人周靖人来源：受访者

当天，阿里发布了Qwen3.7 Max，距离上次Qwen3.6 Max-Preview的更新发布仅有一个月时间。

Qwen核心技术负责人刘大一恒介绍，Qwen3.7 Max的训练初始阶段比Qwen3.6-Plus效果差，但训练了1000多个环境后，达到了3.6-Plus的水平；训练了2000多个环境后，达到了Kimi K-2.6的水平；超过4000个环境时，达到了DeepSeek V4的水平。

“把它扩展到8000个环境之后，它超越了国内的模型，只离Anthropic有一点差距，如果继续去Scaling它的RL（强化学习），模型能走得更远。”

阿里云技术团队表示，长程任务是语言大模型迈向真实世界非常重要的能力，这意味着需要模型有极强的上下文管理和记忆能力等。

阿里云让Qwen3.7 Max从0到1写了一个记英文单词的App，它运行了超过1万行代码，最后用11个小时做出了App。这个过程中，模型可以自主创建测试，执行，进行版本迭代，比如增加消消乐记单词、挑战记单词等功能。最后，该App实现了供1000多个用户的流畅使用。

值得注意的是，Qwen3.7 Max也拓展到了物理边界。研究人员可以用其控制机器狗寻找物品。刘大一恒说：“语言模型是扮演大脑智能的关键一环，它可以把视频生成以及物理世界的机器狗串联起来。”

阿里云也提到了模型的自主进化，用Qwen3.7自己训练自己。比如在模型的强化学习里，模型已经会想办法作弊。这时候，研发团队会让模型自主进化一个框架。经过80多个小时的RL实验，该框架归纳出了各种作弊模式，并作出迭代优化。最终，Qwen3.7 Max实现了多轮自进化。

“我们预感，Qwen接下来的模型进步速度会越来越快。”刘大一恒总结。

聚焦编程、办公场景

在AI视频领域，阿里也未停下探索脚步。今年4月，欢乐马（HappyHorse）模型火爆网络，性能直逼Seedance 2.0。

短剧业内人士告诉《中国企业家》，目前行业C端需求旺盛，整个产业链已经跑通，上下游玩家只需快速接入工具，便可开展生产。

但他也表示：目前行业演化还在初期，外界可能高估了AI视频领域的Token天花板。“一部AI漫剧里，Token的成本可能只有5%甚至更低，更大成本在于平台投流与创意团队。不过需求井喷下，大部分AI漫剧公司要扩充更多员工，整体利润微薄，Token涨价也有可能成为压死骆驼的最后一根稻草，许多玩家可能撑不到6月。”

不同于字节跳动更多押注AI视频生成行业与API模式，阿里云在AI产品侧更聚焦B端，尤其在编程、办公等场景形成多产品矩阵，整体推进。

以阿里旗下Coding产品Qoder为例，它在5月20日推出了国内版，除了CLI以及插件的产品形态外，今年1月上线了AI桌面助手QoderWork，目前正在内测数字员工Qoder wake。

另一支专注办公效率提升的团队是MuleRun（骡子快跑），该团队的负责人陈宇森告诉《中国企业家》等媒体，它们并不认为自己是一个“类龙虾”的产品，MuleRun以web端为核心的产品形态，嫁接到用户原来的办公流程。

他认为，AI应用赛道不同于传统软件，更接近制造业逻辑：团队无需自研底层模型，大量技术来自开源生态，像手机厂商一样整合多方资源，快速组装成可用产品。“办公AI比拼的是产品品位、细节打磨与精准定位。”

一位行业人士表示：“与字节依赖API调用不同，阿里更强调‘环境+工具’的整体搭配。企业端AI落地，单靠API远远不够，必须配套完整工具链与运行环境。”

这意味着，企业采购真正完成数字化转型，需要的是涵盖算力、数据安全、系统对接、组织协同的完整解决方案——也就是企业级AI“生态环境”。

阿里云CTO李飞飞总结：2026年阿里云核心改造方向，是让所有云产品支持Agent快速开发、调用与部署，全面推进Skill化与MCP化，构建面向Agent时代的智能控制界面。

全栈竞争：从芯片到Infra层

不过阿里要想打造企业级的AI生态环境，进化为面向Agent的智能云，也必须要从芯片底层的重构开始。

阿里云智能集团资深副总裁、公共云事业部总裁刘伟光说，今天的AI特别像新型制造业，要获得AI收入，必须同时建设两个工厂：AI训练工厂和AI推理工厂。

在模型训练阶段，大模型对云的基础设施要求是高并发、高吞吐、大规模算力、单集群；但到了推理阶段，意味着AI工厂要适配多种多样的芯片，高速的网络传输效率，用最高效率吞吐Token，以支撑Agent网络的高速运转。

5月20日，阿里平头哥发布了两款芯片——训推一体的AI芯片“真武890”和ICN Switck互联芯片，这两款芯片搭载在AL128超节点上，搭载了128张真武890芯片。平头哥官方透露，2027年3月计划发布真武V3系列，2028年计划发布J900系列。

一位芯片从业者对《中国企业家》说：“华为384超节点采用的是光连接，成本高。AL128超节点采用的是高速电互连，优势是稳定。此外，‘真武890’兼容主流芯片，不用做单独适配。”

除了真武系列的AI芯片，平头哥还布局了倚天系列Arm服务器CPU、磐脉系列智能网卡、镇岳系列存储主控芯片、ICNSwitch互联芯片等数据中心核心芯片，实现算力、网力和存储的全栈自研。

一位投资人曾告诉《中国企业家》：大模型竞争到最后，不是大模型参数规模的竞争，也不是算法的竞争，而是Infra层，尤其是芯片、互联和算力的整体Token输出效率。

从上述布局来看，从底层芯片到Agentic Cloud，从全模态模型矩阵到模型服务平台，再到Agent应用，阿里云已成为国内唯一完整打通五层全栈能力的云厂商与AI厂商。

本文来自微信公众号 “中国企业家杂志”（ID：iceo-com-cn），作者：闫俊文，36氪经授权发布。

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

阿里咬住字节，为卖Token拼了

超额激励卖Token

新人接棒，模型迭代找回节奏

聚焦编程、办公场景

全栈竞争：从芯片到Infra层

最近内容

下一篇