硅谷程序员,疯狂“投喂”中国大模型

市值榜·2026年03月06日 20:20
从卖APP到卖算力

作者:贾乐乐 ,编辑:赵元 

一组来自全球最大AI模型API聚合平台OpenRouter的数据,在国内外都引发了强烈震动。 

截至2026年2月28日,该平台内前十模型总Token消耗量已突破28.7万亿,其中,国产模型贡献超过14.69万亿,为历史上首次单月Token调用占比过半,且超越了美国模型。 

从周维度看,2月16日至2 2日, 中国模型周调用量达5.16万亿Token,而同期美国模型跌至2.7万亿,中国模型全球占比达61%。调用量排名前五的模型中,中国占据四席——MiniMax M2.5、月之暗面 Kimi K2.5、DeepSeek V3.2和智谱GLM-5。 

尽管接下来的一周,中国模型调用量下降,反超的时间很短暂,但能在全球最大的API聚合平台上与美国模型正面交锋并短暂领先,本身已是实力的证明。

此外,OpenRouter平台的用户中,美国开发者占比高达47.17%,而中国开发者仅占6.01%。也有报告显示,80%的美国人工智能初创公司在其产品开发过程中使用了中国的开源模型。 

这意味着,推动中国模型登顶的主力军,是那些来自硅谷、来自欧洲的海外开发者,而非国内市场的自嗨。 

这是因为大模型从“谁更聪明”的单维比拼,进入到了“谁聪明”“谁省钱”的多维比拼阶段。 

一、真香定律: 美国开发者爱上中国Token 

中国AI模型能够在全球调用量上实现对美国的超越,背后是多重因素叠加形成的系统性优势,而其中直接的驱动力是,便宜。 

先看一组数字。 

长江证券的研报显示,在输入价格上,MiniMax M2.5和智谱GLM-5都是0.3美元/百万Token,而Anthropic的Claude Opus 4.6是5美元,是中国模型的16.7倍。 

输出端更夸张,MiniMax-M2.5 价格为1.1 美元/百万Token,智谱GLM-5 为2.55 美元/百万Token,Claude Opus4.6 则为25 美元/百万Token,分别是前两者的约22.7 倍和9.8 倍。2月底刚出的阿里Qwen 3.5,直接把百万Token价格打到0.8元人民币,相当于谷歌Gemini的十八分之一。 

而在大量日常场景里,尤其是伴随着Agent时代的到来,用户对量大便宜算力的需求,压过了对“顶级智商”的需求。 

今年2月,开源框架OpenClaw火了,AI从“聊天工具”变成了能自己干活儿的“数字员工”。 

一个Agent任务动辄消耗几十万上百万Token,按量付费的API成本瞬间成了开发者的大头开支。月之暗面顺势推出KimiClaw,支持一键部署,结果Kimi K2.5发布20天内的调用量就超过了去年全年,累计收入也超过了2025年总和。 

这也是Google和Anthropic封禁那些在订阅制下进行全自动调用的账户,因为订阅费用是有限的,远远覆盖不了全自动调用的算力成本。 

当消耗量指数级增长时,单位Token的价格优势,就成了决定生死的竞争力。 

这个成本优势不是凭空掉下来的,底层是电力和工程的支撑。 

算力的尽头是电力。 

中国工业用电比美国低30%到40%,中西部绿电甚至低50%到70%。加上中国工业用电盘子大,可以充分利用谷电训练模型,这构成了中国AI企业的物理成本护城河。 

另一头,是被迫卷出来的工程能力。从2024年4月起,中国AI企业就在尖端芯片断供的状态下活着,拿不到最好的卡,就把手里的卡压榨到极限。 

中国模型普遍采用混合专家架构,这一技术路线重构了算力消耗逻辑。一个几千亿参数的模型,处理简单问题时只激活其中一小部分“专家网络”,这种“按需激活”的模式,省电省算力。 

最后是开源生态的正向循环。 

过去一年,中国大模型在全球的Token消耗占比增长了421%。斯坦福的报告说,2024年8月到2025年8月,中国开发者贡献了Hugging Face总下载量的17.1%,略高于美国的15.8%。 

开源生态降低了全球开发者的使用门槛,也让中国模型在持续的技术反馈里快速迭代,能力和价格的综合优势在扩大。如硅谷投资人Aditya Agarwal所说:“50%以上的大模型调用通过廉价的开源模型完成,中国模型实际在支持大部分AI应用,美国同行甚至无法替代。” 

中国AI模型出海的成功,是技术架构创新+极致成本控制+开源生态+场景适配共同作用的结果,也是系统性优势的集中爆发。 

二、 出海模式:从应用到算力、生态 

如果说调用量数据解释了中国AI“有多强”,那么接下来需要回答的是:这些Token究竟通过什么路径流向全球? 

过去几年,中国AI出海的主流方式是“应用输出”,即,把AI能力封装成APP,送到海外用户手里。字节的Gauthmath、美图的影像产品、快手的KLING AI,走的都是这条路。 

到今天,这条路径依然在贡献可观的用户规模和收入。 

以Talkie为例,这款情感陪伴类应用覆盖全球200多个国家,在北美Z世代中渗透率持续提升。用户在和AI角色聊天的过程中,每一句话都在消耗Token。这类C端收入占Minimax收入的70%以上,且仍在快速增长中:2026 年 2 月日均 Token 消耗量达到了2025 年 12 月的 6 倍以上。 

字节的Gauthmath在美国拍照搜题市场拿下47%的份额,成功替代老牌产品Mathway,也是同样的逻辑。 

这类模式不直接按Token向用户收费,而是通过订阅、内购、广告变现。但从底层看,它们消耗的依然是中国算力,是中国AI出海的“用户基本盘”。 

如果把AI出海比作一条产业链,应用是下游,算力是上游。中国企业先在下游做产品、做流量,然后向上游走,做底层、做基建。 

一方面,通过API管道式输出,直接把算力做成水电煤。 

海外开发者通过OpenRouter等聚合平台,调用中国大模型的API,推理在中国本土的数据中心完成,按Token付费。整个过程,算力不出境,电力不出境,只有价值通过Token跨境交付。 

这是一种典型的“卖水卖电”生意。开发者不需要自己部署模型,不需要买显卡,就能让应用跑在中国的模型上。 

据报道,月之暗面负责API服务的团队近期快速扩编,以独立业务分支形式直接向总裁张予彤汇报。组织层面的调整,足以说明API业务的重要性正在快速上升。 

从商业角度看,这类模式的优势在于可规模化、利润率可观,而且随着Agent时代到来,单次任务的Token消耗量指数级增长,API业务的想象空间还在放大。 

另一方面,通过构建开源生态,为算力输出修路。 

阿里通义千问、DeepSeek系列选择了一条看起来“免费”的路:把模型权重、工具链、工程范式全部开源,海外开发者可以免费下载,在本地服务器上部署。 

免费图的是让中国模型进入全球开发者的默认工具箱,成为他们技术栈的一部分。当一个开发者用熟了开源模型,他未来开发商业应用时,自然会优先考虑调用同系列的API。 

基于阿里和DeepSeek开源模型的衍生模型上传量,已经超过基于美国主流模型的。这意味着全球开发者正在中国开源模型的基础上,生长出一个庞大的技术生态。生态一旦形成,迁移成本就极高。 

可以说,今天的中国AI出海,不再是单一的“应用输出”,而是一个三层结构:底层是开源生态,通过开放换取开发者心智;中间层是API算力输出,直接把Token卖给全球开发者,是商业化的核心引擎;顶层是应用输出,用产品触达终端用户,既是流量入口,也是算力消耗的重要场景。 

三层相互支撑,共同说明,中国算力正在成为全球AI的底层基础设施。 

三、下半场考验: 商业优势遭遇规则壁垒 

OpenRouter平台上的数字确实亮眼,但OpenRouter不代表全貌。 

消费级市场(开发者、初创公司、Agent应用)的决策链条短,核心指标是性价比+上手快。开发者用哪个模型,往往自己说了算。这个逻辑下,中国模型的“便宜量又足”是绝对优势。 

企业级市场不一样。政府、金融、医疗、关键基础设施,决策链条长,涉及合规、安全、审计、供应商稳定性等等。 

海外的企业级市场就更复杂了。 

所以,有一个问题是绕不开的,即,在国际竞争中,纯商业方面的竞争优势,比如好用、成本低,可能还不够。 

比如,此前的英伟达H200被禁止出口。虽然现在已经可以进口英伟达H200,但在AI竞争层面,美国的政策指不定又会出现什么“反复”,而当前推理集群还是离不开英伟达的H100/H200。 

当然,封锁具有双面性,一方面会使得训练成本上升,模型迭代速度放缓,另一方面正是这种背景,倒逼工程优化提升效率,国产芯片取得进展。 

但风险同样存在。银河证券的研报指出,全球模型迭代周期正在缩短,主流模型更新频率已由半年缩短至数月。如果核心能力提升速度放缓,成本优势可能在高端市场迅速失去吸引力。 

大摩首席经济学家邢自强认为,Token出海肯定是有空间的,但不要过度吹捧中国的开源大模型、Token出海借助电力优势,而忽视了地缘政治与安全考量。 

他举例称,中国在5G设备领域同样有性价比和技术优势,但从2018、2019年之后,欧美不少电信网络中,中国的5G基站还是被替代了。 

在企业级市场,对价格敏感的中小企业可能被中国模型的性价比穿透,但在政府、金融、医疗等涉及数据主权和关键基础设施的领域,准入逻辑从“性价比”转向“合规信任、品牌认知与生态锁定”。 

美国正通过投资审查、标准制定、数据主权规则,系统性地构筑企业级市场的准入门槛。 

这意味着地缘政治的“天花板”正在降低。 

2025年12月,美国政府提出所谓的“硅和平倡议”(Pax Silica),声称要把拥有全球顶尖科技企业或其他优势资源的国家联合起来,以确保“供应链安全”等。 

专业人士认为,这是试图用规则、投资与项目清单重塑全球技术分工与资本流向,看起来是走向了重塑生态,实际上是包装下的排他性整合。 

这个“他”是谁,不言而喻。 

从芯片封锁到“硅和平倡议”,从遏制发展到规则输出,美国的目标是从生态层面重塑游戏规则、掌握话语权。 

所以,模型调用量反超,是阶段性的成果,但也是故事的一半。 

AI出海的下半场,需要在保持成本优势的同时,面对更多、更复杂的问题,有的问题可以靠提升模型性能、系统效率、竞争力来解决,有的问题没有答案。 

+1
20

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000
36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业