AI定价彻底分化，大模型只剩两种活法，中间的先死

硅基观察Pro·2026年06月23日 21:14

大模型的未来属于两个极端

最近大模型圈，出现了一种很割裂的事情。

过去大家总觉得，技术越普及，AI肯定越来越便宜。比如你看DeepSeek，API价格直接打到粉碎性骨折，几乎等于白给。

这话只说对了一半。

当你以为大家都要跟着大甩卖时，像Claude Fable 5 这种头部的“前沿模型”反而开始疯狂涨价了，还有人抢着买单。智谱甚至靠着提价，市值直接干到了1万亿。

这就很魔幻了。同样是卖智能，有人靠跳楼大甩卖，有人靠稀缺脑力疯狂收割利润，两拨人活在完全不同的两个世界里，却共用一个名字，叫大模型。

既然两极分化这么严重，那中间那些比上不足、比下有余的模型怎么办？

Altimeter Capital 合伙人 Freda Duan 的判断一针见血：未来只有两种模型能活下来，要么足够出色，要么非常便宜。而DeepSeek，就是那条横在所有人面前的“生死线”。

今天，我们就来聊聊模型定价分化这个事。

AI 定价开始分化了

过去两年，很多人对大模型价格有一个基本判断：模型会越来越便宜。

当模型能力被证明可以复制，后来者就会迅速把价格打下来。这就是所谓的“成熟智能通缩”。

DeepSeek就是这个故事的典型代表。2026年5月，V4-Pro模型API价格直接打到原价的四分之一。API输入缓存命中降至0.025元/百万Tokens，输出6元/百万Tokens。

这个价格，是GPT-5.5的三十五分之一。

但如果你以为这就是全部真相，那就大错特错了。

另一边，真正的前沿能力不仅没有通缩，反而开始疯狂溢价。

Claude Fable 5 是最典型的例子。上一代Opus 4.8，价格是输入5美元、输出25美元。到了Fable 5，价格直接翻倍，输入10美元、输出50美元。

GLM-5.2也是一样。相比上一代，它的加权平均API价格高出了13%，甚至是Kimi K2.7-Code的1.2倍，DeepSeek V4-Pro的4.9倍。

涨幅看起来不算夸张，但真正的变化在任务成本上。

因为 GLM-5.2 更像一个长推理、长上下文、长链路 Agent 模型。Artificial Analysis 的测试显示，它每个任务平均输出 4.3 万个 token，明显高于 GLM-5.1 的 2.6 万个。

所以，单任务成本从 GLM-5.1 的约 0.25 美元升到 GLM-5.2 的约 0.46 美元。

也就是说，哪怕名义单价没有大幅变化，实际跑一次复杂任务的钱也在变贵。

为什么它们敢逆势涨价？

原因也很简单，当一个模型真的比其他模型更聪明，能解决更复杂的问题，能减少重试、减少人工介入、完成更长链路的任务，它就拿到了token的定价权。这也是智谱在三天内股价翻倍的重要原因。

说白了，大模型正在分化成两种截然不同的商业模式：

成熟智能陷入通缩：赚取的是模型规模化应用的钱，依赖极低的边际成本吃透流量红利。

前沿能力走向溢价：赚的是绝对定价权的钱，依靠稀缺的复杂任务处理能力拿到高毛利。

这种分红背后，还藏着一个AI与传统互联网在单位经济模型（Unit Economics）上的根本差异：客单价（ARPU）的无上限性。

互联网时代，单客价值往往存在明确的天花板，但在 AI 时代，一个深度用户每天可以消耗上亿 Token。

以 Claude Code 为例，头部 10% 的超级用户贡献了 80% 到 90% 的营收，呈现出极其极端的幂律分。这意味着，“使用深度”比“渗透率”有着更为庞大的商业潜力。

中间模型会被淘汰，DeepSeek是“生死线”

既然两极分化这么严重，那中间那些比上不足、比下有余的模型怎么办？

Altimeter Capital 合伙人 Freda Duan 的判断一针见血：未来只有两种模型能活下来，要么足够出色，要么非常便宜。

在这个逻辑下，DeepSeek 实际上划定了整个行业的“生死线”。

如果一个模型只比 DeepSeek 强一点，但价格贵很多，它就没有长期存在的理由。对于企业和开发者而言，为微弱的能力溢价支付不成比例的成本，显然不符合基本的商业常识。

当缺乏核心壁垒的中间层模型被加速出清，大模型市场的运作机制正在不可逆地向“路由系统（Routing System）”演进。

企业开始通过智能路由进行任务的精准拆分：将最高价值的复杂推理交由前沿模型，将海量基础任务交由高性价比模型，从而实现单位成本下的产出最大化。

正如加文·贝克（Gavin Baker）所描述的产业终局：“前沿模型攫取了 90% 的经济价值，而开源与廉价模型承载了 80% 的 Token 消耗。”

简而言之，前沿模型吃利润，廉价模型吃流量。

这种路由机制的存在，就是中美AI竞争最底层的逻辑。中国 AI 对海外生态的挤压，未必表现为中国模型公司在前台直接击溃美国巨头，而是一场更为隐秘的“底层平替”。

越来越多的美国 AI 应用公司，为了压降履约成本，开始将底层基础设施悄悄切换为 Kimi、Qwen 或 DeepSeek，再于前台封装自身的产品体验与工作流。

用户表面上还在用 Cursor，但底层某一部分调用量，已经悄悄从 OpenAI 和 Anthropic 切到了更便宜的模型。

法律 AI 独角兽Harvey已经完美验证了这一趋势。它没有简单调用最贵的闭源模型，而是基于自己的法律数据，对开源模型做强化学习和监督微调，再通过路由器把不同任务分配给不同模型。

测试表明，这种混合路由方案在部分复杂的法律场景中，不仅性能足以超越 Opus 4.7 或 4.8，还实现了更低的成本。

这很有可能就是AI应用公司未来的终极形态：底层接入各大API，前台包上自己的数据和工作流，中间靠路由赚差价。

模型没有护城河？

未来唯一的问题只有一个：前沿模型的定价权能不能守得住。

Freda Duan 对前沿模型很乐观。她认为，对前沿智能的需求永远不会被完全满足。只要任务足够复杂，人类就会继续为更强的智能付费。

但反对者的逻辑也很简单，美国高端模型如果要贵一百倍，就必须证明自己在目标任务上能创造远超一百倍的价值。

对少数高端任务，这个溢价也许能成立。对大多数普通任务，很难长期成立。

一旦用户习惯了高性价比的“智能路由”，高端模型就不再天然拥有所有流量。它们只能在最难、最骨感的金字塔尖里争夺那一点点市场份额。

而回顾历史，任何行业出现这种高毛利都会吸引激烈的竞争。两年前，Google DeepMind 内部曾经流出过一句话：

“We don't have a defending moat, neither does OpenAI。”

翻译过来就是，我们没有护城河，OpenAI 也没有。这句话到今天似乎仍然成立。

在这波coding为核心产品周期里，Anthropic在商业化层面完成了对OpenAI的反超。

过去两年，谷歌的连续起伏也在证明着这一点。2025 年以前，它在硅谷叙事里还是一个充满“中年危机”的角色。搜索被挑战，组织被质疑，AI 发布会翻车，外界一度觉得它错过了这一轮。

但到了去年，Gemini 3 横扫各大榜单，Nano Banana Pro 把 AI 生图的精度和想象力推到了一个新高度。去年三季度，Gemini 应用月活跃用户突破 6.5 亿，相比上一季度的 4.5 亿大幅提升。

所有人都在说，谷歌又回来了。

但现在，新的担忧又出现了。谷歌不仅缺席了coding这波最重要的产品周期，Noam Shazeer 和 John Jumper 等核心人才也连续离职，再次让市场重新担心它在大模型领域的优势。

这意味着，前沿模型公司没有永远安全的位置。

总结

商业的底色，从来不讲武德。

大模型的故事讲到最后，其实已经被折叠成了一条铁律：要么足够极致，要么足够便宜。

前沿模型必须死守智力的高地，持续用无可替代的性能赚取绝对的定价权；而廉价模型则会淹没下沉的汪洋，靠极致的性价比吃透规模化的流量。

至于那些卡在中间、比上不足比下有余的模型，注定会在无处不在的“智能路由”中被彻底绞杀，最终被清出牌桌。

今年年初，硅谷创投教父纳瓦尔在一档播客里说了句极其扎心的话：在 AI 时代，平庸的人没有市场，“绝对细分”才是唯一的活路。

人是这样，AI也一样。这个世界还是公平的。

本文来自微信公众号“硅基观察Pro”，作者：阿奇，36氪经授权发布。

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

AI定价彻底分化，大模型只剩两种活法，中间的先死

AI 定价开始分化了

中间模型会被淘汰，DeepSeek是“生死线”

模型没有护城河？

总结

最近内容

下一篇