AI定价彻底分化,大模型只剩两种活法,中间的先死

硅基观察Pro·2026年06月23日 21:14
大模型的未来属于两个极端

最近大模型圈,出现了一种很割裂的事情。

过去大家总觉得,技术越普及,AI肯定越来越便宜。比如你看DeepSeek,API价格直接打到粉碎性骨折,几乎等于白给。

这话只说对了一半。

当你以为大家都要跟着大甩卖时,像Claude Fable 5 这种头部的“前沿模型”反而开始疯狂涨价了,还有人抢着买单。智谱甚至靠着提价,市值直接干到了1万亿。

这就很魔幻了。同样是卖智能,有人靠跳楼大甩卖,有人靠稀缺脑力疯狂收割利润,两拨人活在完全不同的两个世界里,却共用一个名字,叫大模型。

既然两极分化这么严重,那中间那些比上不足、比下有余的模型怎么办?

Altimeter Capital 合伙人 Freda Duan 的判断一针见血:未来只有两种模型能活下来,要么足够出色,要么非常便宜。而DeepSeek,就是那条横在所有人面前的“生死线”

今天,我们就来聊聊模型定价分化这个事。

AI 定价开始分化了

过去两年,很多人对大模型价格有一个基本判断:模型会越来越便宜。

当模型能力被证明可以复制,后来者就会迅速把价格打下来。这就是所谓的“成熟智能通缩”。

DeepSeek就是这个故事的典型代表。2026年5月,V4-Pro模型API价格直接打到原价的四分之一。API输入缓存命中降至0.025元/百万Tokens,输出6元/百万Tokens。

这个价格,是GPT-5.5的三十五分之一。

但如果你以为这就是全部真相,那就大错特错了。

另一边,真正的前沿能力不仅没有通缩,反而开始疯狂溢价。

Claude Fable 5 是最典型的例子。上一代Opus 4.8,价格是输入5美元、输出25美元。到了Fable 5,价格直接翻倍,输入10美元、输出50美元。

GLM-5.2也是一样。相比上一代,它的加权平均API价格高出了13%,甚至是Kimi K2.7-Code的1.2倍,DeepSeek V4-Pro的4.9倍。

涨幅看起来不算夸张,但真正的变化在任务成本上。

因为 GLM-5.2 更像一个长推理、长上下文、长链路 Agent 模型。Artificial Analysis 的测试显示,它每个任务平均输出 4.3 万个 token,明显高于 GLM-5.1 的 2.6 万个。

所以,单任务成本从 GLM-5.1 的约 0.25 美元升到 GLM-5.2 的约 0.46 美元。

也就是说,哪怕名义单价没有大幅变化,实际跑一次复杂任务的钱也在变贵。

为什么它们敢逆势涨价?

原因也很简单,当一个模型真的比其他模型更聪明,能解决更复杂的问题,能减少重试、减少人工介入、完成更长链路的任务,它就拿到了token的定价权。这也是智谱在三天内股价翻倍的重要原因。

说白了,大模型正在分化成两种截然不同的商业模式:

成熟智能陷入通缩:赚取的是模型规模化应用的钱,依赖极低的边际成本吃透流量红利。

前沿能力走向溢价:赚的是绝对定价权的钱,依靠稀缺的复杂任务处理能力拿到高毛利。

这种分红背后,还藏着一个AI与传统互联网在单位经济模型(Unit Economics)上的根本差异:客单价(ARPU)的无上限性。

互联网时代,单客价值往往存在明确的天花板,但在 AI 时代,一个深度用户每天可以消耗上亿 Token。

以 Claude Code 为例,头部 10% 的超级用户贡献了 80% 到 90% 的营收,呈现出极其极端的幂律分。这意味着,“使用深度”比“渗透率”有着更为庞大的商业潜力。

中间模型会被淘汰,DeepSeek是“生死线”

既然两极分化这么严重,那中间那些比上不足、比下有余的模型怎么办? 

Altimeter Capital 合伙人 Freda Duan 的判断一针见血:未来只有两种模型能活下来,要么足够出色,要么非常便宜。

在这个逻辑下,DeepSeek 实际上划定了整个行业的“生死线”。

如果一个模型只比 DeepSeek 强一点,但价格贵很多,它就没有长期存在的理由。对于企业和开发者而言,为微弱的能力溢价支付不成比例的成本,显然不符合基本的商业常识。

当缺乏核心壁垒的中间层模型被加速出清,大模型市场的运作机制正在不可逆地向“路由系统(Routing System)”演进。

企业开始通过智能路由进行任务的精准拆分:将最高价值的复杂推理交由前沿模型,将海量基础任务交由高性价比模型,从而实现单位成本下的产出最大化。

正如加文·贝克(Gavin Baker)所描述的产业终局:“前沿模型攫取了 90% 的经济价值,而开源与廉价模型承载了 80% 的 Token 消耗。”

简而言之,前沿模型吃利润,廉价模型吃流量

这种路由机制的存在,就是中美AI竞争最底层的逻辑。中国 AI 对海外生态的挤压,未必表现为中国模型公司在前台直接击溃美国巨头,而是一场更为隐秘的“底层平替”。

越来越多的美国 AI 应用公司,为了压降履约成本,开始将底层基础设施悄悄切换为 Kimi、Qwen 或 DeepSeek,再于前台封装自身的产品体验与工作流。

用户表面上还在用 Cursor,但底层某一部分调用量,已经悄悄从 OpenAI 和 Anthropic 切到了更便宜的模型。

法律 AI 独角兽Harvey已经完美验证了这一趋势。它没有简单调用最贵的闭源模型,而是基于自己的法律数据,对开源模型做强化学习和监督微调,再通过路由器把不同任务分配给不同模型。

测试表明,这种混合路由方案在部分复杂的法律场景中,不仅性能足以超越 Opus 4.7 或 4.8,还实现了更低的成本。

这很有可能就是AI应用公司未来的终极形态:底层接入各大API,前台包上自己的数据和工作流,中间靠路由赚差价

模型没有护城河?

未来唯一的问题只有一个:前沿模型的定价权能不能守得住。

Freda Duan 对前沿模型很乐观。她认为,对前沿智能的需求永远不会被完全满足。只要任务足够复杂,人类就会继续为更强的智能付费。

但反对者的逻辑也很简单,美国高端模型如果要贵一百倍,就必须证明自己在目标任务上能创造远超一百倍的价值。

对少数高端任务,这个溢价也许能成立。对大多数普通任务,很难长期成立。

一旦用户习惯了高性价比的“智能路由”,高端模型就不再天然拥有所有流量。它们只能在最难、最骨感的金字塔尖里争夺那一点点市场份额

而回顾历史,任何行业出现这种高毛利都会吸引激烈的竞争。两年前,Google DeepMind 内部曾经流出过一句话:

“We don't have a defending moat, neither does OpenAI。”

翻译过来就是,我们没有护城河,OpenAI 也没有。这句话到今天似乎仍然成立。

在这波coding为核心产品周期里,Anthropic在商业化层面完成了对OpenAI的反超。

过去两年,谷歌的连续起伏也在证明着这一点。2025 年以前,它在硅谷叙事里还是一个充满“中年危机”的角色。搜索被挑战,组织被质疑,AI 发布会翻车,外界一度觉得它错过了这一轮。

但到了去年,Gemini 3 横扫各大榜单,Nano Banana Pro 把 AI 生图的精度和想象力推到了一个新高度。去年三季度,Gemini 应用月活跃用户突破 6.5 亿,相比上一季度的 4.5 亿大幅提升。

所有人都在说,谷歌又回来了。

但现在,新的担忧又出现了。谷歌不仅缺席了coding这波最重要的产品周期,Noam Shazeer 和 John Jumper 等核心人才也连续离职,再次让市场重新担心它在大模型领域的优势。

这意味着,前沿模型公司没有永远安全的位置

总结

商业的底色,从来不讲武德。

大模型的故事讲到最后,其实已经被折叠成了一条铁律:要么足够极致,要么足够便宜。

前沿模型必须死守智力的高地,持续用无可替代的性能赚取绝对的定价权;而廉价模型则会淹没下沉的汪洋,靠极致的性价比吃透规模化的流量。

至于那些卡在中间、比上不足比下有余的模型,注定会在无处不在的“智能路由”中被彻底绞杀,最终被清出牌桌。

今年年初,硅谷创投教父纳瓦尔在一档播客里说了句极其扎心的话:在 AI 时代,平庸的人没有市场,“绝对细分”才是唯一的活路。

人是这样,AI也一样。这个世界还是公平的。

本文来自微信公众号“硅基观察Pro”,作者:阿奇,36氪经授权发布。

+1
6

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

在低认知负荷下完成数百页的连续转录任务

1小时前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业