Anthropic 公告里最刺眼的 3 个名字，有 1 家中国模型

极客公园·2026年07月02日 20:08

Mythos 5 的逆天挖漏洞能力，Claude Opus 4.8, GPT-5.5, Kimi K2.7 都能做

Anthropic

C+轮海外2019-02

人工智能安全和研究公司

36氪报道前沿技术

我要联系

每周都有 Anthropic 新乐子看，已经成了最近一个月科技圈的保留节目。

而故事起源，还要从 6 月初，Anthropic 秘密递交 IPO 文件谈起。甫一交表，Anthropic 转头就发了万字长文警告自家最新模型 Claude Fable 5/Mythos 5 已经能力强到应该被限制使用。

同一时间，大客户 AWS 也送上助攻，给美国政府递交了一份秘密报告：是的，Fable 5 已经强到发现和利用零日漏洞的速度远超人类的修补速度，会导致眼中的网络安全风险。

结果，一唱一和间，两份原本用来自夸的报告，转头成了美国政府强制封禁 Anthropic 新模型全球访问的投名状。不过这次，不仅是其他国家用户不能用，连 Anthropic 内部外籍员工都不能用了。

随后，PR 过度的 Anthropic 不得不立刻修改口径，表示 AWS 说的漏洞发现能力，GPT-5.5 也能做到，这才换来美国政府的有限松绑。

但到这一步，故事还没有结束——6 月 30 日，Anthropic 再发新文，表示 AWS 说的问题，其实 Claude Opus 4.8, GPT-5.5, Kimi K2.7 也全都能实现。

是的，这一次，Anthropic 不仅拉上了老对手 OpenAI，连带着国内的 Kimi 也一并被它拉上了。

01 国产模型，这次真的不一样了

过去两年，如果你问一个国内 AI 从业者「中转站」是什么，答案清一色是：帮国内用户连接海外 Claude 和 GPT 的灰色通道。

那时，围绕中国大模型，产生的标签非常固定：便宜、能用、但上限不高，做 Chatbot 尚可，但在复杂任务的表现上，还是有些差强人意。

但这个叙事，从今年年初开始，悄悄翻转了。一批中转站开始反向操作：把 K2.6、DeepSeek V4 在内的国产模型 API 中转出去，销往全球。

当然，我们不推荐、不提倡该行为，因为转售、出租、分销 API Token / 账号是官方明文禁止的行为。但这足以说明，全球客户采购中国模型的原因，也已经从便宜变成了性价比+技术领先。

《经济学人》在盘点 2026 年 AI 市场时，还专门用了相当篇幅分析这一转变：中国模型在海外的认知，正在从「廉价替代品」向「可被严肃采用的技术供给」迁移。

判断虽然有点抽象，但用户的确在用双脚投票。

Coinbase 首席执行官 Brian Armstrong 不久前在 X 平台发文盛赞 GLM 5.2 和 Kimi K2.7 表示：

91% 的员工根本不需要所谓的极限模型能力。那与其限制他们用 AI，不如把默认模型切到 GLM 5.2、Kimi 2.7 这类高性价比选手；再通过 LLM 网关按任务自动路由，缓存命中率从 5% 提到 60%。

最终的效果显示，借助国产模型，Coinbase 的 AI 支出削减近一半，而 token 使用量仍在以指数级增速增长。

这不是个例，过去一年，仅公开发生的国际大厂切换国产模型的案例就包括：Airbnb 将主力客服模型从 GPT 切换至千问；AI 公司 Lindy 将模型从 Anthropic Claude 迁移至 DeepSeek V4；查马斯・帕里哈皮蒂亚旗下公司将核心业务从 Anthropic Claude 迁移至 Kimi K2，Cloudflare 将 AI 安全 Agent 等生产任务从自研与海外闭源模型切换为 Kimi K2.5，HolySheep 客服中台从单一 OpenAI 切换为 Claude 与 Kimi 混合架构，Notion 团队的 AI 负责人，也公开官宣接入 Kimi K2.6，并表示 K2.6 是首款具备顶级智能体能力的开源模型，部分任务性能对标 Claude Opus 4.6，超越 GPT 5.2……

02 到底哪里不一样？

前不久的 GTC 2026 上，英伟达用来展示其最新芯片推理性能的中国模型仅有 DeepSeek 和 Kimi 两家。

更早之前，英伟达不仅第一时间适配 Kimi，还抢先在 Hugging Face 平台发布了针对 Kimi-K2.5 的 Eagle speculative decoding 方案——把第三代 Eagle 投机解码技术搭载到 Kimi 推理大模型上，实现极速推理。

技术层面，Kimi 是最早押注 MoBA 改造 Transformer 注意力机制的玩家，同时也是最早把 Muon 系优化器推到万亿参数级训练并系统公开经验的团队之一，其思路后续也被 DeepSeek V4 借鉴，用来提升收敛效率和训练稳定性。

认知层面，早在 2025 年下半年，大多数同行还在 Chatbot 赛道上卷上下文长度、拼榜单分数时，Kimi 已经把 Agent 定为核心战略方向。9 月发布「OK Computer」，让 AI 真正为人类完成任务；同期在预训练阶段加入大量工具使用和多轮规划的轨迹数据，直接用真实 Agent 场景数据训练。11 月，K2 Thinking 模型发布，原生掌握「边思考边使用工具」的能力，在「人类最后的考试」（Humanity's Last Exam）中取得 44.9% 的成绩。到今年年初 K2.5 发布时，Kimi 的 Agent 能力已经进化到集群级别——能根据任务需求现场调度多达 100 个分身，并行处理 1500 个步骤。

不一样，源于国产模型在认知上的领先和技术上的突破。

03 Anthropic 让中国模型又爱又恨

从业务结构上看，哪个中国模型公司更像 Anthropic？带着这个问题，我们请教了几位行业大佬和投资人，答案惊人一致——

Kimi。

这种相似，不只是表面上的技术路线，也包括了商业内核的高度趋同。

首先是增速的相似。

尽管全球 AI 市场仍处于早期阶段，Kimi 的营收在全球企业 AI 支出中占比依然极小。但增速来看，Kimi 在走 Anthropic 的老路。

Anthropic 2026 年 2 月 ARR 达 140 亿美元，3 月升至 190 亿美金，4 月突破 300 亿美金并反超 OpenAI，5 月进一步飙升至 440–470 亿美元，半年内增长超 3 倍。

Kimi 的轨迹几乎复刻：2026 年 1 月 K2.5 发布之后，公司 20 天收入就超过 2025 年全年；并在 3 月初达到 1 亿美元 ARR；截止 6 月底，相较 3 月初又实现连续 3 倍加速增长。

其次是收入结构的相似。

在开发者群体中，经常被拿来与 Anthropic 对比国内模型一般有三家：DeepSeek、GLM、Kimi。其中智谱的营收中，到 2025 年约有 73.7% 来自定制化收入，DeepSeek 与 Kimi 的营收则主要来自 API 收入，和 Anthropic 高度相似。

关于 Kimi，当前已经有内部信息显示，Kimi 的 API 收入占比已达 70% 左右，团队规模却只有约 300 人。

翻译一下：几乎没有定制化项目，没有重人力的交付团队，完全是产品主导的高毛利增长模式。也就是说，Anthropic 那套毛利率很高所以估值合理的叙事，Kimi 同样可以讲，而且讲得更轻。

甚至，Anthropic 在 Coding 场景的崛起路线，也在曾经大客户的助攻下，被 Kimi 半被动的复刻。

图源：Cursor 公司 founder Aman Sanger 的 X 截图

众所周知，Anthropic 营收超越 OpenAI 的核心在于 coding 场景用户的刚需与强悍付费能力。而巅峰时期，Cursor 贡献了 Anthropic 约 40% 至 50% 的收入。

但 2025 年 5 月，Anthropic 发布了 Claude Code，仅用了半年多时间，Claude Code 年化营收就冲到 25 亿美元，抢走了大量 Cursor 用户。再到 2026 年初，Anthropic 宣布收紧第三方访问权限，又给了 Cursor 一记重击。

按理说，Cursor 应该一蹶不振了。

但 Cursor 不仅没死，还在同一时间交出了 Composer 2 还击，作为一款用 Kimi 2.5 训练出来的编程模型，官方数据显示，其在多项编程基准测试中甚至超过了 Claude Opus。

再然后，马斯克出手了，SpaceX 以约 600 亿美元全股票交易收购 Cursor。

左手是 Kimi 贡献的基模能力，右边是 SpaceX 数十万张顶级 AI 芯片组成的超算集群提供海量算力，再加上自身数年积累的优质数据——颓势边缘的 Cursor，又靠着国产模型奇迹般的复活了，甚至还带动 SpaceX 股价在消息公布后盘中飙升超 16%，总市值一度冲至 2.94 万亿美元，短暂超越亚马逊和微软，跻身全球第四。

而这某种程度上，也意味着 Kimi 不仅是海外各大应用厂商讲述性能、成本和资本市场能力的最佳叙事组成，也成为了 Anthropic 在上市前夕讲述其独一性故事的「绊脚石」之一。

毕竟，同样是 API 收入主导的高毛利模式，同样是借助 coding 逆袭超车，截止目前，Anthropic 上市前的最后一轮投后估值达到了 9650 亿美元，但 Kimi 新一轮投前估值也达到了 315 亿美元。

但如果眼光放的更长远一些来看，无论是 DeepSeek 还是智谱或者 Kimi，无论是一级市场的 315 亿美金，还是港股市场的千亿人民币市值，只要这几家头部大模型真的能做出 Opus、Mythos 级别的模型，那么他们的价值，还有逐渐向 Anthropic 看齐的空间。

本文来自微信公众号 “极客公园”（ID：geekpark），作者：Cynthia，36氪经授权发布。

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。