Curosr:请大家再爱我一次

硅星人Pro·2026年05月25日 09:29
模型能力趋同,套壳能力就变得重要了

AI Coding 的第一阶段,最容易被相信的故事是"原生模型 + 原生应用"的闭环优势。

Claude Code 背靠 Anthropic,能最早用上最强的 Claude,模型能力、上下文窗口、工具调用都可以被端到端优化。训练数据、推理参数、工具协议,每一层都可以为 coding 场景专门调校,不需要迁就任何第三方API。

相比之下,Cursor 更像是接入模型的"套壳"产品,哪怕体验做得再好,也很容易被认为只是暂时领先。一旦原生团队把模型优势释放出来,或者为了抢占市场提高第三方 API 价格,应用层的产品就会关门大吉。

但现在看,这个判断正在失效。

Artificial Analysis 近期更新的榜单里,Cursor CLI 与 Claude Code 使用同样的 Claude Opus 4.7(medium),综合得分分别是 61 和 60。这个数字大小本身不重要,重要的是它说明了一件事:所谓"原生"带来的加成,正在慢慢被应用层的工程积累所替代。

同款模型,接近的结果,Cursor 用套壳的方式,做出了不输原生的体验。

Cursor 反击的窗口,就在这里。

1

把模型变成可替换的零件

Cursor 应对"套壳"质疑的方式,不是去证明自己的模型更强,而是让模型变得不那么重要。

在模型外围建立一套足够高效的系统。上下文管理、代码库理解、IDE 与 CLI 的协同等等,这些东西不依附于任何单一模型,却决定了 agent 任务能不能真正跑通。

4 月发布的 Cursor 3,将 Agents Window 被提到核心位置,开发者可以在同一界面里同时调度多个 Agent,分别运行在本地、worktree、云端、远程 SSH 和不同 repo 中。

后续更新沿着这个方向逐层补齐。Cursor SDK 把 Agent runtime 开放给开发者,让企业可以将 Agent 接入内部工具。Cloud Agents 增加了多 repo 支持和审计日志,解决企业用户在安全合规上的顾虑。

与此同时,Cursor 还在把任务入口从 IDE 中移出去。未来的任务不一定从编辑器开始,它可能来自一个想法、一条消息。

Cursor 要做的,是让这些入口自动收拢进 Agent 系统,最终以 diff、测试结果和 PR 的形式回到开发者面前。

从 AI 编程工具,到以 Agent 为核心运转的工程系统,这是 Cursor 这轮更新真正的野心。

这套系统建立起来之后,模型本身变得可以被替换。

Claude 强,接入 Claude,GPT 强,接入 GPT,开源模型好用,就纳入同一套工作流。

而且,随着顶级模型的能力上限正在趋同,接入 Claude Opus 4.7 和接入 GPT 5.5,在很多真实开发任务里的体感差距越来越小。

当"谁家的模型更强"不再是决定性变量,用户的选择逻辑就变了,他们不再被迫绑定某一家模型,而是更看重谁能把不同模型的能力调度得更好。

过去被轻视为"套壳"的那一层,正在成为用户选择的核心。

2

不体面,但有效

解决了"被替代"的问题,Cursor 还有另一个更基础的困境:不赚钱。

它的商业模式天然带着一个尴尬螺旋:工具越好用,用户调用越多,背后的模型 API 成本就越高。

而 Coding agent 本身又是高 tokens、高工具调用、高重试率的场景。

Cursor 和许多依赖第三方模型的 AI coding 创业公司一样,直到最近仍处于负毛利状态。The Information 随后披露,截至 2026 年 1 月的季度,Cursor 毛利率约为 -23%,此后才勉强转正。

转折点来自 Cursor 自己训练的 Composer 系列模型。

Cursor 的思路不是从零构建一个优秀的基础模型,而是更务实地用自有模型接管大量常规 coding agent 任务,减少对上游 API 的依赖。

那些不需要最前沿推理能力的任务,常规的代码补全、格式化、简单重构等由 Composer 接管,把昂贵的 API 调用留给真正需要它的场景。

效果很快显现,Cursor 的大型企业账户已实现正毛利,个人开发者账户虽仍在亏损,但整体结构已经有所改观。

最新的 Composer 2.5,是这个逻辑的延续。Cursor 承认它基于 Kimi K2.5 底座,针对长周期编程任务专项训练,合成数据量是上一代的 25 倍。

选开源底座而非自研,选专项微调而非全能训练,每一步都在压低成本。

这套机制,最终形成了一个可接受的成本结构。

最复杂的需求交给 Claude、GPT 这类前沿模型,最频繁、最标准化的中间地带,交给自己的 Composer。

结合 Cursor 自身的系统,需求越具体,专用模型就越有训练空间,对上游的依赖就越低。

3

重新被评价的资格

某种意义上,Cursor 正在做的事,是用一种不太体面的方式,完成一件很有尊严的事。

它没有执着于证明"我的模型比你强",也没有试图在基础研究上和 Anthropic、OpenAI 正面竞争。它接受自己的位置,然后在这个位置上,把应用层能做的事做到极致。

AI 基础模型正在从"赢家通吃"走向"多极并立"。当没有哪一家模型能在所有场景下碾压其他对手,应用层的工程能力就成了真正决定用户去留的变量。

谁能把有限的模型能力用得更充分、更稳定、更便宜,谁就赢得了真实的竞争。

这场竞争还没有结束。Claude Code 不会坐以待毙,模型能力的天花板仍在上升,原生团队在工具调用和上下文优化上的投入也在加速。

Cursor 的窗口能开多久,取决于两件事:应用层的工程积累能否持续领先,以及它能否在成本结构彻底健康之前,等到市场格局真正稳定下来。

但至少现在,它重新赢回了市场的信任。

在 AI 这个行业里,能活到被重新评价,本身就已经是一种胜利。

本文来自微信公众号“硅星人Pro”,作者:董道力,36氪经授权发布。

+1
6

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

谷歌和白宫,都拜倒在一个未公开发布的大模型下。

1小时前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业