Claude Code凭什么牛?大模型团队天天用自家产品,发现bug直接就改了

机器之心·2025年09月04日 16:13
Anthropic自家也用Claude Code。

怎么判断模型、产品性能是否真的提升了?很简单,亲自用它实打实工作一天就知道了。

最近,Anthropic 官宣了一轮 130 亿美元的融资,公司估值达到 1830 亿美元,融资额仅次于 2025 年 3 月 OpenAI 历史性的 400 亿美元融资。

与此同时,这家也在经历新的考验:不少用户发现其王牌产品 ——Claude Code 存在降智问题,还有些开发者已经转向 OpenAI 推出的竞品 ——Codex Cli。

如果不考虑近期这些争议,其实 Claude Code 是一款非常成功的产品,它从 Cursor 那里抢走了大量用户,发布 4 个月用户就已经达到 11.5 万。

这个产品为什么可以取得成功?在最近的一次访谈中,Claude Code 负责人 Boris Cherny 透露了他们构建该产品的时的一些细节,包括极简易用、高度可扩展的产品理念,真实体感大于 benchmark 的评估标准,极致的用户反馈响应机制等。

视频链接:https://www.youtube.com/watch?v=iF9iV4xponk

以下是详细内容:

1、过去的 12 个月里,编程领域发生了哪些变化?

一年前,如果你想写代码,你有一个 IDE,IDE 里有某种自动补全功能,你还要借助一些对话式 AI,你可能会来回复制粘贴代码。

后来,智能体(agents)成为编程工作流的核心组成部分。它们不再是实验性的噱头或原型工具,而是真正融入了开发者的日常工作循环。

也就是说,我们从在网页应用中复制粘贴代码、进行非常有针对性的编辑,转变为更加「不插手」的方式 —— 告诉智能体你想要它做什么,然后信任它去执行大量的代码修改,甚至独立完成整个应用的开发。

2、这种转变背后有哪些原因?

之前的制约因素主要有两个:一是模型还不够好,二是脚手架 —— 模型之上的东西 —— 还不够好。

过去一年,模型在智能体编程方面进步了很多,这发生在 Sonnet 3.7、Sonnet 4 和 Opus 4.1 中。

工具也进步了很多,这里指的是 Claude Code。模型和工具之间的关系就像马和马鞍,马鞍能让你更好地驾驭马(模型)。

模型是 API 后面的东西。Claude Code 集成了系统提示、上下文管理、工具调用、MCP 服务器连接、权限控制等各种功能。模型所接收到的所有上下文信息和工具输出,都会显著影响其最终表现。

在过去的一年里,我们学会了如何确切地为模型构建工具。而且,模型不仅与 Claude Code 共同进化,还与整个基于 Anthropic 模型的智能体编程工具生态共同发展。

3、所谓的「共同进化」是怎么实现的?

在 Anthropic,每个人都使用 Claude Code,包括构建模型的那些研究人员。在此过程中,他们会看到模型的一些自然限制。

之前用 Sonnet 3.5 的时候,模型可以持续运行大概 1 分钟而不偏离轨道。如今,新模型能够持续自主运行的时间越来越长。这是一个基于真实体验的改进循环。因为你是模型的使用者,你能看到人类必须在哪里纠正和引导它。我们可以将学到的这种经验融入模型中,教它更好地自己做这些事情。

4、评估新模型、新功能时,如何评估性能是否在改善?

答案很简单:用它做当天的工作。

在日常工作中,你会做各种各样的事情,包括写新代码、修复 bug、阅读 Slack 消息或 GitHub 问题来回应反馈。

在某种意义上,最好的评估是最像真实生活的评估。直接上手使用会给你最好的结果。

说实话,构建评估真的很困难。到目前为止最大、最直接的信号就是感觉。因为你使用它的任务范围如此广泛。

5、在收集反馈方面做了哪些特别的事情?

关键在于超快速响应 —— 每当有人给出反馈时,我们都会尽快尝试修复它。

有时我会进入办公室,然后花两三个小时,尽可能快地处理尽可能多的 bug 并修复它们,修复后立即回复大家已解决。这鼓励他们继续给出反馈。

直到今天,内部的 Claude Code 反馈通道依然像「消防水带」一样,反馈流量持续不断。这种活跃的反馈循环是产品快速迭代的重要基础。

6、Claude Code 当前状态是什么?最新的功能是什么?你对什么感到兴奋?你看到人们现在在用它做什么?

Claude Code 的设计哲学是:极简易用和高度可扩展。其中,可扩展性是当前最令人兴奋的发展方向。

扩展能力的演进历程:

最初:通过 CLAUDE.md 文件添加项目上下文信息

现在:拥有复杂的设置系统、权限管理、Hooks 系统、MCP 集成、斜杠命令、子智能体等丰富的扩展点

这些功能都与模型能力的整体提升相辅相成:模型变得更加自主、工作时间更长、指令执行更准确、记忆能力更强,所有扩展功能都从中受益。

7、未来 6 到 12 个月,使用 Claude Code 工作会变成一种怎样的体验?

工作模式将呈现手动与自动的深度融合:

交互式编程:不再是直接修改文本,而是通过 Claude 来操作代码

主动化编程:Claude 主动执行任务甚至自我审查,开发者主要负责决策是否采纳这些修改

目标导向编程:未来 12-24 个月,Claude 将更多地关注高层目标和整体规划,而不是具体的执行细节

这类似于工程师的工作方式:先制定月度目标,然后通过一系列小的改动逐步实现。Claude 也将具备这种宏观规划能力。

8、对需要适应这些变化的开发者们有什么建议吗?关于他们应该学习或发展什么技能。

在智能体编程出现之前的世界里,技术栈变得极其复杂。想要做一个 JavaScript 网站,你必须学习 React、Next.js,还有三套不同的构建系统和部署系统,门槛高得令人望而却步。

智能体的出现正在改变这一切。现在,有了编程智能体,开始一个项目变得真正容易。如果你有想法,就可以直接去构建它。重点从「如何实现」转向了「实现什么」,因为就像 Claude Code 一样,代码可以反复重写。代码本身不再珍贵 —— 当然,编写代码仍然是一门艺术,有时你仍会享受手工编写代码的乐趣,但更多时候,关注点在于你要创造的东西,而不是创造的过程。

因此,我对今天学习编程的人的建议是:你仍然需要掌握核心技能 —— 编程语言、编译器、运行时、Web 应用开发、系统设计等基础知识不能丢。但同时,你要变得更有创造性。如果你有创业想法或产品构思,现在就可以立即开始构建,以一种以前完全不可能的方式。我们还无法完全理解这意味着什么,但可以肯定的是,由于智能体的出现,巨大的创造潜力即将被释放。

9、针对使用 Claude Code 的新手有哪些建议?

第一个建议:先问问题,后写代码。

初次使用 Claude Code 时,不要急于让它编写代码。先用它来理解现有代码库,比如问它:「如果要添加新的日志功能,应该怎么做?」「这个函数为什么要这样设计?」

让 Claude Code 探索代码库、查看 Git 历史并回答你的疑问。等你熟悉了这种「智能体研究助手」的使用方式后,再开始让它编写代码。

第二个建议:根据任务难度选择不同策略。

将任务分为三个等级:

简单任务:一个提示就能完成的工作。直接在 GitHub issue 中 @Claude,让它创建 PR。

中等任务:使用 Shift+Tab 进入计划模式,先与 Claude 制定执行计划,确认后切换到自动执行模式。

困难任务:开发者主导,Claude 辅助。使用 Claude 进行代码研究、原型验证、边界探索,但核心实现仍由人完成。

关键是根据任务复杂度选择合适的协作模式,而不是一刀切地使用同一种方法。

本文来自微信公众号“机器之心”(ID:almosthuman2014),作者:机器之心,编辑:张倩,36氪经授权发布。

+1
7

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

上半年,5家硅料企业合计亏损额85.79亿。

2小时前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业