模型发布更快，企业怎么跟上？看德勤 47 万人的落地方法

AI深度研究员·2025年10月10日 09:00

Claude 4.5性能超Opus，成本降80%，企业部署提速。

上周，Anthropic 发布 Claude Sonnet 4.5。距离 Claude 4 上线，仅四个月。

这次发布的结果出人意料：性能全面超越旗舰模型 Opus，成本却只有五分之一。

但 Anthropic 没有召开大规模技术发布会。

2025 年 10 月 9日，CPO Mike Krieger 说了一段话：

这次不是模型迭代得更快了，是我们的发布方式变了。我们不再一版版做模型，而是在搭建 Agent 工厂。

这不是营销话术。

四个月内，Anthropic 完成了一次完整的产品重构：

从 Claude Code 到 Claude Agent SDK，
从后训练流程到企业部署方式，
从模型能力到平台化调度，

所以问题不是为什么发布更快，而是：企业怎么用得上？

德勤 47 万人的部署，给出了最新答案。

第一节｜模型提速，为什么越来越快？

“我们不是靠灵光一现，而是把流程做顺了。” 这是 Mike Krieger 谈到 Claude 4.5 发布节奏时，最核心的一句话。

你看今年的大模型节奏就知道，几乎所有 AI 公司都在加速：

OpenAI 每季度一个发布会，

Google Gemini 接连几轮更新，

国内多个基础模型团队，也开始“月更”……

但 Anthropic 做到了别人没做到的：发布比上代旗舰更强、成本更低的版本。

怎么做到的？的答案里没有算法领先，只有三个字：做流程。

1. 先听客户要什么，再决定模型做什么

Mike 说，Sonnet 4.5 是第一版客户驱动的模型。

“我们大量和终端客户对话，他们告诉我们 Sonnet 4 哪里好用、哪里不够。这些反馈直接变成研究目标。”

比如，Sonnet 4 和 Opus 4 写代码不错，但任务时间一长，模型容易遗忘上下文、思路跑偏。这是最常见的客户反馈。

4.5 就重点解决这个，让模型能在更长时间内保持连贯。

过去是研究员试新方法，现在是客户列需求。研发目标从模糊变成可追踪的任务列表。

2. 发布不再临时赶工，按产品节奏跑

“你知道，我们第一次能在模型发布当天，和客户同步上线。”

Mike 说，这是他最满意的地方之一。

在他加入初期（Sonnet 3.5 时代），模型发布像打一场硬仗：每次从头摸流程，写文档、测接口、排错误。

而到了 Sonnet 4.5：发布前几天就打通全部流程，连邮件模板都提前准备好。模型上线就像发布 App。

他甚至分享了一个客户的评价：

“这是我见过最顺畅的模型发布。”

不再靠熬夜赶工，而是有标准、有工具、有节奏。

3. 上线不是交付，是一起用

团队开始“吃自己的狗粮”。

Mike 他们最好的工程师现在同时管理三四个 Claude Code 实例：你要更高层次地思考，把任务分解，让每个 Claude Code 处理不同的部分。工程师从写代码变成了管理 AI。

以前，出事了是人先到现场。现在，是 Claude 先到。

这不是演示，是每天真实的工作方式。模型在真实场景中反复迭代。

所以，Sonnet 4.5 发布节奏提速，并不是因为 Claude 更聪明、研究团队更强，而是三件事变了：

客户成了产品定义者，

上线流程像做 App 一样标准、流畅，

团队自己就是用户，模型在真实环境中反复试错。

节奏改变的本质，不是拼速度，而是做流程。

第二节｜快还要稳，怎么做到的？

Claude Sonnet 4.5 提速，不只因为发布流程更顺。

更关键的是，它从"工具"变成了能主动协作的 Agent。

Mike 在对话中说：

“我们不只用 Claude 补全代码，它本身就能参与协作。它已经像同事一样，在 Slack 群里值班了。”

✅ 不是模型在答题，而是直接处理问题

Mike 说，他们内部做了一个叫 “Claude On Call” 的 Agent：

“它会在事故发生的第一分钟出现在群里，自动查看指标，快速判断原因，有时还会提醒：要不要检查一下那个服务是不是又挂了。”

这就是 Agent 跟传统 AI 的区别：不是你问它答，而是它自己判断何时该说话、说什么有用。

Mike 给出了内部评分标准，一个真正的 Claude Agent 至少要做到：

自主判断：不等指令，能判断何时出场
使用工具：调用数据库、搜索资料、写入日志
持续学习：不是每次重来，随使用次数变熟练
主动协作：能进群、参与流程，不是独立窗口
长时运行：任务时间可以是 5 分钟，也可以是 5 小时

人类员工做 100 次任务，应该比第一次做得更好。Claude 也应该这样。

✅ Claude Code：用 Claude 开发 Claude

在整个 Sonnet 4.5 版本里，Claude Code 是最早用上 Agent 能力的场景。

Mike 说，他们现在用 Claude Code 开发 Claude Code 本身。

“它写的不只是几段代码，而是能改动整个项目结构。我们用每个版本的 Claude 去重构 claude.ai 网站，从版本 1 到 4.5，只有 4.5 成功完成了。”

这不仅说明模型能力更强，还说明：

Claude 能看得懂上下文
Claude 能规划多步执行
Claude 能根据实际效果调整做法

而这些能力，已经不再是“问答模型”的范畴，而是 Agent 的核心特征。

✅ SDK 推出：发布的是能接任务的 AI

为了让更多人用上 Claude Agent，Anthropic 推出了 Claude Agent SDK。

简单说，这是一个开发工具包，企业或个人开发者都能用它来：

把 Claude 接入自己的内部系统
让它拥有某种角色，比如财务顾问、客服助手、个人助理
让它能够长时间执行任务，比如跑一个30小时的自动化报表流程

Mike 明确说：

“我们以前叫它 Claude Code SDK，大家以为只能写代码。后来改名叫 Claude Agent SDK，因为它能做的远超写代码。”

第一节讲的是：Claude 发布流程更顺畅。这一节要说的是：Claude 本身也变了。

第三节｜Claude SDK，到底能做什么？

Sonnet 4.5 发布后，有个数据引起关注：性能超越 Opus 4.1，成本只有五分之一。

什么概念？

Opus 4.1 曾是 Anthropic 的旗舰模型。现在，一款更轻量的模型在多数任务上都超过了它，运行成本不到 20%。

这像某种算法突破。但 Mike Krieger 的解释很朴实：不是魔法。我们只是把工程做扎实了。

三个关键点，让成本降低 80%：

① 后训练：训练完不上线，持续打磨体验”

Mike 反复提到一个词：“后训练”（post-training）。这是什么意思？

就像做产品不是写完就发布，而是根据用户反馈打磨。模型训练完后也一样，继续根据真实场景调优：

更精准的指令遵循（模型更清楚如何响应）
更好的风格一致性（输出更专业）
更强的执行稳定性（长时间任务不中断）

Mike 说得很直接：

“如果只能做到 50%，那只是演示。要做到 80% 甚至 90%，才能真正帮你完成工作。”

② 工程优化：不是用更多 GPU，是提高资源效率

Claude 能力变强，并不是因为用了更多的 GPU，而是因为调度、存储、执行都优化了。

Mike 说：

“过去 6 个月，真正进展最大的不是模型结构，是工程优化。”

具体来说：

加速器间并行调度更稳定，
模型中断概率降低，
发布流程标准化。

就像厨房做菜：同样的设备，以前一道菜 30 分钟，现在流程调顺、食材备好、火候可控，10 分钟出菜，还能同时做三道。

不是换了更好的锅，是把整个流程优化了。

③ 小模型追平大模型：靠工艺细节

过去的认知：大模型强但慢，小模型快但弱。

Claude Sonnet 4.5 打破了这个认知。

Mike 明确表示：Sonnet 4.5 的核心不是更大，是更精。它在很多任务上已经超过 Opus，而且更快、更便宜，能承接更多场景。

比如，在 Claude Code 场景中，Sonnet 4.5 是第一个能独立构建完整网站版本的模型。

Mike 说，他们做了一个实验：让每一代 Claude 去重建 claude.ai 网站。

“只有 Sonnet 4.5 做出了真正能用的版本。包括登录、API 调用、前后台页面、权限控制，全部搞定。”

这说明它既懂原理，又能落地。

第四节｜德勤怎么用上更快的 Claude？

Claude Sonnet 4.5 很强。

但 Mike Krieger说：

“强不强不是关键，用得上才是。”

这句话背后，是 Anthropic 团队对 AI 工具落地过程的反复观察。

他们发现，大多数企业在面对新模型时，常常卡在两件事上：

没时间试用，内部流程跟不上；
用是能用，但真正融入业务流程很难。

所以 Anthropic 做了一套"落地工具包"，提供能直接上手的模板，不用自己拼技术。

✅ Claude SDK：接入新模型像打开 App

你可以把 Claude SDK 理解成：

一套帮助企业把 Claude 接入业务流程的“接线板”。

Mike 举了几个最常见的用法：

1、客服自动回复：

不用训练自己的模型，直接调用 Claude 做 FAQ 回答

还能根据用户历史提问自动调整语气和风格

2、文档助手：

把企业内部文档、知识库接进 Claude

客户问问题时，Claude 会先“看资料”，再回答，确保说得靠谱

3、内部 AI 助理：

给员工用的，不是对客户的

比如：帮产品经理整理需求文档、帮运营写月报、帮销售生成邮件模板

Mike 强调：我们不是要让企业做出一个大模型平台，而是帮他们做出一个有用的 Claude。

提供的是能直接嵌入业务的 AI 模块。

✅ 内置安全规范：让企业敢用

让企业敢用 AI，不仅要好用，还得放心。

所有部署出来的 Claude Agent，都必须有三重安全机制。

分别是：

身份确认机制：不让 Agent 冒充人类回答敏感内容

拒答机制：对于模糊或风险话题，明确说“不知道”或拒绝作答

可追溯机制：每一次调用、每一个回答，都可以回溯源文档和判断链条

这些机制，都被写在 SDK 默认模板里，企业不需要自己再设计。Anthropic 不希望企业独自承担风险，而是要让 Claude 成为默认可托付的伙伴。

✅ 最大规模落地：德勤 47 万员工部署

（Anthropic 与德勤达成史上最大规模企业部署（来源：CNBC））

Claude 的嵌入式打法已在真实企业落地。

最大规模合作对象之一是德勤。

德勤刚刚宣布：将在全球 150 多个国家、面向 47 万名员工部署 Claude。这是 Anthropic 迄今为止最大规模的企业合作项目。

不同部门用 Claude 的方式也不同。会计师、审计师、软件工程师，都将拥有属于自己的“Claude 角色”，由德勤的 AI 团队定制开发。员工还可以向德勤专门设立的“Claude 卓越中心”求助，像找内部专家一样快速使用 AI。

Anthropic 首席商务官 Paul Smith 说：我们双方都投入了大量资源，包括财力和工程力量。

德勤 CTO Ranjit Bawa 的一席话，道出了背后的核心逻辑：

客户总会问我们：你们自己用了吗？只有我们先用起来，才能更有说服力。

这不是口号，而是示范：AI 不只卖方案，更要让组织自己先转变。

这印证了 Mike Krieger 观点的：模型发布只是开始，真正有价值的是企业内部能跑起来。

结语｜企业怎么跟上？答案是"先启动"

Anthropic 的节奏越来越快。Sonnet 4.5 发布仅数月，下一个版本已在路上。

但 Mike Krieger 给出的答案不是追赶模型能力，而是改变使用方式。

企业如何跟上？三个关键：

流程要顺：不是临时赶工，而是让 AI 接入变成标准动作
先用起来：不等完美方案，先启动一个 Agent 让组织适应
默认安全：用 SDK 内置规范，而不是自己从零设计

当模型更新越来越频繁，关键不是有没有 API 权限，而是：

工作流程能否容纳快速变化的 AI？

员工能否在不重构流程的前提下用起来？

有没有一套默认可托付的使用规范？

Claude SDK 的范式是：不需要完美接入，但必须先启动。

启动一个 FAQ Agent、文档助手或邮件生成器，就意味着组织具备了响应变化的能力。

📮参考资料：

https://www.youtube.com/watch?v=GmcTq0Zo8kM&t=933s

https://www.youtube.com/watch?v=aJxnel2_O7Q&t=865s

https://www.cnbc.com/2025/10/06/anthropic-deloitte-enterprise-ai.html#:~:text=Deloitte%20on%20Monday%20announced%20a,companies%20first%20unveiled%20last%20year.

本文来自微信公众号“AI 深度研究员”，作者：AI深度研究员，36氪经授权发布。

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。