模型发布更快,企业怎么跟上?看德勤 47 万人的落地方法
上周 ,Anthropic 发布 Claude Sonnet 4.5。 距离 Claude 4 上线,仅四个月。
这次发布的结果出人意料: 性能全面超越旗舰模型 Opus,成本却只有五分之一。
但 Anthropic 没有召开大规模技术发布会。
2025 年 10 月 9日,CPO Mike Krieger 说了一段话:
这次不是模型迭代得更快了,是我们的发布方式变了。我们不再一版版做模型,而是在搭建 Agent 工厂。
这不是营销话术。
四个月内,Anthropic 完成了一次完整的产品重构:
- 从 Claude Code 到 Claude Agent SDK,
- 从后训练流程到企业部署方式,
- 从模型能力到平台化调度,
所以问题不是为什么发布更快, 而是:企业怎么用得上?
德勤 47 万人的部署,给出了最新答案。
第一节|模型提速,为什么越来越快?
“我们不是靠灵光一现,而是把流程做顺了。” 这是 Mike Krieger 谈到 Claude 4.5 发布节奏时,最核心的一句话。
你看今年的大模型节奏就知道,几乎所有 AI 公司都在加速:
OpenAI 每季度一个发布会,
Google Gemini 接连几轮更新,
国内多个基础模型团队,也开始“月更”……
但 Anthropic 做到了别人没做到的:发布比上代旗舰更强、成本更低的版本。
怎么做到的?的答案里没有算法领先,只有三个字:做流程。
1. 先听客户要什么,再决定模型做什么
Mike 说,Sonnet 4.5 是第一版客户驱动的模型。
“我们大量和终端客户对话,他们告诉我们 Sonnet 4 哪里好用、哪里不够。这些反馈直接变成研究目标。”
比如,Sonnet 4 和 Opus 4 写代码不错,但任务时间一长,模型容易遗忘上下文、思路跑偏。这是最常见的客户反馈。
4.5 就重点解决这个,让模型能在更长时间内保持连贯。
过去是研究员试新方法,现在是客户列需求。研发目标从模糊变成可追踪的任务列表。
2. 发布不再临时赶工,按产品节奏跑
“你知道,我们第一次能在模型发布当天,和客户同步上线。”
Mike 说,这是他最满意的地方之一。
在他加入初期(Sonnet 3.5 时代),模型发布像打一场硬仗:每次从头摸流程,写文档、测接口、排错误。
而到了 Sonnet 4.5:发布前几天就打通全部流程,连邮件模板都提前准备好。模型上线就像发布 App。
他甚至分享了一个客户的评价:
“这是我见过最顺畅的模型发布。”
不再靠熬夜赶工,而是有标准、有工具、有节奏。
3. 上线不是交付,是一起用
团队开始“吃自己的狗粮”。
Mike 他们最好的工程师现在同时管理三四个 Claude Code 实例:你要更高层次地思考,把任务分解,让每个 Claude Code 处理不同的部分。工程师从写代码变成了管理 AI。
以前,出事了是人先到现场。现在,是 Claude 先到。
这不是演示,是每天真实的工作方式。模型在真实场景中反复迭代。
所以,Sonnet 4.5 发布节奏提速,并不是因为 Claude 更聪明、研究团队更强,而是三件事变了:
客户成了产品定义者,
上线流程像做 App 一样标准、流畅,
团队自己就是用户,模型在真实环境中反复试错。
节奏改变的本质,不是拼速度,而是做流程。
第二节|快还要稳,怎么做到的?
Claude Sonnet 4.5 提速,不只因为发布流程更顺。
更关键的是,它从"工具"变成了能主动协作的 Agent。
Mike 在对话中说:
“我们不只用 Claude 补全代码,它本身就能参与协作。它已经像同事一样,在 Slack 群里值班了。”
✅ 不是模型在答题,而是直接处理问题
Mike 说,他们内部做了一个叫 “Claude On Call” 的 Agent:
“它会在事故发生的第一分钟出现在群里,自动查看指标,快速判断原因,有时还会提醒:要不要检查一下那个服务是不是又挂了。”
这就是 Agent 跟传统 AI 的区别:不是你问它答,而是它自己判断何时该说话、说什么有用。
Mike 给出了内部评分标准,一个真正的 Claude Agent 至少要做到:
- 自主判断:不等指令,能判断何时出场
- 使用工具:调用数据库、搜索资料、写入日志
- 持续学习:不是每次重来,随使用次数变熟练
- 主动协作:能进群、参与流程,不是独立窗口
- 长时运行:任务时间可以是 5 分钟,也可以是 5 小时
人类员工做 100 次任务,应该比第一次做得更好。Claude 也应该这样。
✅ Claude Code:用 Claude 开发 Claude
在整个 Sonnet 4.5 版本里,Claude Code 是最早用上 Agent 能力的场景。
Mike 说,他们现在用 Claude Code 开发 Claude Code 本身。
“它写的不只是几段代码,而是能改动整个项目结构。我们用每个版本的 Claude 去重构 claude.ai 网站,从版本 1 到 4.5,只有 4.5 成功完成了。”
这不仅说明模型能力更强,还说明:
- Claude 能看得懂上下文
- Claude 能规划多步执行
- Claude 能根据实际效果调整做法
而这些能力,已经不再是“问答模型”的范畴,而是 Agent 的核心特征。
✅ SDK 推出:发布的是能接任务的 AI
为了让更多人用上 Claude Agent,Anthropic 推出了 Claude Agent SDK。
简单说,这是一个开发工具包,企业或个人开发者都能用它来:
- 把 Claude 接入自己的内部系统
- 让它拥有某种角色,比如财务顾问、客服助手、个人助理
- 让它能够长时间执行任务,比如跑一个30小时的自动化报表流程
Mike 明确说:
“我们以前叫它 Claude Code SDK,大家以为只能写代码。后来改名叫 Claude Agent SDK,因为它能做的远超写代码。”
第一节讲的是:Claude 发布流程更顺畅。这一节要说的是:Claude 本身也变了。
第三节|Claude SDK,到底能做什么?
Sonnet 4.5 发布后,有个数据引起关注:性能超越 Opus 4.1,成本只有五分之一。
什么概念?
Opus 4.1 曾是 Anthropic 的旗舰模型。现在,一款更轻量的模型在多数任务上都超过了它,运行成本不到 20%。
这像某种算法突破。但 Mike Krieger 的解释很朴实:不是魔法。我们只是把工程做扎实了。
三个关键点,让成本降低 80%:
① 后训练:训练完不上线,持续打磨体验”
Mike 反复提到一个词:“后训练”(post-training)。这是什么意思?
就像做产品不是写完就发布,而是根据用户反馈打磨。模型训练完后也一样,继续根据真实场景调优:
- 更精准的指令遵循(模型更清楚如何响应)
- 更好的风格一致性(输出更专业)
- 更强的执行稳定性(长时间任务不中断)
Mike 说得很直接:
“如果只能做到 50%,那只是演示。要做到 80% 甚至 90%,才能真正帮你完成工作。”
② 工程优化:不是用更多 GPU,是提高资源效率
Claude 能力变强,并不是因为用了更多的 GPU,而是因为 调度、存储、执行都优化了。
Mike 说:
“过去 6 个月,真正进展最大的不是模型结构,是工程优化。”
具体来说:
- 加速器间并行调度更稳定,
- 模型中断概率降低,
- 发布流程标准化。
就像厨房做菜:同样的设备,以前一道菜 30 分钟,现在流程调顺、食材备好、火候可控,10 分钟出菜,还能同时做三道。
不是换了更好的锅,是把整个流程优化了。
③ 小模型追平大模型:靠工艺细节
过去的认知:大模型强但慢,小模型快但弱。
Claude Sonnet 4.5 打破了这个认知。
Mike 明确表示:Sonnet 4.5 的核心不是更大,是更精。它在很多任务上已经超过 Opus,而且更快、更便宜,能承接更多场景。
比如,在 Claude Code 场景中,Sonnet 4.5 是第一个能独立构建完整网站版本的模型。
Mike 说,他们做了一个实验:让每一代 Claude 去重建 claude.ai 网站。
“只有 Sonnet 4.5 做出了真正能用的版本。包括登录、API 调用、前后台页面、权限控制,全部搞定。”
这说明它既懂原理,又能落地。
第四节|德勤怎么用上更快的 Claude?
Claude Sonnet 4.5 很强。
但 Mike Krieger说:
“强不强不是关键,用得上才是。”
这句话背后,是 Anthropic 团队对 AI 工具落地过程的反复观察。
他们发现,大多数企业在面对新模型时,常常卡在两件事上:
- 没时间试用,内部流程跟不上;
- 用是能用,但真正融入业务流程很难。
所以 Anthropic 做了一套"落地工具包",提供能直接上手的模板,不用自己拼技术。
✅ Claude SDK:接入新模型像打开 App
你可以把 Claude SDK 理解成:
一套帮助企业把 Claude 接入业务流程的“接线板”。
Mike 举了几个最常见的用法:
1、客服自动回复:
不用训练自己的模型,直接调用 Claude 做 FAQ 回答
还能根据用户历史提问自动调整语气和风格
2、文档助手:
把企业内部文档、知识库接进 Claude
客户问问题时,Claude 会先“看资料”,再回答,确保说得靠谱
3、内部 AI 助理:
给员工用的,不是对客户的
比如:帮产品经理整理需求文档、帮运营写月报、帮销售生成邮件模板
Mike 强调:我们不是要让企业做出一个大模型平台,而是帮他们做出一个有用的 Claude。
提供的是能直接嵌入业务的 AI 模块。
✅ 内置安全规范:让企业敢用
让企业敢用 AI,不仅要好用,还得放心。
所有部署出来的 Claude Agent,都必须有三重安全机制。
分别是:
身份确认机制: 不让 Agent 冒充人类回答敏感内容
拒答机制: 对于模糊或风险话题,明确说“不知道”或拒绝作答
可追溯机制: 每一次调用、每一个回答,都可以回溯源文档和判断链条
这些机制,都被写在 SDK 默认模板里,企业不需要自己再设计。Anthropic 不希望企业独自承担风险,而是要让 Claude 成为默认可托付的伙伴。
✅ 最大规模落地:德勤 47 万员工部署
(Anthropic 与德勤达成史上最大规模企业部署(来源:CNBC))
Claude 的嵌入式打法已在真实企业落地。
最大规模合作对象之一是德勤。
德勤刚刚宣布:将在全球 150 多个国家、面向 47 万名员工部署 Claude。这是 Anthropic 迄今为止最大规模的企业合作项目。
不同部门用 Claude 的方式也不同。会计师、审计师、软件工程师,都将拥有属于自己的“Claude 角色”,由德勤的 AI 团队定制开发。员工还可以向德勤专门设立的“Claude 卓越中心”求助,像找内部专家一样快速使用 AI。
Anthropic 首席商务官 Paul Smith 说:我们双方都投入了大量资源,包括财力和工程力量。
德勤 CTO Ranjit Bawa 的一席话,道出了背后的核心逻辑:
客户总会问我们:你们自己用了吗?只有我们先用起来,才能更有说服力。
这不是口号,而是示范:AI 不只卖方案,更要让组织自己先转变。
这印证了 Mike Krieger 观点的:模型发布只是开始,真正有价值的是企业内部能跑起来。
结语|企业怎么跟上?答案是"先启动"
Anthropic 的节奏越来越快。Sonnet 4.5 发布仅数月,下一个版本已在路上。
但 Mike Krieger 给出的答案不是追赶模型能力,而是改变使用方式。
企业如何跟上?三个关键:
- 流程要顺:不是临时赶工,而是让 AI 接入变成标准动作
- 先用起来:不等完美方案,先启动一个 Agent 让组织适应
- 默认安全:用 SDK 内置规范,而不是自己从零设计
当模型更新越来越频繁,关键不是有没有 API 权限,而是:
工作流程能否容纳快速变化的 AI?
员工能否在不重构流程的前提下用起来?
有没有一套默认可托付的使用规范?
Claude SDK 的范式是:不需要完美接入,但必须先启动。
启动一个 FAQ Agent、文档助手或邮件生成器,就意味着组织具备了响应变化的能力。
📮参考资料:
https://www.youtube.com/watch?v=GmcTq0Zo8kM&t=933s
https://www.youtube.com/watch?v=aJxnel2_O7Q&t=865s
https://www.cnbc.com/2025/10/06/anthropic-deloitte-enterprise-ai.html#:~:text=Deloitte%20on%20Monday%20announced%20a,companies%20first%20unveiled%20last%20year.
本文来自微信公众号“AI 深度研究员”,作者:AI深度研究员,36氪经授权发布。