字节大模型的收敛之年

王智远·2026年02月12日 17:53

吴永辉主导的，一场反字节式的 AI 变革

2025年2月，DeepSeek刷屏的那个春节，梁汝波在全员会上说了六个字：跟进速度不够。

一年后的2026年2月，豆包2.0发布前夕，火山引擎拿下了春晚独家AI云合作伙伴的身份。从「缺席者」到「造浪者」，中间刚好隔了一整年，365天。

这一年里，阿里疯狂发力，一口气发了上百个模型；腾讯也动了大动作，重组了AI Infra部；百度更直接，把文心给开源了。

唯独字节，出牌频率反而变得特别低，看着有点反常，但它并没缺席这场竞赛，只是把筹码都押在了大家看不见的地方。

这篇年终复盘，只想回答一个问题：字节看不见的押注，是如何在2026年春节前，变成一发不可收拾的？

01

如果说 2023 到 2024 年，字节大模型走的是「突击队」路子，打快仗、抢热点，快速完成从 0 到 1 的布局，那 2025 年，字节大模型正式进入了「吴永辉时间」。

这位被寄予厚望的新帅上任后，做的第一件事，就惊到了整个字节：他直接给Seed团队取消了季度OKR，甚至连半年考核都给撤了。

要知道，字节可是出了名的讲「字节范儿」、喊「Always Day One」，在这样一家公司里，取消考核这事儿，简直就是「政治不正确」。

但吴永辉有他自己的道理：

要是方向从一开始就错了，让大家三个月交一次答卷，只会更快把路走死；字节的DNA是「小步快跑、快速迭代」，可这套逻辑，到了大模型领域，根本不好使。

那时候的字节大模型团队，已经染上了严重的「大公司病」。

2025年初，AI Lab、Seed团队、视觉生成团队、豆包产品技术部，这四支队伍就跟四条平行线似的，各有各的汇报线，各搞各的研发节奏，互不相干。

AI Lab由李航带队，主打学术研究；Seed团队归吴永辉管，重点放在实际应用上；视觉团队刚从阿里挖来周畅，还在磨合，而豆包的技术负责人朱文佳，更是直接向梁汝波汇报。

大家互相抢资源、隐性竞争，甚至出现过同一个需求，四家团队各自埋头做的荒唐事儿。

吴永辉入职后，Seed团队前后搞了三次组织收敛，一步步把分散的力量拧成一股绳。

2025 年 3月份，AI Lab整体并入Seed，李航开始向吴永辉汇报，原来集团级研究部门的光环没了，所有研发力量，都归到了同一个指挥体系下。

到了年中，随着杨建朝暂休，字节从阿里挖来周畅接手视觉多模态团队，文生图 Seedream、文生视频 Seedance 等多模态团队的管理权限，同步纳入 Seed 整体体系，周畅直接向吴永辉汇报，多模态研发与大模型主干能力实现了同频调度。

最关键的一步，在10月份落地，豆包技术负责人朱文佳，直接汇报对象从梁汝波改成了吴永辉。

这是字节为数不多以「收敛」而非「扩张」为核心目的的组织整合。

过去十年，字节擅长分，抖音分出头条、飞书、TikTok。但大模型竞赛的后半程，比的不是谁开的分支多，是谁的主干粗。

为了让这根「技术主干」更扎实，吴永辉入职后，一直鼓励研究员深耕基础研究、积极输出顶会论文，2025 年上半年，Seed 团队在国际顶级学术会议上发布的论文数量，比2024 年同期实现了翻倍增长。

但理想与业务现实之间，终究有需要平衡的鸿沟。

到了三季度，豆包2.0的发布节点越来越近，管理层对发论文也有了新要求：内容必须和正在迭代的核心技术没关系，不能影响产品上线。

2026年1月，梁汝波在全员会上，把核心关键词改了，从之前的「探索智能上限」，变成了「勇攀高峰」和「AI模型能力要做到行业前列」。

从「探索」到「做到」，这七个字的变化，是2025年字节组织调整的全部答案：它不再满足于做一个「参与者」，它要做「第一梯队」，甚至要做「唯一」。

02

组织收敛的效果好不好，最终还得靠产品来检验，2025年上半年，豆包在用户心里的形象，特别分裂。

它聊起天来是真厉害，情绪价值给得足足的，你跟它唠一宿情感八卦、吐吐槽，它都能接住。

可要是你让它查机票、比价格，或者完成一个需要多步骤的任务，它大概率只会给你一段通用攻略，然后，热情地问你还有什么能帮你的吗，根本解决不了实际问题。

「聊天机器」和「办事助理」之间，隔着一道实打实的鸿沟。而字节，选了一条最笨、也最扎实的路来填这个坑：死磕「听懂人话」和「把事办成」这两件事。

2025年11月，豆包的语音对话功能，上线了一个看似不起眼、但实际特别难的功能：同一个音色里，能流畅切换粤语、四川话、东北话、陕西话四种方言，还能识别20种方言。

为了做好这个体验，字节让同一批声优，用不同的方言录制一模一样的语料。这就意味着，录音成本直接翻了一倍，后期的标注工作，复杂度更是呈指数级上升。

有人可能会问，为啥要费这么大劲做方言功能？

答案很简单：打基础，做基建。中国有超过10亿人说方言，这其中，有大量的中老年用户，不会打字、也不熟悉App的操作逻辑，但他们会对着手机说话。

让AI学会方言，是为了让四川的老人、广东的阿姨能毫无门槛地用起来。这是字节在争夺「下一个10亿用户」的入场券。

方言降低了开口的门槛，而「Agent（智能体）」则解决动手的问题。

字节在这条坎上的爬升路径，清晰地写进了2025年的版本日历里，2025年6月11日，豆包1.6版本发布，谭待在发布会上，演示了一个让所有人都眼前一亮的场景：

拍一张购物小票，模型能自动整理成Excel表格；你随口说一句话，模型能自动操作浏览器，帮你完成酒店预订。他把这次升级的核心，总结成了三个字：「行动力」。

到了12月，豆包1.8版本发布，Agent能力又上了一个台阶，能调用十几个工具，在多个电商平台之间来回切换，帮你完成耳机的全网比价，还能选出最优选项。

从「能做一件事」到「能做一系列事」，字节一点点补齐了豆包「办事能力」的短板。但这也带来了一个致命的新问题：成本太高。

Agent执行一次任务，消耗的Token数量，是普通聊天的几十倍。要是单次调用的成本降不下来，哪怕Agent再厉害，也只能停留在实验室里，根本没法大规模推广、给更多人用。

在 2025 年火山引擎春季原动力大会上，谭待曾直言，通过底层技术的持续优化，大模型推理成本未来还有 99% 的下降空间。

这一判断，也为字节后续的成本战、技术债清零，定下了核心基调。

03

2025 年 11 月，火山引擎发布官方公告：Doubao-pro-32k、Doubao-vision-pro-32k 等十余款 2024 年发布的旧版本模型，将逐步停止服务，引导用户迁移到最新的 Seed 系列模型。

这是字节 2025 年最激进、却也最容易被外界忽略的关键动作。

公告发布后，客服收到了大量企业开发者的反馈，毕竟对开发者而言，模型版本切换意味着接口重接、代码重改、全流程回归测试，成本极高。

但字节硬推了。因为谭待算过一笔账：

智能体时代已经到来，大模型的调用量只会迎来指数级增长。到那个时候，如果还背着 2023 年的老版本、2024 年的 Pro 版、各类客户特供版等多套技术架构，成本窟窿只会越来越大，根本填不上。

只有把所有模型的内核统一起来，才能释放规模飞轮的红利。这不仅是清零之前的技术债，更是对商业模式的一次彻底重构。

字节的成本优势，靠「算力精算」，把每一分钱都花在刀刃上。

大模型服务的成本困境，根源很简单，就是一种浪费：「快车要等慢车」。用户的输入请求，有的短到只有10个词，有的长到10万词，把这些请求混在一起处理，系统就得按照最慢的那个来调度，大量的算力就这么被闲置了，特别可惜。

字节的解法是「区间定价」和「PD分离」。

2025年6月，豆包1.6版本，首次推出了「区间定价」：0到32K的输入区间，价格直接打到0.8元/百万tokens，综合成本比1.5版本和DeepSeek R1降低了63%；32K以上的输入，价格再逐级上浮。

这就跟快递打包一个道理，要把所有尺寸的包裹混在一起装，肯定特别浪费空间；要是按尺寸分类打包，至少能省下三分之一的纸箱。

更深层的逻辑是「PD分离」，把处理长文本的「预填充」阶段，和生成文本的「解码」阶段拆开，用不同的硬件、不同的策略来处理，效率一下子就提升了好几倍。

这套逻辑的前提是：所有的优化，只能做一遍。

要是同时维护好几套架构，每做一次优化，就得在每套架构上都来一遍，边际成本永远降不下来；所以说，「旧模型大下架」，是「降价99%」的必要前提，也是字节向全行业发起「成本战争」的宣战书。

数据证明了这一策略的成功。

2025 年 5 月底，豆包日均 Token 调用量已达 16.7 万亿；9月突破30万亿；12月突破50万亿，较2024年同期增长超10倍。IDC报告显示，2025年上半年中国公有云大模型服务市场，火山引擎份额达到49.2%。

当同行在2025年下半年被迫跟进降价时，字节已经通过清掉技术债，获得了结构性的成本优势；这种优势一旦建立，很难被单纯的价格战颠覆。

04

组织收敛了，技术债清了，成本降下来了，最后一块拼图是「节奏」。

字节为什么能从2025年春节的「缺席者」变成2026年春节的「主角」？在我看来，它终于找到了属于自己的研发节奏，它把春节，变成了自己的iPhone发布会，每年都要搞个大动作。

这套「春节锚定法」，是一种「研发倒逼机制」：

别的公司都是按财季规划模型发布，字节却是按春节倒排工期，1月份必须封版，2月份必须上线，前一年夏天，就得把技术路线定死。

2025 年春节的被动，让字节意识到，靠「突击队」模式打游击、追热点，永远只能跟着行业节奏走，永远无法建立自己的领先优势。

而 2026 年春节的全面爆发，正是这套节奏管理的第一次大考：春晚独家 AI 云合作、豆包 2.0、多模态能力的全面升级，这一系列动作，都是吴永辉入职一年来，组织收敛、技术清债、成本优化的集中成果爆发。

据行业媒体披露，2026 年 2 月 14 日，豆包 2.0 将正式发布。这是字节大模型迟到的全面进攻信号，但这场关于通用人工智能的战役，其实才刚刚开始。

站在 2026 年春节的节点回望与前瞻，字节面前，还有三个更难、更长远的课题需要解决。

第一个，是「闭源模式的持续性」。

2025年，阿里开源了Qwen3全系列，衍生模型超17万个，形成了庞大的开源生态；百度开源了文心，甚至连腾讯混元也开始在部分版本上开源。字节是唯一坚持闭源路线的中国大厂。

这套模式能走得通，前提是：

火山引擎的 To B 服务收入，与豆包的 To C 用户黏性，能持续反哺 Seed 团队的巨额研发投入，形成「研发 - 落地 - 营收 - 再研发」的正向循环。

如果下一阶段开源模型能力追平闭源，开发者还会不会为「独家调用权」付费？字节赌「体验优先」，但这是一场孤独的豪赌。

其次，是固定节点锚定的反作用力。

把研发节奏锚定在春节这一个节点上，好处是目标清晰、全链路同频，代价是每年核心的重磅发布，基本只有一次扣扳机的机会。

2025年春节的缺席是代价，2026年春节打响也是代价；如果2027年春节前被对手刻意狙击，或者产品不及预期，代价将是巨大的。

最后是「巨头的底牌」。

腾讯在2025年底重组了AI Infra部，由大模型负责人姚顺雨直接管，手里还握着微信这个有12亿用户的超级入口，一旦腾讯决定把大模型全量导入微信，那流量优势，是字节根本比不了的。

阿里云也没闲着，2025年9月发布了万相2.5，12月又把千问接入了万相2.6。它在开源生态上的厚度，还有在云服务领域的深耕，不是字节用一年时间就能追上的。

还有DeepSeek。没人知道那家创业公司2026年还能拿出什么黑科技。

一年前梁汝波那句「跟进速度不够」，在 2025 年被字节整个大模型团队反复咀嚼，成为了全力奔跑的动力。

2026年春节，字节用一场精密的「造浪」证明了它已经补上了短板，把一支3000人的突击队改装成了有节拍器的正规军。

但大模型的竞赛没有终点。

本可以做得更好的遗憾，字节用 365 天成功改写；但「还可以更好」的追求，是这条赛道上永远划不掉的命题。字节用365天证明了自己会追赶、会切换，它需要下一个365天，证明自己配得上「长期主义者」这个称号。

春节总会再来，字节作为进攻者的战役，才刚刚拉开序幕；不一定对，个人观察。

本文来自微信公众号 “王智远”（ID：Z201440），作者：王智远王智远，36氪经授权发布。

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

字节大模型的收敛之年

01

02

03

04

最近内容

下一篇