字节大模型的收敛之年
2025年2月,DeepSeek刷屏的那个春节,梁汝波在全员会上说了六个字:跟进速度不够。
一年后的2026年2月,豆包2.0发布前夕,火山引擎拿下了春晚独家AI云合作伙伴的身份。从「缺席者」到「造浪者」,中间刚好隔了一整年,365天。
这一年里,阿里疯狂发力,一口气发了上百个模型;腾讯也动了大动作,重组了AI Infra部;百度更直接,把文心给开源了。
唯独字节,出牌频率反而变得特别低,看着有点反常,但它并没缺席这场竞赛,只是把筹码都押在了大家看不见的地方。
这篇年终复盘,只想回答一个问题:字节看不见的押注,是如何在2026年春节前,变成一发不可收拾的?
01
如果说 2023 到 2024 年,字节大模型走的是「突击队」路子,打快仗、抢热点,快速完成从 0 到 1 的布局,那 2025 年,字节大模型正式进入了「吴永辉时间」。
这位被寄予厚望的新帅上任后,做的第一件事,就惊到了整个字节:他直接给Seed团队取消了季度OKR,甚至连半年考核都给撤了。
要知道,字节可是出了名的讲「字节范儿」、喊「Always Day One」,在这样一家公司里,取消考核这事儿,简直就是「政治不正确」。
但吴永辉有他自己的道理:
要是方向从一开始就错了,让大家三个月交一次答卷,只会更快把路走死;字节的DNA是「小步快跑、快速迭代」,可这套逻辑,到了大模型领域,根本不好使。
那时候的字节大模型团队,已经染上了严重的「大公司病」。
2025年初,AI Lab、Seed团队、视觉生成团队、豆包产品技术部,这四支队伍就跟四条平行线似的,各有各的汇报线,各搞各的研发节奏,互不相干。
AI Lab由李航带队,主打学术研究;Seed团队归吴永辉管,重点放在实际应用上;视觉团队刚从阿里挖来周畅,还在磨合,而豆包的技术负责人朱文佳,更是直接向梁汝波汇报。
大家互相抢资源、隐性竞争,甚至出现过同一个需求,四家团队各自埋头做的荒唐事儿。
吴永辉入职后,Seed团队前后搞了三次组织收敛,一步步把分散的力量拧成一股绳。
2025 年 3月份,AI Lab整体并入Seed,李航开始向吴永辉汇报,原来集团级研究部门的光环没了,所有研发力量,都归到了同一个指挥体系下。
到了年中,随着杨建朝暂休,字节从阿里挖来周畅接手视觉多模态团队,文生图 Seedream、文生视频 Seedance 等多模态团队的管理权限,同步纳入 Seed 整体体系,周畅直接向吴永辉汇报,多模态研发与大模型主干能力实现了同频调度。
最关键的一步,在10月份落地,豆包技术负责人朱文佳,直接汇报对象从梁汝波改成了吴永辉。
这是字节为数不多以「收敛」而非「扩张」为核心目的的组织整合。
过去十年,字节擅长分,抖音分出头条、飞书、TikTok。但大模型竞赛的后半程,比的不是谁开的分支多,是谁的主干粗。
为了让这根「技术主干」更扎实,吴永辉入职后,一直鼓励研究员深耕基础研究、积极输出顶会论文,2025 年上半年,Seed 团队在国际顶级学术会议上发布的论文数量,比2024 年同期实现了翻倍增长。
但理想与业务现实之间,终究有需要平衡的鸿沟。
到了三季度,豆包2.0的发布节点越来越近,管理层对发论文也有了新要求:内容必须和正在迭代的核心技术没关系,不能影响产品上线。
2026年1月,梁汝波在全员会上,把核心关键词改了,从之前的「探索智能上限」,变成了「勇攀高峰」和「AI模型能力要做到行业前列」。
从「探索」到「做到」,这七个字的变化,是2025年字节组织调整的全部答案:它不再满足于做一个「参与者」,它要做「第一梯队」,甚至要做「唯一」。
02
组织收敛的效果好不好,最终还得靠产品来检验,2025年上半年,豆包在用户心里的形象,特别分裂。
它聊起天来是真厉害,情绪价值给得足足的,你跟它唠一宿情感八卦、吐吐槽,它都能接住。
可要是你让它查机票、比价格,或者完成一个需要多步骤的任务,它大概率只会给你一段通用攻略,然后,热情地问你还有什么能帮你的吗,根本解决不了实际问题。
「聊天机器」和「办事助理」之间,隔着一道实打实的鸿沟。而字节,选了一条最笨、也最扎实的路来填这个坑:死磕「听懂人话」和「把事办成」这两件事。
2025年11月,豆包的语音对话功能,上线了一个看似不起眼、但实际特别难的功能:同一个音色里,能流畅切换粤语、四川话、东北话、陕西话四种方言,还能识别20种方言。
为了做好这个体验,字节让同一批声优,用不同的方言录制一模一样的语料。这就意味着,录音成本直接翻了一倍,后期的标注工作,复杂度更是呈指数级上升。
有人可能会问,为啥要费这么大劲做方言功能?
答案很简单:打基础,做基建。中国有超过10亿人说方言,这其中,有大量的中老年用户,不会打字、也不熟悉App的操作逻辑,但他们会对着手机说话。
让AI学会方言,是为了让四川的老人、广东的阿姨能毫无门槛地用起来。这是字节在争夺「下一个10亿用户」的入场券。
方言降低了开口的门槛,而「Agent(智能体)」则解决动手的问题。
字节在这条坎上的爬升路径,清晰地写进了2025年的版本日历里,2025年6月11日,豆包1.6版本发布,谭待在发布会上,演示了一个让所有人都眼前一亮的场景:
拍一张购物小票,模型能自动整理成Excel表格;你随口说一句话,模型能自动操作浏览器,帮你完成酒店预订。他把这次升级的核心,总结成了三个字:「行动力」。
到了12月,豆包1.8版本发布,Agent能力又上了一个台阶,能调用十几个工具,在多个电商平台之间来回切换,帮你完成耳机的全网比价,还能选出最优选项。
从「能做一件事」到「能做一系列事」,字节一点点补齐了豆包「办事能力」的短板。但这也带来了一个致命的新问题:成本太高。
Agent执行一次任务,消耗的Token数量,是普通聊天的几十倍。要是单次调用的成本降不下来,哪怕Agent再厉害,也只能停留在实验室里,根本没法大规模推广、给更多人用。
在 2025 年火山引擎春季原动力大会上,谭待曾直言,通过底层技术的持续优化,大模型推理成本未来还有 99% 的下降空间。
这一判断,也为字节后续的成本战、技术债清零,定下了核心基调。
03
2025 年 11 月,火山引擎发布官方公告:Doubao-pro-32k、Doubao-vision-pro-32k 等十余款 2024 年发布的旧版本模型,将逐步停止服务,引导用户迁移到最新的 Seed 系列模型。
这是字节 2025 年最激进、却也最容易被外界忽略的关键动作。
公告发布后,客服收到了大量企业开发者的反馈,毕竟对开发者而言,模型版本切换意味着接口重接、代码重改、全流程回归测试,成本极高。
但字节硬推了。因为谭待算过一笔账:
智能体时代已经到来,大模型的调用量只会迎来指数级增长。到那个时候,如果还背着 2023 年的老版本、2024 年的 Pro 版、各类客户特供版等多套技术架构,成本窟窿只会越来越大,根本填不上。
只有把所有模型的内核统一起来,才能释放规模飞轮的红利。这不仅是清零之前的技术债,更是对商业模式的一次彻底重构。
字节的成本优势,靠「算力精算」,把每一分钱都花在刀刃上。
大模型服务的成本困境,根源很简单,就是一种浪费:「快车要等慢车」。用户的输入请求,有的短到只有10个词,有的长到10万词,把这些请求混在一起处理,系统就得按照最慢的那个来调度,大量的算力就这么被闲置了,特别可惜。
字节的解法是「区间定价」和「PD分离」。
2025年6月,豆包1.6版本,首次推出了「区间定价」:0到32K的输入区间,价格直接打到0.8元/百万tokens,综合成本比1.5版本和DeepSeek R1降低了63%;32K以上的输入,价格再逐级上浮。
这就跟快递打包一个道理,要把所有尺寸的包裹混在一起装,肯定特别浪费空间;要是按尺寸分类打包,至少能省下三分之一的纸箱。
更深层的逻辑是「PD分离」,把处理长文本的「预填充」阶段,和生成文本的「解码」阶段拆开,用不同的硬件、不同的策略来处理,效率一下子就提升了好几倍。
这套逻辑的前提是:所有的优化,只能做一遍。
要是同时维护好几套架构,每做一次优化,就得在每套架构上都来一遍,边际成本永远降不下来;所以说,「旧模型大下架」,是「降价99%」的必要前提,也是字节向全行业发起「成本战争」的宣战书。
数据证明了这一策略的成功。
2025 年 5 月底,豆包日均 Token 调用量已达 16.7 万亿;9月突破30万亿;12月突破50万亿,较2024年同期增长超10倍。IDC报告显示,2025年上半年中国公有云大模型服务市场,火山引擎份额达到49.2%。
当同行在2025年下半年被迫跟进降价时,字节已经通过清掉技术债,获得了结构性的成本优势;这种优势一旦建立,很难被单纯的价格战颠覆。
04
组织收敛了,技术债清了,成本降下来了,最后一块拼图是「节奏」。
字节为什么能从2025年春节的「缺席者」变成2026年春节的「主角」?在我看来,它终于找到了属于自己的研发节奏,它把春节,变成了自己的iPhone发布会,每年都要搞个大动作。
这套「春节锚定法」,是一种「研发倒逼机制」:
别的公司都是按财季规划模型发布,字节却是按春节倒排工期,1月份必须封版,2月份必须上线,前一年夏天,就得把技术路线定死。
2025 年春节的被动,让字节意识到,靠「突击队」模式打游击、追热点,永远只能跟着行业节奏走,永远无法建立自己的领先优势。
而 2026 年春节的全面爆发,正是这套节奏管理的第一次大考:春晚独家 AI 云合作、豆包 2.0、多模态能力的全面升级,这一系列动作,都是吴永辉入职一年来,组织收敛、技术清债、成本优化的集中成果爆发。
据行业媒体披露,2026 年 2 月 14 日,豆包 2.0 将正式发布。这是字节大模型迟到的全面进攻信号,但这场关于通用人工智能的战役,其实才刚刚开始。
站在 2026 年春节的节点回望与前瞻,字节面前,还有三个更难、更长远的课题需要解决。
第一个,是「闭源模式的持续性」。
2025年,阿里开源了Qwen3全系列,衍生模型超17万个,形成了庞大的开源生态;百度开源了文心,甚至连腾讯混元也开始在部分版本上开源。字节是唯一坚持闭源路线的中国大厂。
这套模式能走得通,前提是:
火山引擎的 To B 服务收入,与豆包的 To C 用户黏性,能持续反哺 Seed 团队的巨额研发投入,形成「研发 - 落地 - 营收 - 再研发」的正向循环。
如果下一阶段开源模型能力追平闭源,开发者还会不会为「独家调用权」付费?字节赌「体验优先」,但这是一场孤独的豪赌。
其次,是固定节点锚定的反作用力。
把研发节奏锚定在春节这一个节点上,好处是目标清晰、全链路同频,代价是每年核心的重磅发布,基本只有一次扣扳机的机会。
2025年春节的缺席是代价,2026年春节打响也是代价;如果2027年春节前被对手刻意狙击,或者产品不及预期,代价将是巨大的。
最后是「巨头的底牌」。
腾讯在2025年底重组了AI Infra部,由大模型负责人姚顺雨直接管,手里还握着微信这个有12亿用户的超级入口,一旦腾讯决定把大模型全量导入微信,那流量优势,是字节根本比不了的。
阿里云也没闲着,2025年9月发布了万相2.5,12月又把千问接入了万相2.6。它在开源生态上的厚度,还有在云服务领域的深耕,不是字节用一年时间就能追上的。
还有DeepSeek。没人知道那家创业公司2026年还能拿出什么黑科技。
一年前梁汝波那句「跟进速度不够」,在 2025 年被字节整个大模型团队反复咀嚼,成为了全力奔跑的动力。
2026年春节,字节用一场精密的「造浪」证明了它已经补上了短板,把一支3000人的突击队改装成了有节拍器的正规军。
但大模型的竞赛没有终点。
本可以做得更好的遗憾,字节用 365 天成功改写;但「还可以更好」的追求,是这条赛道上永远划不掉的命题。字节用365天证明了自己会追赶、会切换,它需要下一个365天,证明自己配得上「长期主义者」这个称号。
春节总会再来,字节作为进攻者的战役,才刚刚拉开序幕;不一定对,个人观察。
本文来自微信公众号 “王智远”(ID:Z201440),作者:王智远 王智远,36氪经授权发布。















