36氪独家|2026 年字节 AI 的四个关键命题

阿菜cabbage·2026年06月04日 14:06
世界模型、Seedance、Coding、豆包商业化。

文|周鑫雨

编辑|张雨忻 杨轩

《智能涌现》从多个信源处独家获悉,2026 年,字节 AI 有四个重要的命题:

加大对世界模型训练的投入,年底前,模型性能达到现阶段世界模型全球  SOTA(最佳)Google Genie 3 的水平。

视频模型继续保持领先地位,探索“动态生成”等新方向。

进一步打好 Coding 的地基,做好 Coding 的 Dogfooding(数据回流、评测,形成飞轮),提升 Agent 能力。

豆包强化商业化能力,重点场景是“办公”。

字节的未竟之地:世界模型

如今,字节的 AI 矩阵中,有让字节终于得以进入中国大模型第一梯队的 Seed 2.0,还有做到世界 SOTA 水平的 Seedance 2.0,另外在应用侧,豆包也形成了断层式领先——我们从多方了解到,2026 年春节过后,豆包 DAU 达到 2 亿

“没有明显短板。”一名大厂 AI 战略如此评价字节的 AI 业务矩阵。

但在一众模型中,唯独少了大模型研究下一阶段的关键:世界模型。

几名接近 Seed 团队人士告诉我们,字节是入场世界模型赛道较晚的玩家。2024 年,刚从阿里加入字节的周畅,扛起了世界模型研究的大旗

但当时内部的判断是,世界模型路线和商业化场景还不明确,更重要的是打好视频模型的仗。

直到 2025 年,字节才在小范围内成立研究组,开始对世界模型中的 VLA(视觉-语言-动作模型)路线进行探索。带队人有两位:

一是字节 AI Lab 负责人李航——2025 年 4 月,AI Lab 整体(包含 Robotics 团队)并入了 Seed,目的之一是提升模型和应用(具身智能)之间的沟通效率——主要基于仿真数据进行世界模型训练。

另一位是 Seed 多模态研究员王文千,主要基于自然数据做训练。

来到 2026 年,吴永辉终于在 Seed 全员会上为世界模型设立了一个明确的目标:2026 年底之前至少发布一版世界模型,性能对标目前的世界 SOTA(最佳)—— Google 在 2025 年 8 月发布的 Genie 3

但从目前的进度来看,追赶的速度不够。一位接近 Seed 人士告诉我们,吴永辉多次在 Seed 内部会直言字节世界模型和具身智能的效果不及预期。

另有 Seed 成员透露,根据内部评测,截至2026年初,字节世界模型的综合性能距离全球 SOTA 还存在 10% 的差距。

但这场仗代表未来。

一方面,世界模型的下游,便是至少千亿美金体量的具身智能市场,以及想象空间极大的游戏和娱乐场景。

一名前 Seed 研究员曾对我们表示,字节机器人此前的落地场景主要为物品运输、工业搬运,但内部判断天花板较低,“市场前景更广阔的人形机器人是字节一定会入局的方向。”

另一方面,世界模型的路线仍然存在诸多非共识,包括视频生成派、VLA(视觉-语言-动作模型)派、JEPA(像素预测)派等。

“赌,以字节的人才密度和资金投入,大概率能赢。”一名AI投资人对我们分析,“不赌,则一定会输。”

围绕跻身世界第一梯队的目标,2026年以来,字节针对世界模型训练,也已经做了不少调整。

《智能涌现》得知,2026年春节后,Seed 新设立了一支世界模型研究组,负责人为前Meta FAIR Lab研究员范浩奇,汇报给 Seed 多模态和世界模型负责人周畅;

与此同时,原来李航和王文千带领的两个 VLA 研究组合并,统一向周畅汇报。

多名知情人士告诉《智能涌现》,原来李航和王文千的研究组所探索的路线,主要是 VLA,追求“即兴”、“真实”,目标应用场景是具身智能;而范浩奇带领的新队伍走的则是 3D 仿真路线,主打娱乐和游戏这类应用场景。

除了人力和探索路线的扩张,世界模型在资金投入上也是文本、Coding、视频等多个模型方向中最高的一个。

很显著的是数据预算。一名字节数据平台的员工告诉我们,训练数据“走量”的策略,此前在 LLM(大语言模型)和 Seedance 2.0 上取得了显著收益,团队计划将同样的“数海战术”应用在世界模型的训练上。

这也对应着更高昂的数据投入——我们从多方了解到,2026 年,字节批给世界模型的训练数据(包括VLA、长视频、3D 等模态)的预算,在各个模态中是最高的,金额达到数千万元。

一名数据供应商提到,字节在世界模型上的数据投入,能达到其它厂商的 3-4 倍。

Coding :追求更极致的数据工程

Coding 能力是基础,是决定 Agent 效果上限的关键——这已成为业界的共识。

多名知情者曾对我们提及字节对 Coding 的重视。“字节对 Coding 的投入一直很高,仅次于今年的世界模型。”有接近 Seed 的人士告诉《智能涌现》。

比如,内部会定向采购数据,或是研究 Claude Code、CodeX 等海外顶尖 Coding 模型的训练数据 demo。

在 2025 年的火山引擎 Force 大会上,字节跳动技术副总裁洪定坤也表示,Coding 作为一种高度结构化、逻辑严密的任务,对模型理解复杂的语义结构、逻辑推理、算法设计和精确表达都有很高的要求,能助力模型智能上限的探索。

但在外界,字节 Coding 业务的存在感一直不强。无论是 2025 年 11 月发布的模型 Doubao-Seed-Code,还是 2025 年初发布的 AI 编程工具 Trae,效果和声量都不及智谱的 GLM 5 和月之暗面的 K2。

“字节 Coding 效果难以取得突破的原因在于缺少数据回流。”一名知情者评价。由于模型能力有限,字节相关业务都不愿意使用 Seed-Code。

就连 AI Coding 应用 Trae,最早接入的也是 DeepSeek 和 Claude Code,以及产品内部自己训练的 Coding 模型。

这就导致,字节 Coding 模型缺少来自真实应用场景的反馈。

2026 年以来,不少字节员工感受到,各个业务方正在加大对 Seed 模型的支持力度。一名 Seed 员工告诉《智能涌现》,原来字节并不限制业务侧使用第三方 Coding 模型做开发,但 2026 年以来,多个应用部门被强制要求使用 Seed 模型。

不过,在更极致的数据投入下,Seed 在人才招聘上的速度倒是稍有放缓。

有AI 圈猎头告诉《智能涌现》,字节 HR 现在对外释放的信号是:粗放高薪招聘的时代已经结束了,接下来的命题是内部培养、提拔年轻人才,提高算法待遇。

如今,Seed 为数不多的招聘口子,主要开放给了来自DeepSeek,以及OpenAI、DeepMind、Meta 等海外大厂的 AI 人才,比如前 DeepSeek 核心成员郭达雅、前英伟达研究员董鑫。

Seedance 如何保持 SOTA 地位

2026 年字节在 AI 模型上的另一个重点,则是维持 Seedance 在全球视频生成领域的 SOTA 地位。

“Seedance 2.0 的胜利,是数据的胜利。”某视频生成初创企业的创始人曾对《智能涌现》这样评价 Seedance 2.0。我们得知,庞大的训练数据量和超过 2000 人的评测团队,造就了 Seedance 2.0 的亮眼效果。

但持续靠“走量”的训练方式也存在隐忧。一些研究表明,视频生成领域存在“Anti-Scaling Law”现象,简单而言,训练数据越多,模型越容易“偷懒”,只学习某些关键帧,而忽视完整叙事——因此,越到训练后期,数据“走量”的收益往往越低。

两名数据侧的知情人士告诉我们,Seedance在预训练上已经做到了天花板,接下来想要提升性能,就必须清洗训练数据,进行更精细的后训练。

与此同时,“动态生成”能力是 2026 年 Seedance 团队关注的新方向。

所谓的“动态生成”,也就是互动视频,指的是用户可以输入指令,随时调整视频生成的内容和剧情。在这一赛道上,已经跑出了估值高达 13.2 亿美金的Vivix AI(前商汤高级研究总监刘宇创立)。

多名知情者告诉《智能涌现》,周畅一直十分看好动态生成的落地前景。

“互动视频可以做成小游戏,也可以做互动剧集,同时也能和世界模型的探索接轨(视频生成也是世界模型的一条探索路径)。”一名接近 Seed 人士表示。

加速豆包的商业化和出海

36氪曾独家报道,豆包预计将在 6 月下旬正式上线付费内容;与此同时,豆包也在计划与抖音电商打通,完善付费场景。

2026 年 5 月初,豆包曾在 App Store 中更新过付费订阅方案,月订阅价格在免费到500元不等。

6 月 3 日,豆包官方也宣布,即将针对专业人群的生产力需求推出“豆包专业版”,包含软件开发、数据分析、专业设计、流程自动化、金融分析、科学研究等专业服务。

多名知情者透露,春节后,豆包 DAU 已经突破 2 亿。“今年豆包的投流预算很低。”在一名知情者看来,高 DAU 带来的是高昂的推理成本和运维压力,豆包在这个时间点推进商业化,带有降一降增长的增速,以及自我造血的双重目的。

而 PPT 生成,是豆包建立用户付费心智的核心切入点。“豆包希望加强 PPT 生成功能,是为了面向金融、法律等高净值行业的白领收费。”一名接近豆包人士告诉《智能涌现》,下一阶段,豆包还计划推出企业版,与企业内部的系统打通,但内部仍在讨论具体的结合方式

他表示,这一想法,是受到了海外模型商业模式的启发。目前,面向办公场景收费这条商业化路径,在海外已经得到了验证。据 Anthropic 披露的数据,Claude Code 上线仅 6 个月,ARR 就达到了 10 亿美元;上线一年后,2026 年 2 月的 ARR 已经达到了 25 亿美元。

面向企业开发场景的 Claude Code 带来的可观现金流,也让成立比 OpenAI 晚了 6 年的 Anthropic,在今年年初一跃反超 OpenAI 的 ARR。

那么现在,豆包要解决的问题就是把自己的用户心智从一个可以免费问一切的“通用入口”转变为一个虽然要花钱但能帮你提高效率的“办公助手”。

不过,豆包想进入的这个市场已经开始拥挤。有豆包人士对智能涌现提到,在调研企业客户的过程中,字节发现企业 AI 工具市场已经被不少行业 AI 解决方案供应商占领,迟来的豆包必然要面对更高的获客成本。

《智能涌现》了解到,出海也是豆包今年的重要命题之一。

此前,据《界面新闻》报道,豆包海外版应用 Dola 在 2025 年底的 DAU 已经突破千万。《智能涌现》了解到,Dola 2026 年的增长目标为:年底达到 3000万 DAU。

一名知情人士表示,小语种国家是 Dola 面向的主要市场。目前,海外 AI Chatbot 市场,已经基本被 ChatGPT、Claude、Gemini 占据。不在欧美市场与“AI 御三家”正面对抗,差异化切入小语种市场,是 Dola 的增长策略。

第三方数据显示,2025 年下半年以来,Dola 频频登上印尼、马来西亚、墨西哥等国家的应用商店下载榜。

——

加入字节一年来,吴永辉的命题就是带领 Seed 一边修 Bug,一边做 SOTA 模型。而 2026 年,在AI 的每一个战场中,字节的目标都是做赢家。

如今,Seed 2.0、Seedance 2.0 成果初显,Seed 积累的工程、数据经验、人才,也将会以更高效的方式,复用到新一轮战争中。

(《智能涌现》作者邓咏仪对本文亦有贡献。)

封面来源|AI生成、视觉中国

欢迎交流!

欢迎交流!

+1
62

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

AI时代价格理论复归,开放市场才能催生新需求新生态

1小时前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业