豆包跨越「临界点」后,字节AI下一步怎么走?

时间线Timelines·2026年06月24日 20:00
豆包专业版也正式上线了。

2026 年 2 月 5 日,Anthropic 发布了旗下的最新模型成果 Claude Opus 4.6,并且随之宣布:

在 AI 彻底改变软件编程行业的工作方式后,现在是时候进军更广泛的职场了。

紧接着,这一模型发布之后,多家金融服务公司的股价在当日应声跳水。其中,金融数据和软件公司 FaceSet 跌幅超 8%,创 2020 年 3 月以来新低;老牌信息服务提供商 Thomson Reuters 跌超 7%,创 2021 年以来新低。

可以说,Opus 4.6 凭借一己之力,将 AI 带来的美股「SaaS 末日」恐慌潮,又一次推向了新高度。

而站在今天的视角来看,当时资本市场的反应之所以这么激烈,本质上,就是因为 Opus 4.6 展现出了一项对人类来说堪称「恐怖」的能力:AI 能像人一样独立完成复杂工作,也就是能够扮演「AI 员工」的替代性角色。

也正是因为如此,四个多月后的 2026 年 6 月 23 日,在火山引擎年度重磅活动 FORCE 原动力大会上,火山引擎总裁谭待在谈到 Claude Opus 4.6 时表示,在全球范围内,它已经率先跨越了 Coding 与 Agent 领域的一个「质变点」。

与此同时,谭待强调,在视频生成模型领域,字节跳动旗下的 Seedance 2.0 也已经跨越了这个「质变点」。

当然,在字节的 AI 视野中,模型跨越「质变点」,其实仅仅是一个开始。

豆包 2.1 的双重进击

从整体来看,这场火山引擎 FORCE 原动力大会的绝对主角,是豆包大模型 2.1 Pro。

细分来看,作为字节跳动自研大模型的主体,豆包大模型在经历了两年有余的迭代之后,正式升级到 2.1 版本。不过,豆包大模型 2.1 是一个模型系列,包括豆包大模型 2.1 Pro 和豆包大模型 2.1 Trubo。

其中,豆包大模型 2.1 Pro(以下或简称豆包 2.1 Pro)是该系列的旗舰模型。

在具体的能力上,豆包 2.1 Pro 注重在 Coding(编程)、Agent(智能体)、VLM(视觉语言模型)三大核心方向实现能力跃升。

而它更加具体的对标对象,就是已经跨越了「质变点」的 Claude Opus 4.6。

比如,在 Coding 方面,评测成绩显示,豆包 2.1 Pro 在Terminal Bench 2.1、SWE-Pro、SciCode 等代码评测中进入第一梯队——其中在业界公认最贴近真实研发的终端编程评测Terminal Bench 2.1上,豆包 2.1 Pro 已经非常接近 Claude Opus 4.7。

在 Agent 与多模态方面,豆包 2.1 Pro 模型在 GDPval、OSWorld、MobileWorld、MMMU-Pro 等评测中有不俗表现。其中,在更能体现工具调用能力的 MCP-Atlas 评测集上,豆包大模型 2.1 Pro 超过 Opus4.7 与 GPT 5.5。

总体来看,无论是 Coding 还是 Agent,豆包 2.1 Pro 的表现确实都比较亮眼。

在采访环节,谭待表示,豆包 2.1 Pro 在一系列评测数据上已经比较稳定底超过 Opus 4.6,在某种情况下跟 4.7、4.8 是持平的,这说明豆包大模型 2.1 Pro 也是一个跨越了生产力质变点的模型。

也就是说,通过对 Opus 4.6 的对标和超越,豆包 2.1 Pro 已经超越了「质变点」。

在大会现场,谭待还专门谈到了一个案例:在一项芯片设计 RTL 的测试中,豆包 2.1 Pro 连续运行近 18 小时,经历 9 轮迭代,跑通了仿真、测试、综合检查等完整工程流程,展现出模型在真实工程场景里的生产级 Coding 交付能力。

在另外一个案例中,一位开发者将豆包 2.1 Pro 用于多模态 3D 城市构建,调度了 500 多个 Agent 协同作业,在跨工具、长链路里稳定调用建模、渲染、贴图等十余种工具,累计触发工具调用上千次,最终在同一张大地图上建成 100+ 栋造型、材质、颜色均不同的建筑,并且完成多轮自我迭代与全景成片。

这些都可以说是豆包 2.1 Pro 在真实生产场景中的应用案例。

当然,在能力上跟进 Opus 4.6 之外,豆包 2.1 Pro 在价格上也体现出明显的优势。

根据现场发布信息,豆包 2.1 Pro 每百万 Tokens 输入价格为 6 元、输出价格为 30 元,缓存命中价格仅 1.2 元;其综合使用成本较 Claude Opus 4.6 降低近 80%。不仅如此,面向高频调用场景的豆包 2.1 Turbo,价格进一步降至豆包 2.1 Pro 的一半,性价比更高。

总体可见,作为豆包大模型核心能力的承载者,豆包 2.1 Pro 正在力图通过技术能力和价格层面的双重优势,来在生产力场景中获得更广泛的认可。

值得一提的是,就在豆包 2.1 系列大模型发布的次日,豆包专业版也正式上线——它的核心价值点在于帮助专业用户处理复杂工作,比如豆包办公任务模式支持操作本地电脑、使用浏览器、调用 Skills、定时任务等能力,其连续包月价格在 68 元和 500 元之间。

跨越「质变点」之后

在 Coding 和 Agent 之外,视频生成领域,其实是另外一个故事。

如果说豆包 2.1 Pro 的出现是为了在 Coding 和 Agent 领域跨越「质变点」,那么,在本次火山引擎 Force 原动力大会上,视频生成模型 Seedance 2.5 的重磅亮相,则是回答另外一个关键问题:

跨越「质变点」之后,模型又该如何进化?

时间再次回溯到 2026 年 2 月——当时,字节跳动上线了旗下视频生成模型的最新版本,也就是 Seedance 2.0 模型。这个模型发布后,在全球范围内引发热潮,其文本生成多镜头电影级视频的能力被业界称为「导演级 AI」。

甚至有影视内容创作者称,Seedance 2.0 是目前唯一让他产生强烈危机感的 AI 模型。

而在本次 Force 原动力大会上,火山引擎总裁谭待表示,Seedance 2.0 是第一个跨过了「生产质变点」的视频生成模型。

那么,为什么说 Seedance 2.0 跨越了「生产临界点」?

一方面,从落地的角度,越来越多的创作者和企业都在使用 Seedance 2.0 来把相应的创意转化为视频,而且 Seedance 2.0 不仅已经落地在广告、电商运营等领域,同时也被应用于工业制造、具身智能、智能驾驶等实体经济领域。

另一方面,则是有着更加明确的实际使用数据做支撑。

在采访环节,火山引擎总裁谭待透露了一个非常具象化的使用数据:在 Seedance 2.0 发布之前,很多人认为视频生成只是玩具,实际周末的调用次数是远大于工作日的——但是,在 Seedance 2.0 出来之后,工作日的负载和使用次数是远大于周末的。

谭待表示,这说明大家是在办公的时候使用 Seedance 2.0,在生产的环境用它,在数据合成的时候各个方面使用它——这也充分说明了 Seedance 2.0 已经超越了生产质变点。

那么,在超越「质变点」之后,Seedance 又该如何发展?

从这次最新发布的动态来看,Seedance 2.5 的提升点在于三个重要方面:能够实现更长的 30 秒单段原生视频生成直出,最多支持 50 个全模态素材联合生成,以及保持画面一致性的局部编辑。火山引擎表示,Seedance 2.5 模型将在七月初正式上线。

有意思的是,除了生成效果的提升,Seedance 的发展也延伸到了 IP 保护。

会上,火山 AI 版权商业化平台预览发布,为版权 IP 所有方和创作者搭建合作桥梁,让经典 IP 以 AI 的方式焕发新生。目前,火山引擎已与周星驰旗下比高集团合作,获得三部周星驰影片 AI 创作授权,依托 Seedance 2.0 推出的 AI 创作模板的单日创作量也超过 10 万次。

值得一提的是,除了 Seedance 2.5 的发布,火山引擎还展示了豆包图像创作模型 Seedream 5.0 Pro 和豆包音频生成模型 Seed-Audio 1.0。

其中,Seedream 5.0 Pro 具备交互式精准编辑、多图层分离、高密度信息表达和原生多语种文字生成等能力,可直接生成可编辑分层设计图和复杂信息图。而 Seed-Audio 1.0 具备 0 样本多模态参考能力,支持一次生成多角色对白、背景音乐和拟音特效。

建而言之,在多模态领域,豆包依旧在各方面的能力上持续进化。

火山 MaaS 的新角色

对于火山引擎来说,大模型能力的提升固然是最为重要的;但与此同时,如何把大模型的能力转化为商业回报,也是非常重要的一个课题。

目前来看,火山引擎已经在 AI 模型的落地和商业化方面取得了不错的成绩。

据谭待披露,截至 2026 年 6 月,豆包大模型日均 Token 调用量已突破 180 万亿,过去一年增长超 10 倍。与此同时,目前已有超过 110 万企业和个人使用火山方舟大模型服务,年 Token 调用量超过 1 万亿的企业已达 200 家,半年内增长一倍。

这些企业,也已经覆盖了互联网、制造、金融、汽车等多个行业。

在大会现场,火山引擎还引用了 IDC 在 2026 年 5 月份发布的一个数据:若按照 Token 份额计算,在中国公有云 MaaS 服务市场,火山引擎以 49.5% 的市场份额位居第一。

因此,在本次 FORCE 原动力大会上,在发布了一系列豆包大模型的最新成果之外,火山引擎还推出了一系列 AI 使用工具来赋能于企业。

具体来看,火山引擎再次升级了 AI 云原生架构,发布了方舟 CLI 命令行工具,支持开发者通过一行指令将 Agent 接入火山方舟;同时升级 AgentKit 与 HiAgent 3.0,并推出 ArkClaw 企业版 Agent 工作台和 AI Trust 产品体系,完善企业 Agent 应用的基础设施与安全能力。

那么,火山引擎下一步的发展路径是什么?

面对这个问题,火山引擎总裁谭待表示,AI 最核心是两个事情,第一是模型能力的提升,这是一个很关键的地方,特别是要跨越生产级的质变点;第二是把这个模型带到企业里面去。

关于大模型能力的发展,谭待表示,如果说去年是跑了 500 米,今年就是跑了一公里多一些——这一公里,正是跨越生产级的质变点。

但谭待也明确强调,「大模型能力的发展,依旧是处于早期阶段」。

而与此同时,谭待还表示,对于火山引擎来说,Harness 能力的提升,与大模型的能力提升,也很重要,这也是火山引擎要着力于构建 AI 原生架构的核心逻辑——从最核心的模型到上面的 MaaS,再到一系列的 AI 工作台,核心就是帮助企业更好做 AI 的落地,实现业务增长。

在采访环节,谭待还专门谈到了关于自研 DPU、算力配置等问题。

他表示,火山引擎很早就开始自研 DPU,目前已经到 3.0 阶段,核心在于更好地把负载卸载下来,从而提升整体效率——而火山引擎之所以能够在 AI 方面跑得比较快,核心原因还是底层基础架构的耕耘。

在国产算力层面,谭待表示,目前火山引擎采用了多种算力芯片,其中包括一定占比的国产算力,同时也做了各种各样适配来把各类算力综合利用起来,这也是火山方舟本身比较擅长的地方。

另外,在采访过程中,谭待也反复强调了火山 MaaS 的重要性,这也印证了字节跳动 CEO 梁汝波的一句话:火山 MaaS 业务,正在变成字节的基础业务。

总结来看,以大模型的开发、落地和应用为抓手,火山引擎已经建立了一整套基于 AI 的原生业务体系——而毫无疑问,持续推动大模型的能力提升和价值落地,依旧是字节跳动在 AI 时代构建核心竞争力的重中之重。

从这个角度来看,无论是豆包 2.1 Pro,还是 Seedance 2.5,这些已经跨越了「临界点」的最新模型成果,本质上都是字节跳动与火山引擎在攀登 AI 高峰道路上的一个节点。而正如梁汝波所言,AI 的发展仍处于早期阶段,而这条属于字节 AI 的攀登之路也还很长。

本文来自微信公众号“时间线 Timelines”,作者:308,36氪经授权发布。

+1
2

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

2026年灵巧手赛道升温,融资密集,产业化仍存挑战

2小时前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业