早已“破圈”的庞天宇, 能带领腾讯混元“破圈”吗?

字母AI·2026年01月31日 13:00
姚顺雨之后,腾讯AI又迎来一位95后顶尖科学家。

加入腾讯这件事,庞天宇是在小红书上自宣的。昨天,他在实名账号上发了一则招聘启事,顺带确认了“最近加入腾讯混元”。

庞天宇是清华大学计算机系博士、前新加坡Sea AI Lab高级研究科学家,他也成为腾讯在近期继前OpenAI研究员姚顺雨之后,招揽到的第二位95后顶尖AI科学家。

在分工上,庞天宇和姚顺雨并非从属关系。公开报道显示,庞天宇将担任腾讯混元大模型团队首席研究科学家,以及多模态强化学习技术负责人。而姚顺雨此前披露的分工中,除了“CEO首席科学家”的title之外,他还担任AI Infra部和大语言模型部负责人。

值得关注的是,腾讯引以为傲的混元3D系列,包括世界模型等业务,在去年进行的团队架构大整合中,都归属到了多模态部门旗下。

和相对“低调”的姚顺雨不同,庞天宇在中文互联网有过“破圈”的经历。早在2021年,他就以清华博士生身份登上综艺《燃烧吧!天才程序员》,成为少数被公众熟知的青年AI研究员之一。在知乎等论坛上,庞天宇也一直以实名活跃参与交流。

加入腾讯后,庞天宇第一时间在小红书“自宣”。这种“网红”风格的操作,其实也是近年来AI圈的行业风向:过去一年,社交媒体成了AI圈连接器——科研大佬、AI负责人在上面招聘、分享成果,各家企业都有“高P大佬”实名发帖。

而在腾讯内部,马化腾一边在员工大会上强调“稳扎稳打”,一边亲自为“元宝派”AI社交新玩法站台,并推出春节10亿元现金红包活动抢夺C端市场。

这两条线合在一起,就变成了腾讯在AI上的的新叙事:产品上用元宝和混元冲锋,组织上招募姚顺雨、庞天宇这样的95后顶尖人才,把一批“少年英雄”推到台前——27岁的腾讯,似乎想在AI业务上,换上一些年轻的新面孔来讲故事。

01

上过综艺的AI研究员

2021年冬天,《燃烧吧!天才程序员》综艺开播,镜头里扫过的,是一群20岁出头的网络安全和AI的研究员。

该节目将选手分为“攻防赛道”和“AI赛道”。“AI选手”庞天宇时年25岁,作为清华大学计算机系博士四年级学生参与了这档综艺。

在同一时期的媒体报道中,庞天宇曾用“正常”来形容自己。他强调自己“不穿格子衬衫”,日常会打篮球、健身、打游戏、看电影。事实上,这也是这档节目本身的用意之一,借由这些精英年轻技术选手,试图松动大众对程序员群体“单一、木讷、社交缺失”的固有想象。

出生于1995年的庞天宇,高一就获得清华大学保送资格。2022年清华博士毕业后,他加入新加坡知名研究机构Sea AI Lab,担任高级研究科学家。Sea集团在东南亚有着巨大影响力,也是知名电商企业Shopee的母公司。

加入Sea AI Lab之后,庞天宇迅速成为圈内认可的年轻研究者。据Google学术统计,他作为第一作者或共同第一作者,在ICML、NeurIPS、ICLR等国际顶级机器学习会议发表过大量论文,并且参与的研究总引用已经超过1.4万次。

尽管引用数不能准确衡量一个学者的学术水平,但1.4万次已经是年轻AI研究者中的顶尖水平。值得一提的是,姚顺雨在Google学术的总引用数更为夸张,已经接近1.6万次。不过,二人的研究方向完全不同,单看引用次数本身没有太大对比价值。

回到庞天宇的SeaAILab研究生涯,他的研究兴趣覆盖了机器学习多个核心方向,尤其是可信机器学习、深度生成模型与鲁棒性(robustness)领域。

所谓鲁棒性,指模型在噪声、分布变化或对抗干扰等非理想条件下,仍能保持稳定表现的能力。它关注的不是模型在“标准测试集”上的最好成绩,而是在真实复杂环境中是否可靠、是否可控。

在机器学习中,鲁棒性和准确率之间,一直有着不可避免的权衡。庞天宇在ICML2022(国际机器学习大会)的一篇论文中指出,这种矛盾并非模型能力的本质问题,而是源于鲁棒性定义本身不够合理。

他提出了一个名为SCORE(自洽鲁棒错误率)的新定义,通过重新调整鲁棒性训练的损失度量,用更符合“局部等变性(local equivariance)”的方式描述鲁棒模型应有的行为。实验结果显示,模型可以在保持高准确性的同时,兼具更稳定的对抗鲁棒性。

从研究方向看,庞天宇长期关注模型在复杂环境下的稳定性与鲁棒性问题。这类工作并不直接追求能力上限,却对多模态系统和智能体在真实产品中的可靠运行至关重要。在腾讯近期不断强化多模态与Agent的背景下,引入具备这一研究取向的人才,本身就带有明显的工程和产品导向。

最近两年,庞天宇的研究重点不断延伸,聚焦于大模型与多模态系统在真实部署中的风险问题。2024年,他参与发表在ICML2024的论文中,系统性展示了多模态大模型在Agent化之后可能出现的安全放大效应:在实验设置中,单一对抗输入一旦被某个智能体“记住”,就可能在多智能体交互中快速传播,导致整体系统失效。

这项工作首次将“大模型越狱”从单模型问题,推进到多智能体系统层面,并给出了可复现的实验路径。

从公开成果看,庞天宇的研究覆盖生成、理解与系统层问题,既能参与核心模型工作,也能处理多模态与Agent落地时的稳定性与边界问题。这种技术完整度,与腾讯当前混元体系的需求高度契合,也在一定程度上解释了腾讯为何向其伸出橄榄枝。

02 

庞天宇来了要干啥?

混元的多模态部门是在去年架构重组后的产物。从腾讯的模型版图看,该部门涵盖生图、视频、3D生成(单体/世界模型)等多个领域。

随着“少帅”庞天宇空降,我们先盘点一下他面前的腾讯混元多模态家底。

生图部分,混元图像已经更新到3.0(HunyuanImage3.0-Instruct),并推出图生图版本并开源。与早期更强调“生成质量”的模型不同,这一版本更突出对复杂指令的理解与执行,把文本理解、视觉理解和图像编辑整合在同一套多模态架构中。

视频生成方面,2025年,腾讯围绕混元视频系列持续补充了图生视频、定制化生成等能力,并优化推理与部署方案,使其更适合开发者使用。

3D是腾讯多模态布局中更具长期指向性的方向。目前,腾讯已经正式发布并开源了混元3D世界模型,能够从文本或图像生成可漫游的三维场景,并支持导出到真实生产管线中继续编辑和使用。

围绕这一模型,混元3D系列在2025年持续迭代,同时配套推出面向生产流程的工具产品,强化几何精度、可控性与结果复现能力。

如果把这三条线放在一起看,混元多模态的阶段性成果已经清晰:图片、视频、3D生成全方位推进的同时,在生态上全面开源,试图在开发者社区层面不断扩大影响力。

从行业视角看,腾讯混元在多模态方向的开源模型活跃度较高,其中混元3D系列在 Hugging Face社区的下载量超过百万次,并在开发者群体中受到关注。相比之下,尽管混元也发布了大语言模型(如 Hunyuan-Large、Hunyuan-A13B 等),但在业内声量上要落后于自家的多模态生态。

另一方面,随着多模态模型的能力逐渐补齐,新的难题才开始显现。当下混元多模态面临的问题,不是“能生成什么”,而是能不能稳定地按用户的意图,把复杂任务完成。

不同形态下,这个问题各有侧重。图生图不仅要改得准,还不能误伤其他区域,风格和结构也要保持一致;视频生成的挑战在于运动是否自然、镜头和主体能否前后一致,以及长序列是否容易失控;而在3D场景中,难点则集中在几何精度、结果可控性,以及生产流程能否稳定复现。

去年8月,字母AI曾专访腾讯混元3D负责人郭春超。采访中,他表示,后续的重要优化方向之一,是逐渐降低用户使用门槛,“比如帮助用户做更多的prompt改写,或者提供更多模态的输入,例如‘文+图’或‘文+多张图’,使其可控性能更契合用户的想法。”

不难看出,提升可靠性一直是混元内部聚焦的方向。而随着近期腾讯释放出更多补强C端AI业务的信息,持续优化多模态模型的紧迫性进一步提升。

近期举行的腾讯员工大会上,马化腾现身并为元宝站台,腾讯方面一边上线“元宝派”这种多人社交形态的探索,并配套春节10亿元红包玩法,把AI助手从单人对话拉向群体场景、拉向更高频的社交分发。元宝中的各种多模态能力也将迎来海量用户的检验。

而相比B端场景,C端场景下模型输出的稳定性要求会显著提高。B端用户往往不介意花一些时间“抽卡”,但C端用户尽管对细节质量要求没那么高,却更考验模型的可靠性,因为他们往往没有足够的耐心去反复尝试。

由此,可以提出一个庞天宇来了要“干啥”的猜想:为混元补强多模态强化学习与模型行为边界研究的能力,提升多模态场景下模型输出的稳定性、跨模态生成与理解任务的优化等方面。

另一方面,抛开业务层面,作为近期被腾讯招揽的第二位95后年轻AI学者,庞天宇的加入,显然也释放了组织层面的信号:在AI业务上,腾讯开始有意展示一批年轻的面孔。

03

AI业务要摆脱“旧形象”,新面孔很重要

“我们团队非常年轻且国际化,团队博士比例大约占2/3,基本上都来自于海内外名校。”去年,在专访郭春超的过程中,他曾这样向字母AI形容混元3D团队人员情况。

在这场对话后不久,混元对外公布了架构大调整,同时先后引入了姚顺雨与庞天宇两个年轻人,分别坐镇语言模型/基建层和多模态领域。

这背后,是腾讯在AI业务视角下,人才结构策略正在发生的明显变化。过去两年里,腾讯开始更明确地把AI人才视为技术竞争的核心力量。

刚刚过去的腾讯年会上,马化腾曾表示:“每个企业的基因不同、体质不同,腾讯的风格就是稳扎稳打”,并指出ChatGPT、DeepSeek等产品改变了行业进程,但腾讯要坚持以“产品长期竞争力和用户体验”为核心的路径。

与此同时,他提及腾讯在过去一年加大了对原生AI人才的吸引力度,通过年轻化力量重构研发团队。在腾讯走进27岁的这一年,马化腾用“重构”和“年轻人才”两个关键词,来形容AI业务的战略调整。

这一策略在腾讯的青云计划中体现得更具体。该计划面向全球招募2024–2026年毕业的博士,以及2025–2026年毕业的本科和硕士生,为青年人才提供师资、算力和极具竞争力的薪酬职级。

马化腾讲话中的“重构”,在某种程度上为腾讯AI和混元团队构建了一种梯队式成长叙事,让更多技术青年看到在腾讯内部成长为技术骨干的路径。

另一方面,字节跳动、阿里巴巴等大厂也在用真金白银抢人:字节增长员工薪酬与年终奖金预算,将奖金总池提升约35%,并提高薪酬调整预算以增强AI业务的薪资竞争力;阿里秋招中AI岗位占比超过六成,明确把AI技术人才作为重点增长方向。

为了对标这些动作,腾讯除了资源投入,也开始树立一批年轻的带头人,如姚顺雨、庞天宇等成为团队的标识。

过去相当长一段时间里,腾讯给外界的整体印象偏向克制与稳健,但“稳扎稳打”的另一面,是大公司在组织和决策上的惯性。这种气质在AI竞赛中并不占优:在C端层面,腾讯的元宝既没能压制豆包和DeepSeek,甚至在部分声量与活跃度上,也被后来者千问反超。

正因如此,从核心团队成员开始调整,对外释放更年轻、更具进攻性的面孔,成为腾讯打破路径依赖、重塑AI叙事的一种必要选择。

跑到小红书和知乎连续发招聘启事的庞天宇,正是这种转变最直观的信号——代表未来生产力的AI行业,叙事逻辑上要呈现出“新瓶装新酒”。27岁的腾讯需要一批“少年英雄”,为3岁的混元讲好AI的故事。

本文来自微信公众号“字母AI”,作者:李炤锋,36氪经授权发布。

+1
13

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

在奶茶卷到天际、咖啡内卷成灾的2025年,一些看似“非主流”的饮品却以意想不到的方式走红!

3小时前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业