又一华为天才少年入局具身创业,用视频生成数据训家用机器人,首个模型登顶具身基模榜单

量子位·2026年03月24日 11:44
华为天才少年周凯文加入具身智能创业,公司半年融资三轮,模型登顶权威榜单。

又一位华为天才少年加入具身智能创业战场。

6G冲浪的量子位最新发现,去年从华为诺亚方舟实验室转入学界的周凯文,在入职港中文不到半年后,悄然更新了个人主页。

他已加入具身创企诺因智能,担任合伙人兼算法主管。

顺着周凯文人事变动这条线往下扒,我们发现了三条很值得和大家分享的信息。

第一,这家叫诺因智能的具身智能创业公司,成立时间很短,不满一年,但已经聚集了一批履历极强的技术人员。

第二,该公司选择的方向,是当前争议最大、也最难落地的ToC具身智能机器人。

第三,也是比较亮眼的一点,诺因智能刚发了个新具身模型,已经在一个具身智能权威榜单上拿下第一。

综上,这家半年内连融三轮,但相当低调的具身公司,已经越来越掩藏不住了。

从一条人事变动,扒一扒ToC具身低调玩家

在火热的具身智能赛道,顶级人才的流动本身就是一个重要信号。

周凯文2013年以信息奥林匹克竞赛保送复旦大学,2019年在香港中文大学拿到计算机科学与工程的硕士学位,而后又在港中文攻读博士学位。

2022年博士毕业后,周凯文以“华为天才少年”身份加入华为诺亚方舟实验室。业内人士告知,他是诺亚决策与推理实验室第一位天才少年

华为诺亚方舟实验室是成立于2012年的AI研究机构,专注于AI基础算法与产业应用,其中决策与推理实验室研究方向涵盖自动驾驶、具身智能、大模型推理等前沿方向。华为的自动驾驶和具身智能业务都离不开诺亚的孵化。

2025年,工作3年的周凯文离开华为,来到香港中文大学系统工程与工程管理系工作。

近日,周凯文更新个人主页,表示已经离开高校,加入具身创业大军。

大厂核心人才→加入高校→再次回归创业公司,这样的职业路径通常意味着两件事。

一是技术判断发生变化,认为产业落地窗口已经出现;二是目标公司在某个关键方向上具备足够吸引力

具身智能赛道的火热早已无需多言,大厂布局、初创扎堆,资本和人才持续涌入,但诺因智能绝对是赛道中一个低调的存在——全网资料寥寥,除了晚点团队的一次专访,创始团队几乎没有对外发声过。

但我们还是结合多方消息,勾勒出了这家公司的轮廓。

诺因智能成立于2025年7月,总部坐落于深圳。

成立仅小半年时间,就已连续完成了种子轮、天使轮、天使+轮三轮融资,投后估值超20亿元人民币是目前国内少数专注ToC具身智能方向、且融资节奏强劲的创业公司之一。

不同于当下赛道中多数企业聚焦ToB工业场景,诺因智能从诞生之初,就将目标直指家庭消费场景。

讲真,家庭场景远比工业场景复杂,光照变化、背景干扰、物品形态的多样性,以及层出不穷的长尾任务,都让ToC家用具身智能机器人的研发难度呈指数级上升。

这也是为何该方向始终争议不断、落地缓慢。

哪怕掰着指头细数,ToC具身智能在国内玩家也真的没两家;也就国外有零星几家公司声量不错——比如前几天刚宣布完成B轮融资、估值来到11.5亿美元的Sunday Robotics。

用视觉生成模型给具身机器人喂数据

继续往下看。

除了落地场景与众不同外,诺因与其它具身智能公司的核心差异,其实集中在技术路线。

目前具身智能在采集训练数据时,通常有遥操作数据、仿真数据、人类视频数据、UMI等解法。

量子位了解到,诺因采集数据的方式比较先锋,通过生成式模型构建专属训练数据体系,用视频生成的数据来训练具身大模型

这里唠几句视频生成模型生成数据和一般仿真合成数据的区别。

仿真合成数据,需要投入大量人力进行精细的场景建模,把所有资产、物理规律逐一嵌入,完成一个场景的建模后,才能基于该场景迭代数据。

视频生成模型合成数据,所有的场景都是自动化生成的,光照、背景、纹理等关键要素都能实现多样化调整,直接省去了人力建模的繁琐过程。

理论上,后者能无限量产出适配家庭复杂场景的训练数据。

此外,诺因官网相关资料显示,该公司的具身模型采用了自研的KNOWIN具身基础模型架构

如下图所示,这是一套从数据、认知到执行的生成式闭环系统。

这套架构以云端系统为核心大脑、边缘系统为执行终端

输入端整合机器人摄像头视觉数据、用户文本指令与本体状态反馈,以1-5Hz的频率同步输入云端KnowinBrain具身基座。

经过Action CoT后训练的KnowinBrain,能基于自回归逻辑完成动作思考与策略规划,再将决策结果传递给预训练的Action Tokenizer。

Action Tokenizer作为生成式动作编解码器,会把KnowinBrain输出的Action Token高效解码为可泛化执行的Action Chunk,最终由边缘端转化为平滑连贯的机械臂操作。

同时,机器人执行后的状态与环境反馈会以1-5Hz频率回传云端,让KnowinBrain实时评估物理状态、自主修正策略,形成完整的 “感知-决策-执行-反馈” 闭环

支撑这套架构的核心是KnowinDream生成式数据引擎,它从有限真实数据中学习场景规律,合成海量覆盖极端光照、复杂材质的机械臂操作视频,解决了行业真实数据匮乏的痛点。

而动态扩容的Action Token Space,能让机器人的物理执行能力随场景拓展持续进化。

最主要的是,这条路线已经被诺因跑通了

先来看看该公司官方视频,直观感受一下带来的效果:

下面这个视频里,机器人站在一台正在播放画面的电视机前叠衣服。

电视屏幕播放着色彩繁杂的视频内容,周围还有迪斯科灯球带来的复杂光源干扰。

虽然背景和光照始终在动态变化(比较接近真实家庭环境),但机器人依旧能稳稳完成任意形态衣物的折叠操作。

在模型层面,这条路线也得到了更直接的验证。

最近在具身智能评测榜单Embodied Arena中,诺因的模型KnowinBrain拿下了总榜第一。

Embodied Arena是一个由国内外10余家院校和科研机构联合研发推出的具身智能评测平台,核心研发成员来自天津大学、上海交通大学、伦敦大学学院、北京大学、清华大学等全球知名机构的研究人员。

Embodied Arena全面覆盖了机器人在真实物理世界交互所需的核心能力,从空间理解、基础空间定位,到机器人操作视频问答、具身推理等,均被纳入评测范围,是目前具身领域较为全面的评测体系之一

具身操作最相关的单项任务方面,KnowinBrain在Spatial Perception(空间感知)、Object Perception(物体感知)、Embodied Reasoning(具身推理)、Embodied Task Planning(具身任务规划)这四项能力上都排在第一。

在Embodied Knowledge(具身知识)这一单项上,KnowinBrain稍落后Gemini-2.5-pro,位列第二。

据接近诺因的知情人士透露,KnowinBrain背后积累了大量的Know-how,“即便竞争对手现在看懂了逻辑去复现,起码也得花上个半年到一年的时间窗口”。

这家公司,创始团队如何?

量子位获悉,诺因目前的团队规模在100人左右,博士占比超过2/3

根据官网公开资料,诺因的人才密度较高,公司成员不仅有30位具备大厂技术总监及以上经历的核心骨干,还有10位拥有知名科技硬件公司高管背景的从业者。

这种团队结构确实符合具身公司的实际需求,这个方向本身就需要“跨学科”能力,既要有大模型算法能力,也需要硬件、控制和产品工程能力。

从诺因目前已经公开的核心团队来看,这种结构也比较清晰。

首先来了解一下创始人兼CEO李银川,诺因智能妥妥的灵魂人物。

李银川25岁从北京理工大学和哥伦比亚大学联培博士毕业,在华为工作的五年里拿遍了公司主流大奖。

从华为出走创业前,据悉他曾是诺亚方舟实验室最年轻的项目经理。

2023年大模型方向爆火后,他在诺亚成立了生成模型理论项目组,开始主导AIGA决策大模型等生成模型前沿方向探索,落地在具身智能、大模型复杂推理、自动驾驶等相关业务中。

截至文章推送,李银川累计发表过80多篇论文,众多被收录于NeurIPS/ICML/ICLR等AI顶会;此外,他还以第一发明人的身份拿下30多项专利。

通常来讲,创始人的技术背景和做事风格是一家初创公司能吸引大批顶尖技术人才的重要原因。

据诺因内部人士透露,李银川在公司属于“内行领导内行”,并且总是和公司同事1v1聊技术,总之一切拿技术说话……

这名不愿透露姓名的朋友原话是这样说的:

和懂行的人一起做最有挑战的难事,比大厂会更有吸引力。

再来看联合创始人王韵杰,他主要负责硬件产品与产业化方向,更多承接从模型到产品的落地。

相比低调的李银川,王韵杰还要更加低调。

遍寻全网,我们只从一些知情人士口中听到了他的背景。

据悉他是大疆晋升最快的产品项目经理。在大疆工作期间,他负责了爆款Flip无人机的研发

没错,就是被大家奉为旅拍神器的那款……

参考链接:

[1]http://knowinai.com/

[2]https://jnhujnhu.github.io/

本文来自微信公众号“量子位”(ID:QbitAI),作者:衡宇,36氪经授权发布。

+1
12

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

不再让“航天”成为一个孤立于市场体系之外的“特殊存在”。

3小时前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业