人形机器人,向IPO狂奔

周天财经·2025年07月23日 16:05
向人形机器人定向放水,这一次,技术撑得起概念吗?

近一个月,资本市场风云卷动,几十亿人民币蜂拥砸入具身智能产业。

宇树科技于7月18日正式开启上市辅导,开始向IPO发起冲刺,此时距宇树科技进行股改刚过去2个月。而在一个月前,6月19日宇树科技宣布完成C+轮战略融资,据I桔子估算,此轮融资后宇树估值已达130亿人民币。

与宇树科技同为第一梯队的智元机器人在7月8日抛出重磅炸弹,出资至少21亿元收购A股科创板上市公司上纬新材63.62%股份。尽管智元机器人声称此次收购不涉及业务和重大资产的重组上市,但二十多亿真金白银砸出去收购一个和机器人产业毫无关联的公司, 若说其中没有别的目的似乎有些掩耳盗铃。蓝桥资本创始人王超在和晚点的对话中就将智元机器人的这一行为称为「类借壳上市」,其靠近资本市场的野心显而易见。

两家头部企业的IPO赛跑,体现出上头针对人形机器人的定向放水,意图清晰。闸门打开,也驱使一二级市场联动起来。

也是最近几天,「杭州六小龙」之一的杭州云深处宣布完成近5亿元人民币新一轮融资。它石智航宣布完成由美团战投领投的1.22亿美元天使+轮融资。

值得注意的是,这不是美团第一次出现在具身智能投资方中,据不完全统计,宇树、智元,包括下文将要提到的星海图和自变量机器人等具身智能企业,背后都有美团的影子。可以说,美团撑起了具身智能的半壁江山。

另外半壁,京东想要接手。

7月21日,众擎机器人、千寻智能、逐际动力等三家机器人公司同时宣布获得京东领投的新一轮融资。前两者融资规模分别达到近10亿元和近6亿元。京东似乎要和美团杠上了,双方战线从「外卖大战」蔓延到了具身智能产业。

北京小雨智造完成由滴滴领投的亿元级A+轮融资,这是滴滴第一次投资具身智能赛道。

此外,清华系具身智能企业星动纪元完成近5亿元A轮融资。主攻仓储机器人和智慧物流业务的极智嘉在港交所主板挂牌上市,成为「全球AMR仓储机器人第一股」。星海图接连完成A4轮及A5轮战略融资,两轮合计融资金额超过1亿美元。还有图速科技、跨维智能等多家公司在近期完成融资。自变量机器人创始人兼CEO王潜更是坦言「我们上半年融了三轮」。

如此之多的融资发生近一个月内,眼花缭乱,体现了资本市场对于具身智能这一未来产业的期望,众多企业纷纷入局,以期在这一片蓝海的赛道中提前布局,早早落位。但即便是如此规模的融资,在王潜看来速度也还不够快,规模还不够大,在接受每经记者采访时,他表示,「具身智能是中国可以和美国站在同一起跑线角逐的大赛道,但与美国公司相比,中国公司不管是融资规模还是企业估值,都有着一个数量级的差距」。

但是热潮已经起来了,这是一个好的启动。

01 信心来自何处

具身智能(Embodied AI)和机器人并不是新奇的物种。1950年,图灵在他的论文中就提出了人工智能的两条发展路径:一条是抽象智能,依赖算法和符号推理;另一条就是具身交互,即为机器配备感官设备,使其能够通过感官体验和环境交互学习技能。

然而直到今日,具身智能才如此频繁地被提及,众多初创公司毅然下场造机器人,并成功吸引了大量资本的眼球。那么问题来了,走过了PC时代和手机时代,为什么在这个时间,一个之前不被倾注太多注意力的产业,突然立地飞升,如日中天?

这其中涉及到两次关键的范式转变。

第一次范式转变发生在机器人的本体。这是从液压驱动路线向电驱路线的变革。

宇树创始人王兴兴曾说他在2013年以前就看出来液压方案无法商业化,原因简单:它都是精密的机械零件,一旦涉及到精密的机械零件,成本都会下不来。并且,所有的液压系统都会漏油,连家用轿车都不怎么用液压系统了。

在液压技术路线上走了几十年的老巨头进展寥寥。2018年,日本ASIMO机器人宣布停止研发,这使得全球人形机器人行业坠入低谷期。直到马斯克确立了电驱动路线,成为一次拯救全球机器人行业的关键技术转折。

电驱带来的大规模零件精简,使其具有了规模效应,而押错科技树的液压派,哪怕是积累了半个世纪的技术壁垒,也在一夜之间被新的小巨头赶超,波士顿动力如今年销量仅为宇树的十分之一,可能会逐渐退出历史舞台。

因此,电驱动的一个巨大红利,就是为中国小至创业公司,大到智能家电巨头再到汽车制造和互联网巨头,这些后发者,一下子打开了赶超的窗口,大小玩家们都站到了同一起跑线上。

这也得益于新能源电动车成熟的产业链,电机造型变小,力矩变大,电池的能量密度也在不断提高,技术转移到机器人产业链上,就可以提升机器人的运动能力和续航。像滚雪球一样,一个零部件一个零部件地抠出来高性能与低成本,步步逼近产业拐点。

第二次范式转变发生在机器人的「大脑」。这是大模型技术带来的变革。

机器人公司魔法原子总裁吴长征说,2023、24年,行业井喷,ChatGPT3.5的出现至关重要,大模型技术发展,给机器人智能水平提升带来了一种新范式。生成式AI出现了千倍万倍的能力提升,让我们意识到,大模型+机器人,具身智能存在无限潜力。机器人在环境和感知与理解、推理、决策和任务规划方面,都会产生一种新的范式。在这种新范式下,机器人能力会有千倍万倍的增长。

大模型的出现颠覆了传统机器人只能当「遥控玩具」的印象。现在大模型所展现的复杂场景理解能力和长序列的任务规划能力,都是以往机器人所不具备的,以往机器人的任务序列是人为事先编写好的,但大模型通过不断地训练和学习,能让机器人理解周围环境,还能结合环境和目标任务进行自主的任务规划,就像人拥有了大脑一样。

当然,这并不意味着可以直接把现有的大模型拿来塞进机器人里。大模型通过语言进行交互,语言可以作为人机交互的媒介,但不能视作机器人所拥有的智能。银河通用创始人兼CTO王鹤说,「智能的本质是对一种情况做相应reaction的能力」,对于机器人来说,通过视觉、听觉、触觉与周围的环境产生交互,具备理解当下环境并采取行动的能力才至关重要。

因此,适用于机器人的具身大模型成为了行业共识。虽然走到这一步仍需要技术攻坚,但是方向已经明确,前进的关口已经打开,接下来就是等待一个属于机器人产业的GPT4时刻。

但前路仍然漫长曲折。

02 拦路虎未除

就当下而言,具身智能离理想中的模样还相去甚远。此时的具身智能市场,如同2010s的新能源汽车市场,处于行业野蛮发展的初期,技术尚未成熟,离商业化落地更差着十万八千里。

具身智能想要书写的故事和当下的现实产生了割裂。

首先,具身智能的训练需要海量的交互数据作为支撑,千寻智能具身智能项目负责人解浚源就表示,「数据就是目前最大的难点,很多的问题在数据量上去之后就自动的不是问题了」。

目前数据的主要采集来源分为真实数据和仿真数据两种。真实数据通过机器人的实操,来获取机器人在与真实物理世界交互过程中的反馈,主要通过遥操和动捕两种方式进行。仿真数据则通过渲染虚拟环境,模拟机器人与物体交互,生成训练数据。

由于是实机交互,真机数据采集的数据质量最高,但其短板也是显而易见:数据采集工作量大且成本高昂。高擎机电生态合伙人同济子豪兄就提到「我用主从机械臂教机器人抓小龙虾,重复一百次后手已经很疲劳了」。王鹤也指出目前雇人遥操采真实数据的成本非常高,「万台级机器人数据采集每个月的成本在数亿到十亿之间」。

仿真数据可以训练成千上万次,但是虚拟世界与现实世界存在鸿沟,仿真环境中的物理规律和机器人感知同现实世界存在偏差,通过仿真得来的数据有可能在现实中失效。子豪兄表示「目前主流方案是‘仿真 + 少量真实数据’混合训练,但如何缩小‘仿真 - 现实鸿沟’仍是核心难题」。

泛化不够,意味着任务成功率低,再加上价格高昂,人形机器人短期内难以走进千家万户,成为消费级商品。

千寻智能联合创始人高阳在和晚点对话时将具身智能的阶段划分为L0-L5:L0为无智能的工业机器人;L1为单一任务智能;L2为单场景多任务智能;L3为单场景可完成70%-80%人类任务;L4为单场景100%任务;L5为跨场景全能。「整个行业现在正在从L1到L2的路上」。人形机器人公司们要占据消费市场,仍然需要很长的时间。

高阳说,「现在到L2、L3的提升最主要的挑战就是泛化性,很难把所有任务数据都采集一遍,所以需要泛化性来支持机器人举一反三」。泛化性的意思是,让智能体在真实、开放、动态变化的物理世界中,能够将其在单一环境、任务或实体上学到的能力,有效地迁移和适应到前所未见的环境、任务或实体上。这种能在开放世界终身适应的能力,是具身智能最终走向实用化的关键瓶颈和核心目标。

目前多数机器人只能在高度受控环境下工作。王兴兴曾向周天财经谈道,「当下的问题是,一个任务目标可以完成,但是场景和任务稍微换一下,成功率就会暴跌」,这就是泛化性不足带来的问题。之前机器人公司们整出来的花活,无论是跳舞还是其他诸如后空翻等看起来很唬人的动作,本质都是固定动作或遥操,与传统机器人还未产生本质区别。这也是机器人目前无法进入通用场景的原因。

一位资深投资人士表示「现在纯人形最大的市场是科研院所,他们需要类人构型做整机控制研究。其他场景都是噱头——商场展览、拍广告,甚至可以租来用一两次,这说明需求不是长期高频的。

宇树科技创始人王兴兴一个月前在夏季达沃斯论坛上宣布宇树年营收已超过10亿元人民币,为上市预热。而据硅基实验室的统计,科研类高校撑起了宇树订单的大头,其余则由央国企、政府单位等采购。

就在不久前的7月11日,宇树科技和智元机器人一起拿下目前为止国内人形机器人企业的最大订单——总预算为1.2405亿美元的双足机器人代工服务采购项目。这笔订单来自中移(杭州)信息技术有限公司。

从以上种种,可以窥见人形机器人公司目前的商业化瓶颈。在各类不利因素的影响下,机器人的落地部署场景被限制在狭小的区间内,甚至更多是实验科研需要,机器人公司们的营收来源在短期内还无法囊括广阔的消费市场。

人形机器人公司想要走近消费者,还任重道远。但资本方目前给出的高溢价,主要就是为消费级可能性而买单。

03 未来指向何处

资金涌入代表了创业者和投资人们对前景非常乐观。

王兴兴就断言「2025年年底的技术进步会上升一个台阶,会给全球产业界打一个更大的鸡血,热度、市场规模翻十倍是没问题的」。

当下走向具身智能的主流技术路线有两种:一种是端到端模型,一种是分层决策模型。端到端路线直接将原始传感器输入如摄像头图像、激光雷达、触觉信号等映射到机器人的动作输出,不依赖人工设计的中间模块,通过单一模型完成从感知到决策的全流程。

分层决策的核心是将任务分解为多个层级,每层专注于特定的子功能,从感知到执行之间的各环节是独立的,各模块可分别优化或采用混合技术方案。

实际上,端到端模型已经成为大部分从业者的共识。这一路线是特斯拉选择的方案,同时国内耳熟能详的具身智能初创企业如星动纪元、星海图等采取的也都是端到端的解决方案。端到端当下的主要决策模型是VLA(Vision-Language-Action), 旨在通过统一模型将视觉信息、语音指令和物理动作控制深度融合,从而使机器人在开放世界中具备自主推理、决策和执行的能力。

有研究者认为,今天的具身智能接近于自动驾驶2010年的那个阶段,为什么是2010年?因为当年谷歌展示了相当不错的自动驾驶原型Demo,还举行了像无人车竞赛这样的学术前沿性活动,展示了激光雷达、高精地图定位、SLAM等技术方式,证明汽车自动驾驶是可行的,但离真正规模化应用仍有很大差距。今天智能机器人展示的很多能力和Demo,从完成度上来看,非常接近于2010年自动驾驶所展示的。而到了2025年,特斯拉FSD才趋于成熟,理想汽车的端到端也基本能用,又是一个15年的gap。

因此尽管在当下来看,在端到端方面下功夫或许还需要较长的时间才能等到技术临界点出现。手动分层或许可以在短期内占得工程上的便宜,但从长远来看迟早会被淘汰。高阳在和晚点的对谈中就提到「2016年我们刚开始做自动驾驶的端到端,当时没人相信,但是我们从那个年代就开始相信端到端了」。

适合具身智能发展的各种要素已经准备好了,只待AI能力达到新的临界点,具身智能赛道将迎来井喷式的爆发。王兴兴在和周天财经对谈时表示:「最大的点还是行业天花板是机器人AI的天花板决定的,如果AI天花板不突破的话,增长也就是50-100%的线性增速,如果突破了临界点,整个产业就会大爆发,所有大公司都会加入进来的。

这是一个漫长的征途,性能拉升需要时间,而在真正属于具身智能的时代到来之前,该怎么活到那一天才是目前相关公司们需要考虑的事情。微软全球原副总裁、院士张亚勤心中的时间表是:需要10-20年。他认为,信息智能的AGI 5年内可达到;物理智能的AGI分阶段达成,如人形机器人大约需要10年达到。

王鹤曾向晚点表示未来五年是具身智能的关键期:「若头部企业做不到万台级自主机器人应用,行业可能重蹈工业视觉覆辙——故事讲得大,实际营收仅几亿。

部分企业的策略是两步走,曲线救国,先拿到专用工业场景里跑数据,再逐渐泛化通用。梅卡曼德机器人创始人邵天兰对「牛白丁」表示,「全球约10-20亿人从事制造、物流及相关工作,而工业机器人存量仅400万台。即使仅替代1%的岗位,也将形成千万级市场,规模远超当前存量。」

初步可预见的是,在未来的几年内,具身智能先落地工业、商超等场景,规模铺开之后,机器人和真实物理世界形成大量交互,产生的数据量级暴增,从而为下一级的机器人训练提供宝贵的真实数据,这样形成良性循环,催生机器人向跨任务全场景全能型迈进。

《银河帝国》中,阿西莫夫虚构了一个存活三万年的机器人角色,它已经进化出了自己的意识,拥有远超人类的智能,为保护人类的利益默默守护了两万年。眼下,我们正在向这种梦想靠近。

*仅介绍公司,不构成推荐股票的建议

本文来自微信公众号“周天财经”,作者:晏川,36氪经授权发布。

+1
5

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000
特邀作者

公众账号:周天财经 守望中国科技崛起进程,微信sysuzt

下一篇

剧情赛道跑出带货女王。

10小时前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业