具身智能,正在翻越三座大山
过去十几年,科技圈最不缺的就是“风口”。
VR眼镜、虚拟货币区块链、元宇宙,这些概念哪个曾经不是看着前途无量,到最后却都“哑火”了。
于是,今年来具身智能的突然爆火,很多人第一反应是:又来?
01
具身智能,“前辈”很多
具身智能确实和很多“前辈”一样,具备了很多风口的特征。
为什么呢?
除了“春晚机器人跳舞”这件让家喻户晓的标志性事件之外,还有一个很有代表性意义的是,就在今年,它首次被写入《政府工作报告》:“建立未来产业投入增长机制,培育生物制造、量子科技、具身智能、6G等未来产业。”
具身智能,事实上已成为我国培育未来产业的重要方向,也变成了全球科技竞合的“关键领域”。
仅2025上半年,资本就砸了200多个亿,有130多起融资事件,OpenAI、英伟达、谷歌、华为、阿里……科技巨头全员下场抢占这块“热蛋糕”。
很多人开始唱衰。
比如金沙江创投的创始人朱啸虎,直接喊出具身智能商业路径不清,批量退出了投资的人形机器人公司,猎豹移动的CEO傅盛也坚定地认为人形机器人落地太难、应用太远,至少五年,甚至更长时间都无法落地。
就连国际投行都关注到了宇树科技,在春节过后的2月27日对这家公司进行调研之后,发布报告称,人形机器人距离真正投入生产和日常使用仍有漫长的路要走,市场对这项技术的期待可能过于超前。
看起来,又可能会重蹈前辈们的覆辙,像虚拟货币、区块链、AR眼镜、无人驾驶、元宇宙等概念一样,兑现起来遥遥无期。
02
技术与成本双重绞杀
经济价值却难以兑现
这种担忧,并无道理。
首先,技术上面临算力、电池容量、脑力与体力的平衡等诸多瓶颈。
具身智能这个概念早在1950年就被提出了,无论是半导体的发展还是编程技术的进步,相关的创业公司始终没有拿出什么可堪一用的作品。
直到工业4.0之类的概念出现之后,相关产业链才有了一定发展。但就算是在Isaac Gym里,99%成功率的算法,落地到研发出来的真实机械臂,任务成功率也可能降到30%,国内外具身智能的AI泛化能力都表现出明显的不足,在非预设场景(如家庭杂乱环境)中任务失败率普遍在10%以上。
直到工业4.0之类的概念出现之后,相关产业链才有了一定发展。
但大部分,也都集中在固定式机器人、轮式机器人、四足机器人、履带机器人等领域,能履行的工作简单且单一。
直到人工智能的出现。
人工智能的表面是算法,核心是算力,大模型则是将之糅合的升级形态,可以说未来具备更多思考能力的具身智能,一定是大模型催动的。
但是,这又会面临一些新情况——机器人的“脑容量”太小了,要在机器人的“大脑”中安装千亿参数的多模态大模型,并非易事。
由于机器人的工作场景复杂且多变,几乎排除了“云服务”这个高延迟且不稳定的选项,所以机器人还要考虑电池技术本身的瓶颈,当本体自带电池容量有限的情况下,如何在高耗电和高“脑力”之间形成一个平衡好?这个问题,人类用数十上百万年的进化才给出了一个最佳平衡,但给机器人进化的时间显然不会太久。
其次,具身机器人的成本居高不下,资本与现金流陷入双重博弈。
以行业先驱“波士顿动力”为例,其在四足机器人界横扫千军,却在过去十年间三次易主,从谷歌到软银再到现代,每一次易主的理由都写在财报赤字里:一台Atlas实验机成本200万美元——相当于北京三环一套学区房,却只会在障碍赛上跑酷,连递杯咖啡都怕它洒。
国内的具身智能公司也感同身受。
智元机器人刚成立两年就急着递招股书,原因无他——现金流快见底了。2023年,智元机器人亏损了8.7亿,账上现金只够再烧18个月,再不上市“补血”,就得把实验室的机械臂挂上闲鱼了。
同样的,以服务机器人头部企业云迹科技营收从2022年1.61亿元增至2024年2.45亿元,年复合增长率达23.2%,但同期亏损分别高达3.65亿、2.64亿和1.85亿元。与具身智能极为贴近的移动机器人龙头极智嘉亏损更大,2024年营收24.09亿元,却亏损8.32亿元。其在招股书中坦言:“将业务扩展及创新放在首要的战略位置,专注于长期价值创造,而非短期财务回报。”
撇开训练和人工成本先不谈,仅仅是硬性开支就是一头吞金怪兽。
比如硬件三大件——减速器、伺服电机、控制器——占整机成本六七成,精度每提高0.01毫米,预算就要再烧掉一个零。
算法也不便宜,华为云曾经算过:要让机器人跑通10亿参数的大模型,得1万张A100显卡不眠不休干一个月,光电费就十分夸张。
然后,具身机器人的场景极为缺乏,无论工作价格还是灵活性,都难以和人类匹敌。
可能很多人,都幻想过科幻电影或游戏里的场景,机器人能够像人类一样思考和工作,但其实具身智能在一二十年甚至更久的时间,都难以满足这种幻想。
目前,无论是任何一个做机器人的公司,几乎从来不会在公开场合将之与人类对比。毕竟,在“打工”这件事上,具身机器人也是典型的“高不成、低不就”。
宇树科技的G1机器人每一台都需要手动调节关节电机,月产能只有300台,波士顿动力的Atlas硬件毛利率只有18%,卖一台能亏半台,几乎要把高科技做成了“慈善”。
(波士顿Atlas机器人)
智元机器人生产的机器人在工业场景占比70%,可一旦回到家庭客厅,将近10万的标价立刻劝退所有想把它买回家的打工人——毕竟,同等预算能请真人保姆三年,还能面面俱到。
说到底,它们能干的活还太少,价格又太贵,卷服务质量和价格卷不过人类,也不如AI大模型便捷易上手,可能有一个不太恰当的比喻——当黑奴的使用成本远低于机器的时候,南方的农场主不会拥抱工业。
于是,当成本和营收不匹配时,一个“互联网泡沫式”的亏损现象出现了——2024年中国人形机器人企业的平均毛利率只有18%,优必选2020-2024年上半年累计亏损更是高达43亿。
03
突破口在哪里?
但是,相比于“前辈”,具身机器人又是一个“异数”。
如果你深入研究就会发现,那些“前辈”遇冷的本质原因是:概念先行、技术滞后、实用价值低。
以VR眼镜为例,PICO、爱奇艺奇遇等品牌已先后碰壁。
其主要原因是,各类核心器件被少数供应商垄断,于是不仅缺乏开发迭代的动力,价格也居高不下,导致变成了“有钱人的玩具”。当用户有限的情况下,开发者回本周期长,精品内容寥寥,用户“买前激动、买后吃灰”,最后形成“低产出-低购买-低收入”的恶性循环。
再加上头显500克以上的坠感、半小时即热的体验硬伤,VR注定只能停留在硬核玩家的小圈层。
同理,元宇宙想象虽宏大,却同样绕不开算力、内容、终端这三座大山。
于是,热闹过后,只剩概念。
但是,虽然具身智能同样顶着“科幻”光环,横亘在面前的大山却是可以移动的。
技术上,具身智能的崛起,始终与AI大模型的迭代同频共振——这颗“智慧大脑”的进化速度,正以前所未有的力度推动着具身智能行业狂奔。
比如,智源的“慧思开物”平台尝试破解:用AI大模型驱动“大脑”规划任务,数据驱动“小脑”控制肢体,首次实现跨机械臂、人形机器人的统一控制。
再比如,广汽集团与华为云的合作,通过盘古多模态能力,可在数分钟内复原复杂驾驶场景的2D视频与3D点云数据,使端到端模型迭代周期缩短至“两天一个版本”。
硬件太贵?企业立马更换方案——减速器、驱动器、传感器,哪家贵就换哪家,国产平替立刻就能跟上需求。
松下HG-C激光位移传感器起码要1500元,国产泓川科技HC6做到把量程拉到800mm、采样提到2000Hz的同时,价格最高只要899元。
为激励具身智能的研究,深圳光明区直接宣布,2025年起,对新落户的全国软件百强企业、全国互联网百强企业、全国人工智能综合实力百强企业,给予最高2000万元奖励;对新落户的“国家鼓励的重点软件企业”,给予最高1000万元奖励。
场景落地慢?企业们一边顺应市场,如优必选Walker投入教育行业,60%收入来自中小学AI兴趣班;宇树G1机器人在2024年直接拿下了比亚迪500台订单,只因其价格比进口货少了一个零。
另一边,各大企业纷纷开始研发专门的具身智能大模型,如Figure AI的Helix,实现跨场景任务成功率突破90%。
(教育机器人)
更关键的是,中国独有的产业集群优势,为具身智能从实验室走向生产线铺就了黄金通道。
深圳光明科学城中,优必选超级工厂、大疆创新中心、华为鸿蒙实验室聚集,形成了“研发—测试—量产”的15分钟生态圈,机器人企业专利密度高达每平方公里1200项,超硅谷同类园区3倍。
在长三角,3小时的车程覆盖苏州绿的谐波的减速器、宁波中大力德的伺服电机等核心供应商;上海与杭州的之江实验室共建“人机协同联合实验室”,每天处理1亿条多模态交互数据。此外,长三角1万多项机器人专利免费共享,节卡机器人直接省下30%研发成本,省下的钱完全可以投入下一场迭代。
具身智能的特殊之处在于:它既需要类似VR的硬件突破,又倚重大模型这类软件革命。它的前途不由概念决定,而由技术迭代速度决定——每一代大模型升级,机器人的“脑力”就跃迁一次;每一次国产零部件替代,成本就下探一截。
还记得以前大家是怎么总结大疆的成功经验吗?——大疆之所以成功,就是因为它刚好珠三角,每一次测试每一个零件的更换,迭代速度和试错成本极地,而放在任何一个外国公司,研发一件消费电子产品,仅仅是零部件的定制、测试、选择,就是大疆的三到五倍时间。
当产业链的上下游都能自主可控的时候,中国的工业基础就是具身智能最大的底气,使它从一个虚无缥缈的概念,迅速转化成直指物理世界的生产力革命。
本文来自微信公众号“深眸财经”(ID:chutou0325),作者:高藤,36氪经授权发布。