超越资本狂热:具身智能的死亡之谷与真实拐点
过去这段时间,关于“具身智能”的讨论和投入几乎达到了前所未有的“疯狂”状态。头部企业重仓下注,创投圈高频出手,产业巨头与创业公司同台竞技,一时间“具身智能”成了资本和媒体的宠儿。市场上,更是频频涌现出数十亿级的融资大单,产业链上下游如火如荼,仿佛谁慢一步就要错失时代红利。
然而,热潮之下,冷静的声音并未消失。
正如《经济日报》所言,别再搞一哄而上的“人工智能+”。这句警语不仅点中了中国AI产业的“成长烦恼”,也为当下这场全球范围内的具身智能竞赛敲响了警钟。
在资本、政策和技术驱动的三重推力下,我们更需要回头看看,除了“融资热”和“明星企业”,还有什么才是真正值得长期关注和深度思考的命题?
具身智能的浪潮,确实带来了想象空间和产业机遇。
它不仅是AI从虚拟世界走向物理世界的里程碑,更被视作“下一个通用技术平台”。但如果我们只停留在融资排行榜、Demo视频和PPT故事之中,忽视了创新的可持续性、技术的现实边界、产业的生态健康以及社会的伦理责任,所谓的“热潮”很快就会像以往的技术泡沫一样退去,甚至带来更大失望和资源浪费。
因此,本文希望跳出“资本狂热”和“赛道爆发”的表层逻辑,将目光转向技术创新、产业落地、责任治理、社会价值等更具深度与可持续性的议题。
让我一起从热闹的背后去反思:热潮之下还有哪些值得思考的创新命题?在资本和技术之外,我们需要怎样的产业耐心和培育机制?只有这样,这场AI与物理世界的深度融合,才能真正开花结果。
资本狂欢背后:具身智能产业的真实分层
上面的长名单还在继续,2024年到2025年的具身智能领域,资本市场上演了一场罕见的集体狂欢,单笔融资更是屡创新高。
无论是欧美的Figure AI、1X、Boston Dynamics,还是中国的智元机器人、傅利叶、宇树科技等本土新贵,都在资本推波助澜下加速扩张,成为产业新闻的头条主角。
巨头公司与创新独角兽频频达成战略合作,头部资源迅速向少数领跑者聚拢,产业链上下游的马太效应加剧。“头部收敛、巨头绑定”成了这个周期的主旋律。
不可否认的是,中国在全球具身智能的发展中,承担了半壁江山的作用。根据麦肯锡的分析,按照现有趋势发展,到2040年全球具身智能的市场规模将达到3700亿美元,中国市场占据50%的份额。
但热闹背后,是一个更加冷峻而复杂的行业现实。随着大额资本涌入,具身智能领域的“二八分化”愈发明显。
获得融资和资源的企业可以快速扩充技术团队、攻克关键环节、加大市场投入,甚至提前布局跨界生态。而大量中小企业却在这轮资本洪流中被边缘化,研发进度受限,融资渠道收紧,市场空间被进一步压缩。
某种意义上,产业洗牌期已然来临。能否熬过资本的周期性波动,成为企业能否“活得久、走得远”的关键门槛。
资本堆叠和估值飞涨并不意味着创新能力的同步跃升。回顾这一波具身智能融资潮,我们可以看到大量资金更多流向了“规模化生产”“市场占位”乃至“明星团队”本身,而真正面向底层技术突破与长期ROI的耐心资本依然稀缺。
至今,能够被称为“杀手级应用”的商用案例仍然屈指可数,无论是人形机器人还是多功能移动平台,绝大多数应用还处于小规模试点或演示验证阶段。
“融资热≠创新突破”“Demo≠生产力”成为行业内部越来越响亮的反思声音。资本的推动固然重要,但只有那些真正穿越产业周期、愿意等待技术成熟、敢于深耕复杂场景的团队,才有可能在下一轮产业升级中站稳脚跟。
具身智能的“空间革命”:从堆叠到进化
任何一次真正意义上的技术革命,都远不止于“功能加法”或者简单的堆叠与升级。具身智能领域的最新突破,正是如此。行业最深层的创新,不再局限于AI大模型与硬件的机械组合,而是源于空间智能、三维世界生成、多模态感知与推理能力的质变。
上图梳理了AI从感知世界到深度融入和变革物理世界的能力演进路径。
空间智能让AI具备了理解和重建三维空间结构的能力,相当于为AI“打开了眼界”;在此基础上,具身智能让AI能够通过感知、运动和反馈实现与真实环境的动态交互,真正“体验”世界;最终,物理AI则代表着AI不仅能够认知和学习,还能在复杂的平台和生态系统中部署和协作,从而推动现实世界的深刻变革。
以空间智能的新锐项目World Labs为代表,AI系统已经进化到能够基于图像、文本、音频、视频等多源输入,完成复杂的空间认知和动态推理。它们不仅“看得到”,更能“理解环境”,甚至能够基于一张二维图片,推演和还原出完整的三维世界结构。
这种空间感知与动态预测的能力跃迁,为工业机器人、虚拟现实、自动驾驶等领域提供了全新的通用底座,也意味着机器不再是被动执行的“机械体”,而是真正具备“自适应世界”的智能体。
多模态融合与“交互智能”的崛起,正在让AI迈入全新的发展阶段。相比传统只能处理单一感知信息的机器人,如今的具身智能正朝着“全感知、全对话、全反馈”的交互型智能体演进。
AI不只是理解图像或语音,更能综合多种信号,实现自然语言对话、环境感知、即时响应和复杂任务的动态调整。这种多模态认知能力,正在催生出比ChatGPT更具“行动力”和“迁移能力”的AI新物种。
更重要的是,这场空间智能和多模态认知的革命,倒逼产业必须跳出“堆硬件、卷参数”的旧有路径。中国具身智能产业如果一味追求硬件规模扩张、参数堆砌和PPT式创新,终将错失全球空间智能与软硬协同的战略窗口。
真正具有国际竞争力的“数字劳动力”,必定是在自研大模型、仿真训练、开放生态中不断演化出来的新型智能体。它们不是“像人”的机器人,而是能够理解空间、迁移任务、情境自适应的“超级助手”。
具身智能≠人形机器人,未来的具身智能,不止于制造“更像人”的机器人,更是打造理解世界、适应变化、释放创造力的数字劳动力。这场从“堆叠”到“跃迁”的技术转型,将是中国产业突围国际竞争的关键变量。
从表演到落地:具身智能如何跨越“死亡之谷”
在具身智能产业风头正劲的当下,现实与想象之间的距离却被不断拉大。
根据Gartner的分析,如上图所示,具身智能正处在创新的早期爬坡阶段,距离应用至少2~5年时间。行业里最常见的现象,是炫目的Demo视频远多于实际的应用价值,资本和媒体热衷于追逐“人形机器人跳舞”“灵巧手折纸”这样的新奇画面,却鲜有真正走向大规模生产和社会服务的案例。
这背后,是一条漫长而曲折的技术与商业“死亡之谷”——创新能否跨过去,决定了一场产业革命的成败与未来。
技术瓶颈始终是横亘在具身智能面前的第一道坎。不论是电池续航、灵巧手精度,还是AI模型的泛化能力,行业都面临着现实的难题。哪怕是全球最顶尖的实验室,能够在训练场景下取得90%成功率已属不易,但距离产业级要求的99%稳定性仍有明显差距。
而数据短板更是制约了AI模型的持续进化,现实世界的丰富、复杂和多变,远非仿真环境可以轻松还原。这些短板直接导致ROI周期拉长,商业化落地难度加大。
在资本和社会的高预期下,人形机器人被赋予了太多“杀手级应用”的幻想。但冷静观察可以发现,真正能够创造客户价值的场景极为有限。许多现实任务,传统自动化方案甚至比人形机器人更高效、更经济。
无论是仓储物流、制造装配,还是医疗护理,目前的具身智能产品大多还停留在“小批量试点”或者“展厅演示”阶段,距离广泛替代人力、推动社会生产力跃迁,还有很长的路要走。
更深层的挑战,是行业可能正处于“平台期”的门槛。越来越多专家开始反思,当前的AI方法论是否足以支撑具身智能跨越商业化的门槛。
缺乏新范式的突破,仅靠“加参数”“拼硬件”恐怕难以实现质变。从某种意义上说,具身智能的终极目标,绝不只是模仿人类外观或动作,而是通过AI与物理世界的深度融合,拓展人类能力、激发社会创造力。
具身智能机器人不必像人,而应补人所不能。未来的具身智能,应成为社会与家庭可信赖的助手、伙伴和创造者,而非单纯的人形工具。真正的产业升级动力,来自跨界想象力与原创设计,而不是规模、资本或政策的机械叠加。
写在最后
每一场技术浪潮的终点,都是一轮泡沫的退潮。当资本的喧嚣渐渐归于理性,唯有穿越周期的技术创新、产业协同、社会责任和人类想象力,才能让具身智能真正走出“热闹”,迈向“伟大”。
今天的具身智能产业,虽然站在全球创新坐标的前沿,但距离大规模落地、深度变革生产生活的终极目标,依然有着重重挑战和巨大空间。
参考资料:具身智能的融资潮,到底是怎么热起来的,来源:投中网Will embodied AI create robotic coworkers,来源:麦肯锡Embodied AI: How the US Can Beat China to the Next Tech Frontier,来源:Hudson Institute
本文来自微信公众号“物联网智库”(ID:iot101),作者:彭昭,36氪经授权发布。