中国工程院外籍院士张建伟:具身智能三大挑战与破局路径

Linker@36氪重庆·2025年09月06日 08:37
数字产业的未来不在于谁做得最“专”,而在于谁“融”得最深最广。

36氪重庆获悉,9月5日,2025世界智能产业博览会(以下简称“智博会”)开幕。在当天下午举行的2025数字产业生态大会上,中国工程院外籍院士张建伟表示,具身智能架起了物理世界和数字世界的桥梁,当下以及未来具身智能正推动人工智能进入感知行动“双轮驱动”的时代。但是,具身智能发展仍面临三大挑战。

张建伟介绍,具身智能的核心优势在于通过视觉、语言、触觉、运动、感知等多模态技术和材料、形体以及环境的交互的深度融合,让机器从被动的感知走向主动的理解和自主的决策。它不再是局限于屏幕的数字世界的算法工具,而是能走进工厂、车间、医院、病房、农场、田地、家庭等场景的通用实体伙伴。

但是,他也提出具身智能发展仍面临感知与操作复杂性、高质量多模态数据稀缺、数据技术生态的开放性三大挑战。

张建伟表示,在感知与操作复杂性方面,从静态的二维图像到多模态的动态场景的感知和理解,从二维平面的抓取到三维空间的精准操作,机器对真实环境的感知和语义理解,仍需底层技术突破瓶颈。

其次是高质量多模态数据的稀缺性。具身智能需要的数据不仅是海量的单模型数据,更是融合了物理交互环境反馈的异构数据。其数据的需求可能是自动驾驶的上千倍、大语言模型的上百万倍。而现有的数据和数据模型的协同方法,以及算力的架构尚未完成这样的匹配。

第三是数据技术生态的开放性。张建伟表示,在当今全球合作的背景下,具身智能的核心算法、感知技术操作系统等发展,必须依赖开放的技术协作和生态共建。

在看到挑战的同时,张建伟也提出具身智能发展的机遇,“如果说具身智能是数字产业的前沿领域,那么数字产业的生态就是坚实的支撑基础,数字产业生态关键在于从‘单点突破’到‘融合共生’。”

对于重庆具身智能发展建议,他表示,重庆可以以创新研发为源头,场景落地为牵引,集群扩张为支撑,构建了从技术到产业的完整闭环。

他认为,数字产业的未来不在于谁做得最“专”,而在于谁“融”得最深最广。重庆正以开放的姿态汇聚全球数据产业的智慧和力量,当下正是各方携手共建全球数字产业生态的良好窗口期。为此,他建议各方应积极突破技术瓶颈,汇聚生态合力,让数字技术真正成为驱动全球协同高质量发展、创造人类生活的美好动力。

+1
5

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

聚焦“人工智能+”和“智能网联新能源汽车”。

2025-09-06

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业