中国团队拿下ICRA'26最佳论文:Agentic Coding驱动工业制造通往自主通用智能

量子位·2026年06月23日 19:39
对着工厂说句话,机器人就开工了!

刚刚,在维也纳落幕的机器人顶会ICRA 2026上,最佳论文奖(自动化方向)颁给了一支中国团队。

获奖工作名为IMR-LLM,由深圳大学胡瑞珍教授团队、中科院工业人工智能研究所徐凯研究员团队,联合视比特机器人与卡尔顿大学共同完成,获奖理由是提出并实现了一种新颖的工业产线多机器人任务规划与程序生成框架

它干的事,是让大语言模型给工厂产线上的多台机器人做任务规划、写执行程序。

以前产线换一个任务,工程师就要从头重写一遍程序,现在,一句自然语言描述进去,调度方案和可执行代码自动出来。

在覆盖23个真实工业场景、50个制造任务的IMR-Bench测试中,IMR-LLM在任务规划、程序生成和总体成功率三项指标上全面超过现有基线,而且任务越复杂,优势拉得越大。

这是怎么做到的?

研究背景

现代工业产线往往需要多个机器人协同完成复杂制造任务,为保证任务顺利完成,大多仍依靠人工进行任务规划并编写执行程序。

一旦任务或产线发生变化,需要重复进行繁重的人工操作,无法满足对灵活性的要求。

大语言模型在此类任务中展现出的能力为解决这一问题提供了新的思路。然而,现有基于大语言模型的方法大多面向简单的家居场景,难以满足工业产线中严格的时空约束和对执行正确性的要求。

针对这一挑战,论文提出了IMR-LLM框架,该框架充分发挥大语言模型的语义理解能力,再结合结构化工具完成约束求解和可执行性保证,实现从自然语言任务描述到高效调度和可执行程序的自动生成。

实验结果表明,该方法具有良好的跨任务跨产线泛化性,在所有指标上均优于现有基线方法。

相关工作

现有方法大多面向简单的室内家居场景,此类任务执行步骤之间相对独立且执行程序较为简单,因此可以直接使用大语言模型生成任务规划和执行程序。

然而,工业产线中工件的工序顺序和加工资源使用具有严格限制,执行程序不仅更长,其具体步骤还会受到产线布局、机器人配置等多种环境因素的影响。

因此,直接依赖大模型生成规划和程序,极易产生逻辑幻觉,生成的结果往往看似合理,却在执行时因为资源抢占或前置工序未完成等原因导致整个产线停滞。

方法创新

论文所提方法分为任务规划和程序生成两个阶段,分别解决“由哪台机器人在什么时间完成任务的哪一部分?”以及“具体该怎么做?”这两个核心问题。

在任务规划阶段,该方法首先利用大语言模型理解自然语言任务描述,将任务分解为一系列工序,完成机器人分配,并确定同一工件工序的执行顺序。随后,输出结果将自动转化为结构化析取图。

这样一来,原本由自然语言描述的复杂工业任务,就被转化为一个可以由传统优化工具处理的调度问题。随后,方法调用现有求解器,在满足工序顺序和资源约束的前提下,生成可行且高效的任务调度方案。

在程序生成阶段,该方法并不直接要求大语言模型一次性生成完整的长程序,而是从少量已有程序样例中归纳可复用的动作模式和程序结构,并据此构建工序流程树。

随后,针对具体工序和环境配置,从流程树中选择合适的执行路径,组合得到可执行代码。这样一来,复杂的长代码生成问题被转化为较为简单的路径匹配和选择问题,极大降低了模型的推理负担。

实验结果

数据集

为全面评估方法在不同工业产线中的适用性,论文构建了IMR-Bench数据集。

该数据集面向船舶制造等重型装备制造行业,包含23个真实工业场景和50个制造任务,任务按照难度划分为三个等级,单个任务最多包含24道工序。

定量对比

论文将IMR-LLM与现有方法进行了对比,并从任务规划、程序生成以及总体成功率三方面进行评估。结果显示该方法在所有指标上均优于现有基线,且随着任务复杂度上升,优势更加明显。

定性结果

论文在模拟环境中充分证明了算法面对制造任务变化和产线调整时的泛化能力。

在下面的视频中,机器人需要打磨两种类型的工件并放置在对应的托盘中,所提方法可充分利用机器和机器人资源,高效完成任务。

当产线保持不变但任务更加复杂时,如下视频,机器人需要协作打磨并分拣三种数量不同的工件,所提方法可以把数量最多的工件(高亮为紫色)分配到两条加工路径上以节省加工时间。

在下面的视频中,任务保持不变,但产线布局和资源数量发生变化。

机器人需要在新的产线中协作完成相同的打磨分拣任务,所提方法可以根据资源配置的变化自适应调整任务分配和加工路径,体现出较强的泛化能力。

真机部署

此外,论文还在多个真实工业产线中对方法进行了验证。结果表明,该方法能够适应不同产线环境和制造任务需求,进一步证明了其在实际工业场景中的应用能力。

结论

总的来说,论文提出了IMR-LLM,一个面向工业产线多机器人任务规划与程序生成的全新框架,其核心思想是让大语言模型负责语义理解,让结构化工具负责约束满足与可执行性保证。

此外,论文基于真实工业需求构建了IMR-Bench数据集。

最后,在模拟环境和真实产线部署中,证明了该方法显著提升了调度效率与任务成功率。

未来工作包括进一步探索执行反馈机制的引入,构建实时“推理-执行-纠错”闭环系统,增强算法在面对硬件故障或需求变化时的自适应能力,从而推动大模型在更复杂、更开放的工业具身智能场景中扎实落地。

论文标题:IMR-LLM: Industrial Multi-Robot Task Planning and Program Generation using Large Language Models

论文地址:https://arxiv.org/abs/2603.02669

项目主页:https://xiangyusu611.github.io/imr-llm/

本文来自微信公众号“量子位”,作者:IMR-LLM团队,36氪经授权发布。

+1
1

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

中国团队拿下世界模型量产第一

1小时前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业