江行智能:从感知环境到改变世界:物理AI的机遇、路径与实践| 2026AI Partner·北京亦庄AI+产业大会
中国工业物理AI的真正优势不在模型参数,而在全球12倍的工业机器人部署密度、两倍的发电量和密集的5G边缘节点——场景密度、基建底座和开源模型的合力,正在推动物理AI从实验室走向规模化落地。
江行智能提出工业物理AI的三层模型,这套系统已在新能源场站和电网巡检场景落地——覆盖贵州、内蒙古等多地,核心算法准确率达99%。陈龙特别指出,工业场景下一个看似简单的巡检任务通常需要拆成100到200个子任务,这对AI的稳定性和可靠性提出了远超消费级应用的要求。
以下为演讲内容,经36氪整理编辑:
陈龙丨江行智能基模CTO
各位嘉宾、行业伙伴下午好,我是来自江行智能的具身基模CTO陈龙,我的分享题目是从感知环境到改变世界:物理AI的机遇、路径和挑战。
AI 的竞争已经从数字世界的模型参数之争,转向了真实物理世界的系统能力之争。中国凭借独特的五层产业基础,正在成为全球工业物理 AI 落地的最佳土壤。江行智能通过打造全栈工业物理 AI 模型架构,已经在新能源、电网等核心领域实现了规模化部署,证明了物理 AI 从概念走向现实的可行性。
AI 竞争正在从模型竞争走向物理系统竞争
过去几年,生成式 AI 在数字世界充分证明了自身价值,能够完成内容生成、代码编写、智能问答等任务。但对于工业企业而言,真正的价值前线不在屏幕里,而在风电场、光伏电站、变电站、矿山、化工园区和生产车间这些真实的物理空间。
AI 正在经历从 “生成答案” 到 “执行任务” 的关键演进。当 AI 走进工业现场,竞争的核心不再是模型参数规模或单点算法准确率,而是能否将人工智能稳定、可控、低成本地部署到真实物理世界。工业现场的任务从来不是 “看一张图判断有没有异常” 这么简单,它需要完成数据采集、环境理解、设备接入、任务规划、执行反馈和闭环迭代的全流程。这意味着物理 AI 不是一个孤立的模型,而是一套能够在现场持续运行的完整智能系统。
中国工业物理 AI 的五层基础与三大结构性机会
为什么工业物理 AI 在中国拥有最好的落地条件?中国已经形成了其他国家难以复制的五层系统性基础。
第一层是应用层。中国拥有全球最高密度的工业场景,工业机器人安装量约为美国的 8.6 倍,过去十年增长了约 12 倍。真实场景越密集,“数据 - 模型 - 具身智能机器人” 的闭环就越容易形成。
第二层是模型层。以 DeepSeek、通义千问(Qwen)、Kimi 为代表的国产化开源模型追赶迅速,性能快速逼近行业最优水平,并已在全行业完成广泛的垂直化部署,越来越贴近产业的实际需求。
第三层是基础设施层。中国 5G 基站数量已超过 448 万,全球占比超过 60%,同时新增发电容量也远超美国。这使得我们在端侧和边缘侧拥有更强的网络与基建能力,能够更好地支持物理 AI 设备的现场接入与实时交互。
第四层是芯片层。不可否认,我们在高端训练芯片领域与美国仍存在差距。但这一挑战也倒逼行业走上了更高效的技术路线,推动企业通过更优的模型结构、端边协同和软硬件联合优化来最大化现有硬件的性能潜力。
第五层是能源层。当前中国发电量约为美国的两倍,发电机组装机量更是达到美国的三倍。充足且稳定的能源供给,为 AI 从云端训练走向大规模现场部署提供了长期的底层支撑。
这五层基础叠加在一起,使中国工业物理 AI 不只是有技术想象,更有真实的落地土壤。在此基础上,我们总结出中国工业物理 AI 的三类核心结构性机会。
第一类是供给侧底座机会。能源、网络、基础设施和边缘节点的持续完善,为 AI 进入工业现场提供了长期可靠的支撑。
第二类是现场侧闭环机会。高密度的工业场景、大规模的机器人部署和多模态传感设备,让物理 AI 能够形成 “部署 - 采集 - 训练 - 迭代 - 再部署” 的完整数据飞轮,这是其他国家无法比拟的优势。
第三类是效率侧路线机会。高端芯片的约束会推动行业走向更高效的模型、更强的边缘智能和更深的软硬协同,使工业物理 AI 更加注重低成本、可控性和可部署性。
江行智能的定位,正是把这些组合优势组织成可部署、可复制、可持续迭代的工业物理 AI 系统。
江行智能全栈工业物理 AI 模型架构
工业现场的问题不能靠单一模型解决,它需要数据基础设施、物理世界建模、行业大模型、应用框架、设备控制和安全机制协同工作。基于这一认知,江行智能打造了面向工业场景的三层全栈物理 AI 模型架构,围绕工业物理 AI 对自主性、多模态、长任务和可靠性的核心需求设计。
数据与基础设施层:JX-Phi World 双轮驱动
作为整个架构的底座,JX-Phi World 采用 AutoEdge 和 AutoWorld 双轮驱动的核心设计,解决模型训练更快、落地更稳、成本更低的问题。
AutoEdge 负责真实工业数据的全流程处理,包括多模态环境数采、云端训练、边端推理、模型部署和 OTA 升级。它能够持续采集真实现场的任务、设备、工况和反馈数据,同时通过边缘侧推理显著降低网络传输压力与模型端到端时延。底层数据涵盖了传感器、热成像、无人机巡检以及低轨卫星遥感等工业现场的全维度信息。
AutoWorld 则是世界模型仿真和数据引擎。工业 AI 的一大痛点在于,很多关键异常并不高频发生,但一旦发生就必须准确识别和可靠处置。真实工业数据通常只能覆盖 90%-95% 的常规场景,对于极端天气、突发事件等 5% 的潜在风险与极端工况存在数据缺口。AutoWorld 通过生成式 AI 与 3D 重建技术,模拟生成各类罕见场景和复杂任务过程,支持 Sim-to-Real 迁移,让 AI 在仿真环境中把错误犯完,再部署到真实现场。
模型层:JX-Phi Brain 向工业场景 WAM 演进
JX-Phi Brain 是整个架构的核心大脑,正在向工业场景 World Action Model(WAM)演进,融合了三类核心能力。
第一类是空间视觉语言模型(S-VLM),解决 “感知 + 理解” 的问题。工业现场不是一张平面图,而是包含设备、人员、空间关系、运行状态和行业规则的动态环境。S-VLM 不仅能够感知工业厂房的物理环境,还能理解各类传感器读数与环境参数,实现跨模态推理与工业场景建模。
第二类是长任务视觉语言动作模型(LT-VLA),解决 “感知 + 执行” 的问题。工业任务往往不是一步完成,而是多任务、多设备、多流程协同。LT-VLA 能够感知现场环境约束与任务要求,将复杂工业任务拆解为一系列可执行的子任务,并实现自引导式的任务优化与动态调整。
第三类是行业垂类模型,把电力、化工、矿山等行业的专业知识融入模型,使模型能理解强规则、强约束、强安全要求下的真实任务。目前江行已经在电力、化工、矿山等行业支持超过 1000 个场站和点位的常态化数据采集,持续构建 “模型 + 数据” 的闭环。
应用层:JX-Phi Agent 通过工业 Harness 与一脑多体实现价值落地
模型本身不会自动创造产业价值,价值发生在模型被封装成可部署、可调用、可监管的现场系统之后。JX-Phi Agent 应用层的核心是工业 Harness 和一脑多体控制两大技术。
工业 Harness 负责把任务拆解、安全规范、工具调用、规则约束、异常响应和全程留痕组织起来。它让模型不是自由发挥,而是严格在工业流程和安全边界内运行,同时能够整合行业知识库与下游专用模型,对模型输出结果进行自动复核,并支持专家人工审核介入。
一脑多体则是面向复杂现场的协同控制引擎。核心是一个参数量达 100B 的全局预控制器,负责跨工区的全局任务调度与管理。一个站端大脑,可以接入无人机、机械狗、轮式机器人、固定摄像头、传感器、机械臂等多种终端,实现任务分配、状态同步、冲突消解和协同执行。目前该架构已在贵州山区电网、内蒙古沙漠光伏等复杂场景成功部署,实现了具身终端在客户侧的规模化应用。
四大关键技术支撑工业物理 AI 落地
为了支撑全栈架构的高效运行,江行智能在四大核心技术领域实现了关键突破。
第一项关键技术是动态可更新的工业场景底座。真实工业现场是动态变化的,一次性建好的三维模型很快就会和真实现场脱节。江行通过 TrackerSplat 技术解决了动态场景中的稳定重建问题,能够在机器人移动过程中清晰抓取仪表盘等关键传感器数据,有效过滤雨滴、电磁干扰等环境噪声。同时通过 SizeGS 技术解决了弱网环境下的三维内容压缩和传输问题,确保检测结果与中间决策能够稳定回传云端大脑。
第二项关键技术是世界模型与物理推演。工业现场真实试错成本极高,尤其在电力、能源、化工等场景,有些错误绝对不能在真实现场发生。江行通过世界模型把 “真实、仿真、真实” 组织成闭环训练,让机器人策略先在仿真中试错、评测和迭代,再迁移到真实现场,大幅降低了落地风险和成本。
第三项关键技术是多模态感知与根因分析。江行融合了红外热成像、可见光、三维空间信息、设备状态数据以及无人机、低轨卫星遥感数据,让模型不仅能够看到异常,还能理解异常发生在哪里、为什么重要、风险等级如何,以及下一步应该怎么处理。这实现了从 “缺陷识别” 到 “缺陷理解” 的跨越,为客户提供真正可执行的运维决策。
第四项关键技术是 VLA 执行闭环与一脑多体协同。江行通过 DyGRO-VLA 技术和一脑多体系统,让全局大脑完成语义理解、任务拆解、目标分配、路径规划和冲突消解,再由具身终端完成导航、避障、读数、复核、操作和状态回传。与消费级具身智能的短任务不同,一个简单的机械狗检查设备读数任务,在工业场景中通常要拆成 100 到 200 个子任务,还需要综合考虑地形、气候等环境因素。
两大标杆案例验证物理 AI 规模化价值
江行智能的全栈工业物理 AI 技术已在多个核心工业领域实现规模化落地,其中新能源风光场站和电网变电站是两个最具代表性的场景。
在新能源领域,江行打造了风、光场站物理 AI 运维系统,实现了升压站、光伏板区、风机区、周界道路等多区域的全域覆盖,支持 7×24 小时全天候巡检。系统已经在全国 600 + 站群级场景中验证,能够跨区域、跨站型、跨业主快速复制。传统人工巡检一个大型场站可能需要 30 天以上,而物理 AI 系统只需 2 天即可完成全站巡检,彻底重构了新能源运维的效率。
在电网领域,江行的变电站物理 AI 智巡系统构建了中枢大脑、具身大脑和可控终端的协同体系,实现了空地立体巡检和多终端协同执行。系统覆盖站内 1 万 + 高密度智巡点位,能够在 4 小时内完成单次全站巡检,核心算法准确率达到 99%,平均准确率达到 96%。目前该系统已覆盖全国 27 个省份,在国家电网和南方电网体系中完成了 500 + 场景落地。
特别值得一提的是,江行开发的搭载机械臂的机械狗,能够自主完成电表箱开启、设备读数读取、简单调压操作等复杂任务,特别适用于狭小空间、高危区域等人员难以到达的场景。该设备采用端边云协同架构,在机械狗本地部署了 8B 参数量的端侧推理模型,同时结合边缘与云端的算力资源,实现了高精度、低时延的作业能力。
江行智能作为工业物理 AI 的坚定实践者,坚信物理 AI 已经从概念走向了现实。下一阶段 AI 最重要的产业价值,不会只发生在屏幕里,而会发生在真实空间、真实设备、真实任务和真实生产力之中。
江行智能希望和更多产业伙伴一起,让物理 AI 走进真实工业现场,从感知环境开始,真正用智能改变工业世界。
谢谢大家!















