硬氪首发 | 清华车辆学院师兄弟创业具身智能，已完成数亿元天使融资，将落地汽车产业

邱晓芬·2026年07月05日 14:25

「光象科技」选择了一条区别于主流VLA和视频预测式世界模型的技术路线。

作者 | 邱晓芬

编辑 | 袁斯来

硬氪获悉，具身智能公司「光象科技」宣布完成累计数亿元天使轮融资。

最新一轮由珠海科技产业集团、兴证资本、松禾资本、顺禧基金、慕华科创、SeeFund、亿宸资本、上市公司行云科技等头部财投与产投深度参与，老股东零一创投、L2F光源创业者基金持续加注。

本轮资金将重点投入物理原生基座模型的研发迭代，并推进具身智能机器人在工业场景的商业化交付。

「光象科技」成立于2025年4月，是清华大学车辆与运载学院与人工智能学院联合孵化的具身智能公司。

在团队配置上，「光象科技」呈现出“产业+学术”的基因。公司创始人兼CEO张涛曾任高德空间感知引擎负责人，主导的技术此前已量产落地至数百万车载终端；

联合创始人李升波教授是强化学习与自动驾驶领域国际知名专家，发表论文250余篇，引用超30000次，连续5年入选爱思唯尔中国高被引学者。

公司团队其他成员主要来自阿里巴巴、腾讯、华为、库卡、极智嘉等科技与机器人企业，具备丰富的机器人全栈技术与商业化落地经验。

技术路线的选择上，「光象科技」选择了一条区别于主流VLA（视觉-语言-动作）和视频预测式世界模型的路径。

张涛向硬氪表示，VLA路线本质上是感知与动作的映射器，依赖对人类演示数据的模仿，泛化能力有限；而视频预测式世界模型仅聚焦于像素级预测，无法刻画质量、惯量、摩擦等物理属性，难以支撑通用泛化的动作生成。

在他看来，真正的物理原生智能，是在与物理世界的感知、交互、反馈、探索与约束中自主涌现的能力。因此，物理原生基座模型，必须以物理交互为首要原则，能够从物理环境中持续学习世界规律、行为后果与任务约束。

为此，「光象科技」提出了“物理原生基座模型”的技术路线，其核心逻辑是让模型在与物理环境的交互中自主涌现对物理规律的理解，而非单纯模仿人类动作。

为支撑这一路线，公司构建了由强化学习算法矩阵Phi-RL Matrix、物理数据资产Phi-Space、通用物理智能开发平台Phi-Arch协同，所构成的“三位一体”技术体系——

算法层面，公司自研了行业内顶尖的强化学习算法矩阵Phi-RL Matrix。不同于传统的“看视频学动作”，这套算法的核心逻辑是让机器人在仿真和真实环境中通过海量试错，自主掌握物理世界的运行规律。

数据层面，依托物理数据资产Phi-Space，「光象科技」在虚拟世界里重建了真实海量场景——利用自研的三维与物理建模技术，系统不仅能复刻真实场景的几何形状，还能精准模拟出质量、摩擦、形变等物理属性。结合生成式模型，仿真场景可以实现指数级扩张，为算法训练提供近乎无限且低成本的数据燃料。

平台层面，通用物理智能开发平台Phi-Arch，「光象科技」解决了技术复用的难题。具体而言，它构建了一套稳定的仿真-训练-验证-部署的工程体系，并将模型训练的底层数据、算法、工具等沉淀为标准化资产，确保在技术快速更新的过程中模型持续迭代的稳定性，并让机器人的“学习成果”可以快速迁移落地。

在打好技术基础之后，「光象科技」也快速落地了自己的产品。

2026年6月，「光象科技」正式发布工业级自进化具身智能机器人Phi-Bot X1。这款专为工业场景设计的机器人采用四舵轮全向底盘，支持主动转向、横向“蟹行”、斜向移动与原地回转，可在作业状态下，自主锁止以保障稳定性；升降腰结构使其垂直工作区间覆盖0至2.5米；

据张涛介绍，Phi-Bot X1的全身具备27个自由度，全关节力控双臂支持1kHz协同控制与实时力反馈，仅依靠本体感知即可实现10mm定位精度与0.05mm末端重复定位精度，且支持1分钟快速换电。

与行业内常见的“先发PPT、后做产品和场景验证”不同，「光象科技」在正式发布产品之前，其机器人已经在汽车产线完成了真实的作业验证。

（图源/企业）

在2026 ATC展会上，Phi-Bot X1连续三天持续运行21.5小时，完成汽车产线焊接上下料全流程作业，零失误零中断；

在双孔同时对准作业中，仅依靠本体感知将动态操作精度控制在毫米级，角度精准控制在0.3°以内，动态环境下连续工作成功率100%。

依托泛化技能模型，Phi-Bot X1在移动质检场景中相较非协同方式效率提升51%，较人工工位节拍节省25%至45%，部署周期从传统自动化的6个月以上压缩至周级甚至天级。

（图源/企业）

在初步验证商业化落地可行性之后，「光象科技」未来将快速拓展落地规模。

张涛向硬氪判断，汽车产业百年的自动化历程中，凡是现有技术手段能解决的问题早已被解决，具身机器人应当去啃“机械臂和PLC解决不了”的30%数字化缺口，比如存在灼伤风险的焊接上下料、需要灵活调整视角且一致性要求高的尾线质检，以及对工人颈椎腰椎不友好的高/中/低工位装配等等。

目前，「光象科技」已围绕汽车制造中的上下料、质检等典型高价值工位完成真实场景验证，并与多家国内外头部汽车企业达成商业合作。

张涛向硬氪预计，国内汽车产线机器人市场规模约1000亿元，公司计划先做深汽车场景，再用3到5年时间向更广泛的工业场景延伸。

以下是硬氪与张涛的访谈（略经摘编）：

硬氪：此前多家具身智能公司尝试进入汽车场景未果，行业甚至出现“汽车场景被证伪”的声音，你们为何反向选择聚焦汽车？

张涛：机器人进汽车场景绝非证伪，而是“没准备好”。早期进入汽车场景的公司大多先讲故事再适配产品，对场景工艺缺乏认知。以某国际豪华汽车厂商为例，之前合作的某人形公司采用双足+灵巧手方案做焊接上料，因行走震动导致工件掉落率80%，最终被迫挂载AGV才勉强跑通——这本质是本体设计未匹配场景需求。

汽车制造是工业新技术最早的试验场，PLC、机械臂、AI质检均起源于此，且现有技术能解决的问题早已被自动化覆盖，具身机器人恰恰该做那些“遗留的30%数字化缺口”。

硬氪：汽车场景里，具身机器人的核心切入点是什么？

张涛：不是替代已成熟的90%机械臂工位，而是解决三大类“自动化盲区”：一是职业健康风险场景，如焊接上下料的灼伤风险、高/中/低工位装配对颈椎腰椎的损伤；

二是质量一致性场景，如尾线质检，固定摄像头无法灵活调整角度，AI质检召回率不足；

三是柔性生产场景（如多车型混线时的动态调整需求）。我们的Phi-Bot X1已实现焊接上下料连续21.5小时零失误，移动质检效率较人工提升25%-45%。

硬氪：你们所谓的“物理原生”，和目前主流的VLA、世界模型有什么区别？

张涛：VLA本质是“动作映射”——在预训练VLM后嫁接动作专家，通过拟合人类演示数据学习，换任务、换传感器位置就要重训，泛化性弱。世界模型主要是做像素层面的世界预测，对于背后的物理规律，尤其是世界变化与行为的因果关系认知有限。我们的物理原生模型核心是通过物理交互让机器人自主掌握物理因果规律。

比如，在上下料对孔场景中，不需要采集海量“放歪了怎么调整”的数据，而是让机器人在高保真仿真里并行试错，自主学会“卡住时往哪个方向调整能对齐”。一台显卡可虚拟1000台机器人同步迭代，成本远低于真机采数据。

硬氪：如何看待车企自研机器人？会与你们产生竞争吗？

张涛：车企自研机器人若以“进自己产线”为目标，商业逻辑不成立。一家车企的产线数有限，做出来的方案别的车企也不会用，数据无法跨厂流通。

特斯拉、小鹏做机器人更可能奔向C端家庭场景，与我们的B端工业定位是互补关系。车企的优势在制造与渠道，但具身智能需要技术范式的变革，传统Tier1供应模式很难长出核心算法能力——参考自动驾驶，多数车企自研效果并不理想。

硬氪：光象的硬件是自研吗？未来硬件会成为壁垒吗？

张涛：前期采用“自研设计+外部供应商OEM集成”模式，后续逐步收回核心硬件能力。但长期看，中国供应链成熟后硬件会快速平权。

硬氪：未来会做To C吗？上市计划是什么节奏？

张涛：To C至少3-5年后再考虑。上市有规划，但不是现阶段核心目标，当前重心是打磨产品与场景落地。我们更关注卖出去的机器人有多少在活跃使用，因为只有真实场景的持续反馈，才能形成产品闭环，这才是具身公司的核心竞争力。

硬氪：如何行业当前处于什么阶段？是否存在泡沫？

张涛：2026年是从“看demo”转向“看落地”的拐点。接下来1-2年，落地数据将决定行业走向。当前确实存在“假落地”现象，但最终会回归商业本质。

我们不追求短期高估值，公司2025年4月才正式成立，前期花两三个月泡在车厂调研工艺，让机器人先在产线干起活再来发布产品。具身智能是一个10年、20年的赛道，第一年是否高调并不重要。

首页图源 | 企业供图