影溯完成数千万美元融资：“物理世界是3D的，世界模型也该是3D的”

晓曦·2026年06月18日 12:14

世界模型正从生成“看起来像”的视频，转向构建“可计算、可交互的3D世界状态”。

「暗涌Waves」独家获悉，空间智能公司影溯（InSpatio）宣布完成数千万美元Pre-A轮融资。本轮由光合创投、顺为资本、红杉中国参与投资。

这笔融资背后的大逻辑，正在成为共识：物理世界是3D的，世界模型也该是3D的。AI要进入机器人、自动驾驶、游戏、影视、XR 和工业仿真等真实场景，必须先学会理解动态的3D物理世界。

过去两年，视频生成把“看起来真实”推到了新高度，但对物理AI来说，仅基于世界表象生成画面还远远不够。如果说2D视频是世界的投影，那3D世界模型则需要捕捉影子背后的动力学状态。恰似“看遍飞鸟的影子，也拼不出鸟的空间骨架与飞翔力学”。

机器人要在空间里自主行动，自动驾驶需预判复杂环境变化，游戏、XR要构建可交互的场景。这些需要的不是“像”，而是“是”：能理解空间结构、物体关系、运动变化与物理约束的3D原生世界模型。

影溯选择的正是3D原生路线。

影溯此前发布并开源InSpatio-WorldFM、InSpatio-World 等实时3D/4D世界模型，近期预告了全新世界模拟器Topos 1.0，即将开放Beta测试。

&amp;nbsp;

押注动态3D世界模型

大模型已经走到一个分水岭，世界模型正成为全球AI竞争的新方向。

语言模型教会AI理解和生成文本，视频模型教会AI生成画面，但如果AI要进入物理世界，仅有画面并不够。它需要理解空间、记住物体、预测变化，并在行动前推演后果。

这正是当下具身智能难以跨越的鸿沟。

一个服务机器人，看视频学会了抓杯子，换一个角度、换一张桌子，就可能失手。原因在于，视频记录了特定视角“看起来发生了什么”，却无法精确告知物体在哪里、空间如何连接、一次失败的抓取能否被稳定复现。而对物理AI来说，真正有价值的数据，是行动之后会发生变化、可以反复验证的动态 3D 世界状态。

因此，世界模型的竞争，正从“谁的视频更像真的”，转向“谁能生成可计算、可交互、可推演的世界”。

漂亮的视频更像渲染器（Renderer），它把既有状态描摹成画面；物理AI真正需要的是模拟器（Simulator），它维护世界状态，推演行动后果，让智能体在里面大规模试错。渲染器回答“看起来如何”，模拟器要回答“推一下，会倒吗”。

要成为模拟器，世界模型必须同时解决两个问题：效率、一致性。

3D原生路线不必让模型从冗余像素中艰难学习时空规则，显著降低训练和推理成本，让大规模并行推演成为可能。

一致性方面，2D模型一旦视角变大、时间拉长或出现遮挡，物体位置就可能断裂；3D模型则维护统一空间状态，使同一个物体在不同视角和时刻都能保持一致。

影溯的判断正是由此出发：“物理世界是3D的，世界模型也必须是3D的。”

他们不是把视频转成3D，而从空间骨架起步，先建几何结构，再衍生视角、表征运动、推演变化。巨头尝试用更大模型、更多算力在像素迷雾里逼近真实世界时，而影溯用空间几何大幅压缩了搜索空间。

InSpatio-WorldFM实现实时3D生成与多视角一致，InSpatio-World走向可漫游的动态4D世界，而Topos直接生成高保真、可编辑、可交互的仿真环境。

这些产品化能力指向一个非共识判断：3D原⽣表征可能成为世界模型的效率杠杆。

持续生产动态3D数据

互联网并不缺视频，缺的是带几何、尺度、材质、运动和交互关系的动态3D数据。

这类数据决定了物理AI能否从“看过”走向“学会”。机器人要适应不同房间、仓库、街区，实现能力泛化，需要大量可复现、可编辑、可验证的空间状态；自动驾驶要在长尾场景游刃有余，也需要可控地生成和重组动态环境。

因此，谁能低成本构建有时间维度的动态3D数据，谁就更接近物理AI的上游。

影溯团队在空间计算方向积累20余年，长期研究SLAM、三维重建、NeRF、3DGS、图形学和实时系统。他们可以从图片、视频、深度传感器数据等现实世界观测中提取空间结构，再将其转化为可学习、可编辑、可复用的 3D 表征。

这套系统还能通过仿真生成有物理标签数据，形成“真实采集、3D重建、生成式增强、模型训练迭代”的数据飞轮。

这也是投资人看中影溯的重要原因。世界模型正成为物理AI的基础设施；影溯具备稀缺的3D技术闭环和动态数据构建能力。这些能力有机会在机器人、自动驾驶、游戏、影视、XR 和工业仿真等方向落地，形成底层平台价值。

影溯方面认为，世界模型不是一个纯粹的算法问题。它需要生成模型，也需要图形学、三维视觉、物理仿真与实时空间计算系统的紧密铆合。它处理的不是文本或图像，而是会随时间流动的空间。

这也决定了，做这件事的团队既要懂几何与重建，也能理解深度学习，并有商业级系统交付能力。

影溯的团队正好落在这个交叉地带。创始人章国锋博士是浙江大学CAD&CG全国重点实验室教授、国家杰青，在3D视觉与空间计算/智能领域深耕二十余年，曾担任商汤科技数字空间事业群首席科学家，兼具顶尖学术研究与大规模产业落地双重实战积淀。联合创始人刘浩敏博士曾任商汤研究总监，长期负责3D视觉与空间计算/智能的技术攻关与工程落地。浙江大学长江学者、国家杰青鲍虎军教授作为首席科学家，所领衔的前沿研究团队也为影溯的世界模型和空间智能的构建提供了坚实的理论和技术支撑。

影溯不是看到风口后才转向3D，而是一支长期生长在空间计算/智能和三维视觉领域的团队，等到了AI叩响物理世界大门的时刻。

过去，3D技术更多服务于三维建模、数字孪生、空间定位和AR/VR。现在，当机器人、自动驾驶和空间智能都渴望一个可交互的世界模型，3D 成为世界模型嫁接物理属性、推演物理变化的基座。

据影溯方面介绍，本轮融资将主要用于模型研发、动态3D数据基础设施、算力基础设施、行业合作和人才招聘。随后其将加速推出Topos 1.0正式版并启动具身智能、游戏、影视等行业的标杆合作。对影溯来说，这更像是技术路线产品化的第一个信号。

当视频生成还在争夺观感时，世界模型的下一层竞争已经开始：谁能让AI 学会动态的 3D 物理世界，谁就有机会站在物理 AI 的数据上游。

影溯押注的，正是这层入口。

本文来自微信公众号“暗涌Waves”，36氪经授权发布。

本文由「晓曦」原创出品，转载或内容合作请点击转载说明；违规转载必究。

寻求报道