库萨科技发布全模态具身模型Kusa Omni-CTS与专用操作系统Kusa OS,助力城市服务机器人从"执行者"变为"思考者"
7月2日,库萨科技正式发布面向具身智能的全模态具身模型 Kusa Omni-CTS 与专用操作系统 Kusa OS。这是库萨首次完整披露其城市服务具身智能技术架构:以真实城市复杂场景为核心训练场,打通“全模态感知—物理级推演—实时控制”的完整技术链路,让城市服务机器人在边界模糊、交互对象复杂、任务需求动态的作业环境中,从被动执行指令走向主动理解物理世界。
库萨科技始终致力于打造城市服务机器人,让机器人在边界模糊、交互对象复杂、任务需求动态的作业环境中,从被动执行指令走向主动理解物理世界。
Kusa Omni-CTS:全模态感知,构建物理理解能力
城市服务的复杂性,决定了它不能靠穷举规则来解决。规则驱动的逻辑是遇到A执行B,但城市里的物品关系、人员行为和环境持续变化,规则库很难覆盖所有组合。
Kusa Omni-CTS并非单一技术点的深入,而是在全模态融合的广度与物理理解的连续性上做的系统性变革,通过三项关键突破实现从"背诵规则"到"理解世界"的转变。
1.三大模态原生融合,物理交互"感受"世界
要真正理解物理世界,光看、光听是不够的——机器人还需要"感受"接触。视觉能识别"前方有垃圾桶",语言能传达"把这里扫干净",但如果缺少对力度、摩擦、负载的感知,机器人在真实场景中始终隔着一层。这种对物理交互的"无感",限制了机器人在真实场景中的判断能力。
Kusa Omni-CTS将输入模态扩展为涵盖物理交互的三大核心模态:
· 视觉空间感知:识别"前方是路沿""右侧有行人"等外部空间信息
· 语义与先验指令:理解"在遵守交通规则的前提下,完成贴边清扫,保证设备与环境安全"等任务约束
· 本体感知与动力学:反映"扫刷已经接触路沿,电机负载正在上升"等身体状态反馈
三类信息互相校验,机器人结合外部环境与自身状态作出判断——不止"看见",更能通过物理交互"感受"环境。
2.跨模态异步特征对齐,数据自然流动
机器人搭载的各传感器以不同频率运行:触觉、IMU和轮速等本体感知数据通常在200Hz至1000Hz,相机约30Hz,激光雷达可能只有10Hz。
传统方案依赖严格的硬件时间同步,一旦出现时钟漂移、触发延迟或局部丢帧,融合结果就可能出现偏差。Kusa Omni-CTS采用连续时空表征,将不同频率的数据映射到连续时间轴,在模型内部完成异步特征对齐。视觉、语言、触觉各自按自己的节奏采集信息,在模型里自动"对表"。这一工程转变降低了硬件依赖,提升了系统鲁棒性,且当传感器配置变化时,模型可通过少量自适应微调快速适配。
3.物理一致性预测,反事实推演闭环
Kusa Omni-CTS在高维空间中建立符合物理动力学限制的连续轨迹,让机器人的动作遵循物理定律的"惯性"与"约束",保证控制指令的平滑执行。
在预判环境演变的基础上,模型引入了反事实推演机制——在执行前于虚拟空间中对动作后果进行预判和试错,推演通过后再付诸行动。每一次推演均受动力学约束,有惯性、有摩擦、有机器人自身的物理极限,使机器人在开放场景中的决策拥有明确的物理依据,同时保障非结构化场景下的安全交互。
此外,Kusa Omni-CTS可使模型迅速适应不同架构的机器人执行体,实现"一次预训练、多形态部署"的跨形态泛化应用。
Kusa OS:面向具身智能的专用操作系统
场景理解能力再强,如果无法及时转化为行动,一切等于零。城市开放环境中,突发状况常在毫秒之间——突然冲出的行人、被风吹来的障碍物、湿滑路面的侧滑风险。Kusa OS的存在,就是为了让模型输出的智能决策能够被精确、及时地执行。
Kusa OS专为边缘侧高实时性、高可靠性的多任务调度场景设计,核心目标是为具身智能提供低延迟、确定性调度、易扩展的运行环境。系统时延小于1ms,极致抖动控制仅50μs,确保机器人在复杂场景下的精准协同。
其核心设计在于确定性:当感知、规划、通信等任务争夺计算资源时,紧急制动等硬实时任务始终获得最高优先级,不会因为低优先级任务的阻塞而延误。
在开发者体验层面,Kusa OS提供统一的硬件抽象接口,告别繁琐的底层适配工作,让开发者专注算法本身。传感器即插即用,算法模块可灵活组合,资源由系统智能分配。当关键任务超时或异常时,系统自动触发安全降级,使机器人进入预设的安全状态。
Kusa OS的另一项核心能力是"一脑多形"——同一套系统可适配并指挥形态、大小各异的城市服务机器人。目前已在库萨0.5吨级、1.5吨级、3吨级产品矩阵中部署应用,从小型公共空间到市政道路,同一套操作系统完成适配。
这套系统的技术基础,来自库萨核心团队多年的积累,历经自动驾驶、车规芯片、机器人三大体系的落地验证,已在超40座城市的复杂环境中持续接受考验。
Kusa Omni-CTS 与 Kusa OS:感知理解,实时执行
Kusa Omni-CTS负责感知理解、作出智能决策,Kusa OS保障决策的毫秒级执行与多形态调度。两者协同驱动,共同构成库萨此次发布的城市服务具身智能技术基座。
库萨以全模态具身模型与专用操作系统的组合,构筑了具身智能的技术壁垒。库萨将持续引领城市服务机器人的智能化跃迁,深耕城市服务领域,推动机器人在复杂场景中从盲目的"执行者"成长为拥有物理直觉的"思考者"。















