机器人还不会做家务，先学会了说“爱”你

盒饭财经·2026年07月02日 18:24

交付本身正在成为研发方法。

发布会之后，讨论的重心很快从“存钱购买”转向价格、外观和实际能力。

6月2日，优必选的抖音官方账号发布了一个视频。视频里是两个背影，昏暗，给人遐想。视频文案为“全球首款全尺寸超仿生人形机器人正式登陆京东开启预售！”。其中，点赞最多的那条评论是“我将开启史诗级存钱计划”。截至7月1日晚8点20分，11.1万个赞，3220多条回复。

随后就是，优必选在抖音上不定时发布的“成绩单”。6月5日，3天累计突破1000+台；7日，6天累计突破2110+台；9日，8天累计突破3000+台；21日，20天累计5000+台。

6月30日，深圳，优必选年度发布会同日，这个数字再次正式更新。优必选宣布U1线上线下全渠道订单累计达到13361台，将从9月16日起交付。

但随着价格和现场展示公布，质疑声随之出现。

发布会上U1系列的价格、产品也逐渐被公布。价格方面，U1系列依据不同产品定制了不同的价格：U1 Pro价格为16.98万元，U1 Ultra男版和女版价格分别为99万元和88万元，轻量化半身的U1 Lite价格为11.98万元。

据《每日经济新闻》报道：这些“长着人脸”的机器人登台展示，行走过程中机械感十分明显，外观也和此前网络上公布的渲染图存在差距，甚至有部分网友评价其“货不对板”。

优必选2026年度全球发布会展厅

陪伴、进入家庭、情感需求，这是优必选这次打出来的明牌。但这三个词组合在一起，U1系列就像是一款以正式商品形态出售的品类Beta。

过去，人们对全尺寸仿生机器人的理解主要来自影视作品。它既拥有接近人的外貌，也能够理解情绪、处理家务，并在长期相处中形成稳定人格。然而，现实中的消费机器人则大多选择缩小问题：做成桌面设备、AI玩具、机器宠物，或者保留明显的机械外观。按照优必选的定义，U1是全球首款面向规模量产设计的全尺寸超仿生人形机器人。

但所有新品类都要经过真实世界才能成熟。当一批用户以定金锁定购买资格，而整个系列的起售价被标到11.98万元，他们等待的究竟是一台完成的产品，还是一张关于未来能力的期票？

三个版本，一次产品定义实验

周剑并非最近才想到要进家庭场景。

创业早期，周剑的愿景就是让机器人进入普通家庭。到2024年7月，优必选仍公开强调工业制造、商业服务和家庭陪伴三大场景，同时判断智能制造会最先实现大规模应用。

2025年12月26日，优必选第1000台工业人形机器人Walker S2下线。采访中，周剑表示，相比做表演，人形机器人更要进工厂干实事。在此基础上，他还给出了明确的战略路径：“优必选对人形机器人的应用场景明确了先工业制造、后商用服务、再家庭陪伴的三步走战略规划，目前首先在工业制造场景实现规模化落地。”

数日后的2026年1月上旬，周剑在采访时给到了一个关于人形机器人进家庭的两个判断。

一是关于功能的。他表示，“我觉得按照目前语言大模型的发展，家庭情感陪伴应该是最先能够实现的。其次，是物理功能，比如洗碗、洗菜、切菜、做饭等家务工作。”

二是发展节奏方面的。他认为，如果行业发展迅速，那么最快3到5年内能够实现，情感陪伴将是首先实现的场景。如果慢一点，则需要7、8年甚至10年的时间。

不到半年后，U1系列被摆上发布会。

6月30日发布会后的采访中，他把U1称为陪伴功能的起步：物理世界能力还没有完全构建，语言和情感模型可以先做交流，工业与商业场景继续积累真实世界数据。

U1发布会给出了三个版本，分别是：U1 Lite是半身版，Pro是高配全身版，Ultra是高动态全身版。

“Lite半身版”，顾名思义，保留仿生脸、颈部和上身动作、语音、记忆与主动交互，但没有完整腿部等下半身。也就是说，在一个普遍用奔跑、后空翻和双足稳定性证明技术进步的行业里，优必选把腿从入门款上拿掉了。

Lite半身版，优必选官网截图

这不是简单减配。

双腿意味着更多执行器、更高功耗、平衡控制、家庭导航和跌倒风险。Lite删掉了人形机器人中执行器密集、控制复杂、家庭安全挑战突出的双腿系统，保留的是构成“在场感”的部分：脸、声音、姿态和记忆。

Pro在Lite的基础上，补全了人形。但补全四肢不等于获得自主行动能力。优世界京东自营旗舰店客服在回应中称：预售主力U1 Pro目前不具备自主行走和家务劳作能力。

三款机器人，目前U1 Pro是官网上唯一拥有完整参数介绍的。

优必选官网截图

据优必选官网介绍：U1 Pro全尺寸超仿生拟态雕塑级身材复刻，全身自由度88DoF，还拥有行业独创的“双支点+四连杆”仿生颈椎，超高自主自由度5DoF，高精度直线舵机0.06mm。还具备33轴面部肌腱网络，19个主动自由度灵动面肌，可达到的自然微表情30+，情感表达准确率90%。

优必选官网截图

Ultra看起来像是在Pro的基础上，加入自主行动、高动态运动和开发能力。

三个版本由此构成一场产品定义实验。市场到底愿意为一个能对话的仿生上半身支付多少，为完整人形支付多少，又有多少客户真的需要一具能够自主移动、价格接近百万元的身体？

优必选给U1设定的主要场景并非家务，而是日常陪伴、情绪支持、社交辅助、商业接待、文旅展览和康养。据科技日报报道：U1可识别20余种细粒度情绪，准确率超过90%，并通过Agent Memory OS保存长期记忆；数据采用本地优先处理，用户可以查看、导出和删除。公司尚未公开上述准确率的测试集、人群构成和混淆矩阵。

优必选官网页面显示，仿生机器人超强AI处理器，算力高达200TOPS。同时，还搭载行业首创针对“长期陪伴”的Resonance-LM情感共鸣大模型，配备的文案是：“你不说我也懂你，看懂、听懂、读懂”。

优必选副总裁、具身智能与人形机器人研究院院长焦继超在接受采访时表示，仿生头部需要重新设计脸部肌肉、颈部和眼球双目视觉，许多零件没有成熟供应；19个面部执行器还要在有限空间里解决结构和散热问题。他直言，一万多台的量产“是很大的挑战”。

“爱”是怎样被制造出来的

如果只看舞台效果，U1像是突然学会了察言观色：摄像头看到表情，麦克风听到语气，机器人调取记忆，再以声音、唇形和眼神回应。

但把过程拆开，背后更像一支分工明确的剧组。

优必选官网截图

摄像头和麦克风是摄影与收音，负责捕捉面孔、姿态、说话内容、音高和停顿；情绪模型像场记，把这些信号归入“疲惫”“高兴”或“沮丧”等标签；记忆系统是人物小传，从过去的对话中查找称呼、偏好和经历；大模型是编剧，生成一句适合当前语境的台词；语音合成、唇形控制和面部执行器则负责把台词演出来。

整套剧组可以完成一场可信的表演，但表演完成不等于演员拥有角色的感情。

首先，情绪识别是一道概率分类题。

2019年7月，美国东北大学心理学家Lisa Feldman Barrett、加州理工学院神经科学家Ralph Adolphs等五位作者在《Psychological Science in the Public Interest》期刊上，发表了一篇综述论文《重新审视情绪表达：从人类面部动作推断情绪的挑战》 (Emotional Expressions Reconsidered: Challenges to Inferring Emotion From Human Facial Movements)。

文中回顾1000多项研究后指出，特定面部动作不足以可靠、特异地诊断一种情绪；面部动作可以被检测，其心理意义却依赖情境、文化和个人。这个研究强调面部动作确实传达了信息，但其心理意义必须结合情境（Context）来理解，而不存在一种跨文化、通用的“读心术”模型能仅靠脸部识别就准确锁定人类的内心感受。

怎么理解？

换句话说，模型可以像气象站一样读取几支温度计，却不能仅凭气温知道一个人为什么觉得冷。

优必选官网上介绍“识别20余种情绪、准确率超过90%”。严格来说，在没有数据集、类别分布、跨年龄与文化测试之前，它还不能被换算成家庭场景里“懂人”的概率。

其次，长期记忆也不是模型自然长出了一段人生。

《基于大语言模型智能体的记忆机制综述》 (A Survey on the Memory Mechanism of Large Language Model based Agents)一文中，总结了常见工程路径：系统把对话中的事实或摘要写进外部存储，需要时再检索并注入上下文。通过这种“写入-存储-检索-注入”的机制，可以让智能体在跨会话交互中保留并调用部分历史信息，从而表现出更强的连续性。

来源：《A Survey on the Memory Mechanism of Large Language Model based Agents》

但记住一个事实，不等于拥有共同经历。

它像一名替演员管理索引卡的秘书。卡片上可以写着“用户不喝冰水”“上周刚换工作”，让下一次回答更贴身。而错误也可能发生在记录、摘要、检索和生成的每一环。

在优必选已公开的关于具身智能的研究中，最扎实的公开成果主要服务工业视觉、规划与控制，而不是U1系列的情感模型。

2026年1月29日，优必选团队发表的《Thinker: A vision-language foundation model for embodied intelligence》一文。该论文披露的训练数据包括170万视觉定位样本、10万第一视角推理样本、180万机器人操作规划样本和20万内部工业任务规划样本。它试图解决视觉语言模型在机器人场景里的两个具体问题：混淆第一人称与第三人称视角，以及忽略视频末尾的关键信息。

来源：《Thinker: A vision-language foundation model for embodied intelligence》

这篇论文展示了如何通过特定视角的训练数据和改进的视频输入策略，试图增强模型在第一视角空间理解、视觉定位、时序推理和机器人任务规划基准上的表现。

简单粗暴理解，就是Thinker像一个“看图排工作单”的调度员，判断物体在哪里、刚才发生了什么、下一步先做哪件事。

而“身体”的进步则来自更慢的工程积累。软件替机器人写好了台词，身体仍在练基本功。

机器人身体方面的硬件，并没有经历类似大模型的“涌现时刻”。

一具人形本体，大概由电机、减速器、丝杠、编码器、力传感器、电池和控制器共同组成。每个关节都要在重量、扭矩、精度、散热和寿命之间反复取舍：力量更大，往往意味着更重、更热；结构更紧凑，又会增加装配和维修难度。

麦肯锡在2026年4月发布的人形机器人供应链报告中估算，执行器约占整机物料成本的40%至60%。它们的进步通常不是能力突然翻倍，而是重量下降一点、寿命增加一些、良率提高几个百分点。在2025年10月15日发布的《Humanoid robots: Crossing the chasm from concept to commercial reality》中，也给出了相同的区间。

而仿生路线又在普通人形机器人的难题上增加了一层。

机械骨架是刚性的，皮肤却是柔性的；舵机转动一个固定角度，硅胶表面未必会形成自然表情。工程师不仅要让眉毛、眼睑、嘴角和颈部运动，还要解决微型执行器的噪声、散热、皮肤拉扯和长期老化。对话模型可以在服务器上更换，埋在脸部内部的舵机和传动结构一旦交付，能力上限基本就被固定下来。

这也是软件和硬件最根本的速度差。U1呈现出的跃迁感主要来自软件和交互层，支撑这张脸长期、稳定、安全运行的身体，仍要按照传统工业的节奏逐步爬坡。

急着进家庭

把产品在能力尚未完整时推向市场，并非优必选独有的选择。过去两年，具身智能行业的竞争单位已经从一次演示，转向真实场景里的持续运行。

2024年6月5日，美国佐治亚州亚特兰大附近，Agility Robotics的双足机器人Digit进入GXO仓库日常运营。它的工作很窄：从协作机器人处接过料箱，再放上传送带。

6月27日，双方宣布多年期RaaS协议。其GXO自动化负责人Adrian Stoch把这次合作描述为从试点走向真实仓库。Agility时任CEO Peggy Johnson强调的指标也不是机器人会多少动作，而是能否在客户现场创造收入、解决问题。

窄任务的意义在于，运行可以被计费，也可以留下连续数据。一次展会演示只需要成功一次，仓库里的机器人必须在不同班次重复动作，并暴露停机、维护和流程衔接问题。

Figure走得更进一步。

2025年11月19日，据Figure披露，Figure 02在宝马美国南卡罗来纳州Spartanburg工厂的10个月部署中运行超过1250小时，装载9万多个零件，参与3万多辆BMW X3的生产。随后，这批Figure 02全部退役，现场经验被转入下一代Figure 03。

到2026年4月29日，Figure宣布其BotQ工厂已经生产350多台Figure 03，速度从每天1台提升到每小时1台。即便如此，Figure披露的整机一次通过率（first-pass yield）仍只是“80%以上并每周改善”，同时设置50多道过程检测和80多项终检。

Figure在官网中直白地写道：机群扩大后会产生更多Helix模型数据，更长运行时间也会暴露小规模测试看不到的故障。

这里的量产不是研发结束，而是研发终于离开实验室。机器人必须先成为持续运行的节点，模型才会得到真机数据，供应链才会看见良率问题，工程师才知道哪个关节最先坏。

竞争随后从工厂进入家庭。

2025年10月28日，挪威机器人公司1X开放家庭机器人NEO预订，买断价2万美元，或每月499美元订阅，计划2026年优先在美国交付。

1X没有把它包装成已经完成的通用家务机器人。该官网写明，早期用户得到的是基础自主能力；遇到复杂任务，可以预约1X Expert远程监督。

国内市场的路径，则各不相同。

2024年5月13日，宇树发布9.9万元起的G1，以较低门槛面向开发者和科研用户。2025年12月8日，智元在上海工厂宣布第5000台机器人下线，其中包括A、X、G三个系列，联合创始人彭志辉把稳定性、可靠性和耐用性列为量产重点。

它们没有争夺同一种外形，却在争夺同一种稀缺资源：真实运行小时、制造经验和早期用户反馈。

这条竞争线索更容易得到事实支持。

Agility用收费仓储流程取得运营数据，Figure用宝马工厂迭代下一代本体，1X把远程专家写入家庭Early Access，宇树降低开发平台门槛，智元用多形态产品扩大生产规模。他们的共同点是，交付本身正在成为研发方法。

U1的选择与1X不同。它没有先用远程操作兑现复杂家务，而是用仿生脸、长期记忆和情绪反馈切入家庭。

2026年6月30日发布会后，周剑在接受媒体采访时，给出了自己的解释。

他表示，工业、商用和家庭三条线要同时推进；工业强调负载、可靠性与泛化，家庭强调情感模型、轻量化和量产工艺。他还称，硬件终将趋同，家庭场景的情感连接可能延伸出订阅、广告和周边生态。这是公司管理层的战略判断，不是已经验证的商业结果。

同一场采访中，周剑把人形机器人的“iPhone时刻”建立在两个条件上：可复制的量产工艺和海量真实交互数据——U1正好同时触碰这两件事。

第一批买家，也是第一批测试者

订单证明了兴趣，不能证明家庭刚需。

13361张全渠道订单，可先拆开看。公开的京东U1 Pro预售规则显示，消费者支付3000元可退定金即可锁定购买资格。13361张全渠道订单中，不同渠道和版本的付款结构尚未披露。

布会现场，周剑表示，将力争在年内完成交付。这意味着，真正进入交付阶段后，衡量量产能力的也不应只有下线数量。

焦继超表示，仿生机器人的主要难点包括轻量化、舵机小型化和情感模型。U1头部集成19个舵机，对小型化、结构设计和散热能力提出较高要求；他同时坦言，一万多台规模的量产是一个非常大的挑战。

若U1年内要交付一万台，首先证明的是供应链；半年后仍被持续使用，才开始证明产品。

参考资料：

1.《优必选创始人周剑：人形机器人“iPhone时刻”始于情感陪伴》，21世纪经济报道

2.《1.3万人抢着下单的优必选机器人原来只卖“情绪价值”，连“仿生”都差点意思》，都市快报

3.《优必选发布三款超仿生人形机器人：入门款售价11.98万元》，新浪科技

4.《全尺寸超仿生人形机器人在深圳发布》，科技日报

5.《创客周剑：从倾家荡产到做成机器人领域的“独角兽”》，海天出版社

6.《人形机器人进厂“打工”加速，优必选计划年底实现小规模交付》，北京亦庄

7.《专访优必选科技创始人、董事会主席兼CEO周剑：相比做表演，人形机器人更要进工厂干实事》，21世纪经济报道

8.《优必选创始人周剑：人形机器人最快3到5年进入家庭，首先实现情感陪伴》，封面新闻

9.《Emotional Expressions Reconsidered: Challenges to Inferring Emotion From Human Facial Movements》

10.《A Survey on the Memory Mechanism of Large Language Model based Agents》

11.《Thinker: A vision-language foundation model for embodied intelligence》

12.《Ramping Figure 03 Production》

https://www.figure.ai/news/ramping-figure-03-production

13.《Transform Your Home》，https://www.1x.tech/neo

14.《Humanoid robots: Crossing the chasm from concept to commercial reality》，麦肯锡

15.《Turning humanoid supply chain constraints into billion-dollar wins》，麦肯锡

16.《优必选仿生机器人开售，U1 Pro款深夜优惠1万元，有二次元玩家直言“一点吸引力都没有” 人形机器人家用场景为何难啃？》，每日经济新闻

本文来自微信公众号 “盒饭财经”（ID：daxiongfan），作者：彻诺，36氪经授权发布。

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

机器人还不会做家务，先学会了说“爱”你

三个版本，一次产品定义实验

“爱”是怎样被制造出来的

急着进家庭

第一批买家，也是第一批测试者

最近内容

下一篇