人工智能下一站:新消费硬件
以大模型为核心的新一轮人工智能浪潮,正在全球范围内催生一批AI原生企业。本系列研究将AI原生企业界定为:创立之初即将人工智能作为核心产品、服务或能力,并以此驱动价值创造和业务创新的公司,有别于仅将AI嵌入现有业务或作为工具的企业。腾讯研究院聚焦全球100+家AI原生企业,围绕三大关键问题展开系列观察:1)AI原生企业正催生了哪些新技术、产品形态和商业模式?2)AI技术如何深度融入千行百业的应用场景和核心流程,赋能产业升级?3)AI产业生态正在沿着怎样的路径加速演进,带来哪些结构性变革?
与以往产业分析多聚焦单点技术发展或单一企业创新不同,本系列研究将生态作为开篇切入。当前,生成式人工智能正处于从工具跃升为平台的转折期,生态的开放性、可扩展性和协同效应成为决定产业格局的关键变量。本文基于对AI原生企业所依赖基础模型的梳理,初步识别出海外正形成以OpenAI、Anthropic和Google为核心的三大生态阵营。这一选择基于基础模型能力、开发者吸引力、生态开放度及产业影响力等方面的综合考量。本文通过揭示全球AI企业的聚合趋势与落地扫描,为我国在AI生态建设上提供一个观察视角。
一、AI消费硬件的三大发展路线
2023年以来,AI消费硬件呈现高度形态创新,AI手机、智能眼镜、戒指和耳机、陪伴机器人等新品类快速崛起。按照AI原生程度划分,大致可分为三条路线:
路线1:以Rabbit等为代表的AI原生设备探索范式
近两年,多款AI原生设备相继推出,试图跳出智能手机主导的交互范式,探索“意图即操作”的新路径。他们普遍弱化App、菜单与窗口,依赖大模型驱动的语义理解与任务执行,是AI原生设备的雏形。
典型代表如Rabbit R1、Humane AI Pin,前者主打实体屏幕和滚轮交互,后者采用无屏投影,均需借助大模型理解指令完成操作。这一范式下还包括陪伴式机器人,如Loona、Ema等产品,围绕语音交互、情绪识别与拟人行为设计,构建陪伴关系与情感连接。
整体来看,这类产品在交互范式与系统结构上具备范式创新意义,类似早期Palm OS的移动设备探索。但受限体验成熟度、稳定性与用户认知等多重因素,仍面临极高的不确定性。例如,AI Pin已于2025年2月28日停止所有在线功能。Rabbit R1仍在销售和更新,但面临低活跃用户率、价值不足、性能与稳定性等多重挑战,市场前景仍不明朗。
路线2:以苹果为代表“强化原生设备”的渐进派
区别于从零起步的AI原生设备探索,苹果、Meta等代表了另一条更稳健的技术演进路径:以现有终端为基础,系统性引入AI能力,实现对设备的渐进式重构。
苹果的Apple Intelligence通过将本地大模型(M系列芯片支持)集成至手机、平板和电脑等主力产品,兼顾安全、性能与生态控制的同时,渐进强化AI能力。
不光是手机,智能眼镜与耳机等可穿戴设备也正成为这一路径的延展方向。Meta Ray-Ban 智能眼镜、小米与华为的 AI 眼镜产品,均在传统形态基础上集成语音助手、图像问答、翻译导航等模型能力,拓展了人机交互的边界。同时,耳机作为使用频率最高的可穿戴设备,也在加速 AI 化进程。Pixel Buds、AirPods、Nothing 等品牌相继尝试将大模型能力引入耳机端,实现实时对话、信息检索、语音操作等功能。
总体来看,这类产品仍以上一代硬件为基础,但通过引入AI能力增强交互体验,强化设备的AI属性。这条路线稳健但不彻底颠覆,是当前最具规模化潜力的一条路线。
路线3:以OpenAI为代表“以模型为核心”的赋能路径
以OpenAI为代表的大模型厂商则探索一条以模型为核心,赋能万物的平台化路径。对这些模型厂商而言,比起自建硬件,更重要的是通过API和SDK等接口形式,将强大的AI能力注入第三方设备中,成为各类设备“通用智能”的底层支撑。
这一路径具有灵活度高、快迭代的优势,能快速渗透各类终端形态。例如,GPT-4o嵌入如Ray-Ban智能眼镜、Be My Eyes等硬件产品,提供实时对话与视觉感知能力;阿里“通义听悟道”耳机、豆包耳机等产品,则依靠自有模型探索以语音助手为核心的日常交互场景,打造“随时可唤醒、持续能响应”的智能体验。
这一路线的核心不在于重构硬件形态或操作系统,而是让模型能力无处不在,即让每一个设备、每一个界面都接入智能,最终构建“模型即平台”的智能生态。
二、AI消费商业模式的雏形已现
伴随产品形态的分化,AI消费硬件商业模式的雏形初现。通过对当前主流产品的拆解,发现三大路线各自演化出了与其技术路径和产品定位适配的盈利模型,并伴随不同的核心瓶颈:
表1:AI消费硬件主要商业模式对比分析
1. AI原生探索派:高溢价硬件与生态订阅的“未来赌注”
该模式的核心在于凭借颠覆性的交互范式和独特硬件设计,向早期尝鲜者和具有特定情感或场景需求(如儿童教育、独居陪伴、宠物家庭)的用户群体收取显著的硬件溢价。同时,这些创新企业致力于通过持续的订阅服务(涵盖云服务支持、AI功能迭代更新、专属情感交互包或内容包)构建稳定的经常性收入流,并积极探索生态延伸的可能性。例如销售配件、进行IP授权,甚至规划未来类似Agent应用商店的平台抽成模式。
然而AI原生探索派正在陷入硬件价值证明困局。在功能性场景,该类产品的实用性与用户体验目前难以匹敌手机等成熟硬件,且尚未发掘现有硬件不可替代的刚需场景,这导致了用户购买率持续低迷。典型代表如Rabbit R1,该产品以199美元的价格和复古设计打开市场,能够实现瞬时响应与语音交互,但受限于云端依赖、生态封闭与逻辑漏洞等,存在功能不稳定、控制体验差的问题,“大多数功能对比智能手机并无优势”,终未突破“场景玩具”的边界。此外,测评媒体提出存在隐私隐患,质疑其自研LAM模型只是利用自动化脚本操作应用。如今Rabbit转向软件开发生态自救。
在陪伴场景,情感溢价无法掩盖功能性缺陷,同样难以支撑硬件的高溢价。以日本GROOVE X公司推出的LOVOT陪伴机器人为例,其3935美元硬件售价配合67美元月订阅费的商业模式瞄准高净值人群,内置芯片的专属服装单价数百至上千元,普通衣服无法触发交互反馈,形成强制消费闭环。但其交互续航不足1小时且需频繁补电,互动玩法固定且未见个性化交互案例(无语言能力),发售5年全球销量仅1.4万台,年均出货量不足3000台。
探索派AI消费硬件的核心困境在于:用户教育成本高企,若产品体验无法实现远超现有终端的突破,便难以赢得主流用户。当前这类产品普遍缺乏足够的颠覆性,导致其在硬件定价与订阅服务之间价值链不清,难以驱动用户持续付费和维护粘性。归根结底,这是一次关于未来人机交互范式转变的高风险“豪赌”。
2. 渐进强化派:在熟悉中变现,在订阅中创造复利
该模式立足于成熟的硬件形态,通过系统集成AI能力,显著提升原有功能体验或开辟全新的应用场景。其商业模式以硬件销售为主要收入来源,依靠品牌力或性价比抢占市场份额。更为关键的是,通过提供增值服务订阅(例如个性化的深度健康分析报告、专业级翻译引擎、持续迭代的专属AI功能),企业将一次性的硬件购买转化为长期的用户价值和持续的收入流,解锁更深层次的“智能”价值。
核心优势在于低用户认知门槛与高市场接受度。在产品体验上,渐进派更强调本地AI算力的优化。苹果端侧模型采用双区块架构,在降低内存与响应时延的同时,引入云端PT-MoE模型,确保效率与智能水平的平衡。据2024年9月美国调研,Apple Intelligence推动消费者支付意愿提升11%,成为54%潜在换机用户的核心决策因素。订阅制与端侧AI能力共同构成竞争力双引擎,前者激活长期价值,后者保障响应速度与隐私安全。
不过在订阅制落地过程中仍面临挑战:用户对“看似智能却难以提供真实价值”的伪(浅)AI功能往往缺乏付费意愿,尤其缺乏刚需场景支撑的情况下,续费率难以稳定提升。同时,硬件产品日趋同质,差异化路径依赖于更深层次的AI能力与生态协同。
健康监测赛道为例,Oura Ring曾因“$499硬件+$5.99月费解锁基础数据”引发用户抵制,尤其缺乏实时健康预警功能削弱其价值。然而转向“基础数据免费+深度健康服务订阅”模式后,用户为个性化睡眠分析、疾病风险预测等智能报告付费意愿显著提升,推动订阅转化率增长18%。这一案例表明,关键并不在于是否收费,而在于让用户感受到持续、可感知的智能服务价值。
未来,订阅制成功的关键在于两点:一是锚定用户高频使用场景,提供贴近生活的智能助理体验;二是构建分级订阅体系,降低初始付费门槛,提升续费的心理接受度与服务性价比。
3. 模型赋能派:部分复制安卓路径
以OpenAI、谷歌等为代表的大模型厂商, 选择了不自建硬件闭环的路径,而是专注于打造最强大的基础AI模型。其商业模式可视为对安卓路径的“部分复制”:一方面通过API/SDK接口,将模型能力像“水电煤”一样输出,按调用量(如Token消耗量或请求次数)向开发者、企业客户以及希望为其硬件产品注入智能的制造商收费。另一方面,则通过提供企业级订阅、私有部署、安全定制等服务,实现高附加值的商业变现。
这一模式的核心优势在于:不依赖单一硬件形态,具备更强的渗透力和风险分散能力,理论上可嵌入所有具备计算能力的终端设备中。但相比安卓生态的“预装+统一标准+低边际成本”路径,模型赋能派在多个关键环节面临挑战:
首先,模型推理成本较高,难以像安卓系统一样以极低成本大规模授权;
其次,模型能力与终端的适配存在技术门槛,尤其在资源受限的本地端,常出现时延高、功能缩水等体验短板;
第三,赋能路径的平台控制权尚未建立。当前缺乏统一的生态标准和分发渠道,模型厂商在用户侧的话语权极易被硬件厂商隔离或替代。
这一困境在头部厂商合作中初现端倪:三星为掌握智能主导权,自研Gauss AI模型以降低外部依赖。vivo通过自研蓝心大模型,强化数据闭环和本地控制能力,在核心领域减少对第三方API的依赖。即便是谷歌也不得不向三星支付高额授权费并让渡部分订阅收益,以换取Gemini AI在Galaxy S25的预装。
尽管模型赋能派通过开源加速开发者生态建设,试图打造实施标准,但若缺乏统一接口、低成本推理能力,其平台地位难以真正稳固。相比安卓操作系统作为超级入口的平台能力,模型赋能派更像是基础服务的水电煤,渗透性强,但控制力弱。
因此,其未来的核心竞争力,将不仅仅是模型本身的能力领先,还在于是否能建立稳定、高效、低成本的适配路径,构建技术+生态双层护城河,并在软硬融合趋势中掌握入口主导权。
以上三种模式并非完全割裂,混合模式正在涌现。如越来越多的AI新型硬件通过蓝牙、APP与手机等现有设备实现功能联动,构建多终端系统体验。同时,不少模型厂商开始自建AI原生硬件,打通从模型能力到终端产品的完整链路。
三、AI消费硬件趋势展望
1.实现方式:上下游不断整合,端云结合仍为主流
对于模型厂商积极探索模型和硬件的适配性,产业链上下游的联系更加紧密。由于模型的运行效率与底层芯片硬件深度绑定,为了使模型性能与硬件端相匹配,模型厂商正积极与芯片巨头合作,确保其模型在各种设备上都能发挥出最佳性能。例如,Meta从Llama 3发布之初就与众多硬件伙伴紧密合作。公告中点名了高通、英特尔、英伟达,以及AMD、AWS、戴尔等,确保模型能在这些平台上得到优化和支持;在后续的发布中,Meta强化了与端测芯片厂商的合作,特别是与高通在骁龙芯片上的适配,以推动更小参数的Llama 3模型在手机等移动设备上高效运行。这种策略确保了从手机到数据中心的各类设备,都能成为Llama 3的理想运行平台;类似的,阿里巴巴也积极推动其通义千问大模型与硬件厂商的适配,致力于构建一个从模型到芯片的完整生态系统,以加速其AI技术在不同行业的落地和应用。
此外,越来越多的模型厂商选择亲自下场设计和制造AI原生硬件,例如OpenAI、字节、阿里等,都在利用自身的模型打造硬件,这些厂商的最终目标是创造一个能完美承载其AI服务、并定义下一代交互范式的理想容器与用户入口。
对于硬件厂商而言,端云结合的策略仍将为主流。端侧模型通常负责处理高频、低延迟、隐私敏感的任务,如相册整理、实时翻译、通话摘要等。对于复杂的、需要海量知识和计算的任务(如长文案创作、复杂逻辑推理),则会调用云端更强大的模型,这其中既有厂商自部署的模型,也包括与外部顶尖AI公司(如Google, OpenAI)的合作。端侧和云端模型各有其不可替代性,端云结合的策略仍然会成为AI消费硬件的主要实现方式。
为了在端侧实现更高效的部署,模型厂商广泛采用知识蒸馏等压缩技术,推动轻量化模型成为主流。当前,终端设备常用模型参数量多低于70亿(7B),尤其以30亿(3B)和40亿(4B)规模的模型在终端应用中最为普遍,部分厂商将MoE(混合专家模型)架构在端侧落地,以求在性能与功耗之间达到最佳平衡。
2.硬件形态:“无感化”交互加速硬件范式转变
短期内,随着端侧模型能力的不断增强和强大的用户习惯,手机仍将为用户和AI交互的最主流硬件。虽然2023、2024年,Rabbit R1等硬件产品作出了替代手机的尝试,但受到模型能力、产品功能、消费习惯等限制,最终未能成功。2025年以来,更多的AI消费硬件尝试成为“辅助手机的传感器”(如可穿戴AI助手),或寻找其它手机尚未覆盖的细分场景(如会议、陪伴等场景),通过AI解决某一用户痛点,快速提升用户体验,获得了较为积极的市场反应。例如,在会议场景下,Limitless Pendant、AI会议耳机iFLYBUDS Pro 3等硬件专注于通过语音交互记录会议内容,对智能手机的交互方式进行补充;在娱乐场景下,BubblePal(聚焦儿童陪伴)、ROPET(聚焦青年女性陪伴)等AI硬件针对特定受众进行设计,瞄准主流产品无法实现的陪伴功能。
但从长远来看,随着语音、视频等交互方式发展,AI硬件的交互范式有望朝着“无感化”的方向演进。
AI眼镜市场蓬勃发展正表现了这一趋势。自2024年起,AI眼镜便成为科技巨头、AR/VR厂商和新兴品牌竞逐的焦点。Meta和Ray-Ban合作推出的AI眼镜大获成功后,雷鸟、Rokid、小米等品牌也陆续推出了AI眼镜;2025年,端到端多模态模型得到迅速发展,增加了人类与AI的交互方式(如语音、视频)、降低了交互时延、提高了交互精度。在此情况下,人与AI的交互方式更多地依靠语音与图像,众多公司进入AI眼镜市场。不仅小米、三星等硬件厂商也进入了市场,谷歌、阿里、字节等模型厂商也正在积极入局AI眼镜。
AI眼镜让用户可以基于目前看到的场景,通过语音与AI交互。比起手机触屏和拍摄,是一种更加简便、更能解放双手的操作方式,且能够让AI更好地感知实时环境,基于更丰富的上下文做出更准确的判断。目前,AI眼镜仍然作为手机的补充而非替代。然而,长期来看,随着光学和算力的成熟,AI眼镜由于其可以融合语音、视觉交互且无需手持的特征,有望从“音频拍摄工具”升级为“个人生活助理”。
表2:2025年进入AI眼镜市场的玩家举例
在“无感化”的趋势下,除AI眼镜外,新形态的AI原生消费硬件也可能将在不久的将来进入市场。例如,OpenAI正在探索能够充分发挥AI能力的新型硬件。Sam Altman认为,要使AI真正发挥作用,“它需要了解您的环境、日程安排和偏好,并根据这些知识实时采取行动”;智能手机的App模式是AI发展的根本性束缚,AI时代需要一次类似“iPhone时刻”的范式革命,即硬件、操作系统和模型从一开始就为AI共同设计。基于此,OpenAI正与前苹果设计师Jony Ive合作,开发一款可能没有屏幕、以对话式AI为核心交互的全新个人计算设备。
综上所述,AI眼镜市场的蓬勃发展和新形态的AI原生消费硬件的诞生均表明了“无感化”的主流趋势:在AI时代,以语言用户界面(LUI,用户直接通过语言和硬件交互)为代表的新范式有可能最终取代图形用户界面(GUI,用户通过图标与硬件交互),语音将取代触控成为主流的交互方式,最终导致主流的硬件形态发生改变。
3. AI原生程度:AI正从“功能补充”迈向“应用入口”,软件生态成为决胜关键
短期看,AI的首要任务是提升效率,通过系统级集成,在关键使用场景中恰到好处地引入AI,达到低感知、高效率的体验优化。例如,上文提到的AI耳机在已有基础上增加AI实时总结功能;苹果在WWDC25上宣布利用AI功能实现信息内的智能分组、电话智能接听等功能,本质上也是将AI融入手机应用,增强既有体验。
长期看,AI在硬件上的终极形态将是“Agentic”,最终成为所有应用的主要入口。随着模型自主规划和调用工具能力的发展,未来用户只需通过语音或自然语言交互与Agent对话,其余操作将有Agent在后台完成,仿佛赋予手机、眼镜等终端“自动驾驶”能力。例如,三星2025年发布的Galaxy S25系列搭载了AI Agent Bixby,支持跨越30多个本地应用和10多个高频的第三方应用的一体化操作。苹果的Apple Intelligence也正逐步推动Siri向跨应用操作与情境感知演进,迈向真正的个性化AI助手。
在此趋势下,谁掌握了数据入口、应用生态,谁就占据了用户界面与AI调度的制高点。例如,Google依靠强大的产品矩阵,在2025年3月实现了Gemini与Google Search、YouTube、Google Calandar、Gmail的数据打通,Gemini不仅可以直接访问历史搜索记录和观看记录,还能够将生成结果直接写入备忘录、日历等应用,具有了作为应用入口的独特优势;Meta眼镜之所以销量领先,很大程度上得益于其无缝接入Meta庞大的社交矩阵,拍摄的影像可以一键上传到Instagram、Facebook,与好友分享,为用户提供了即拍即传的闭环体验。
综上所述,短期内,手机、智能眼镜、耳机等将继续成为人机交互的主流硬件,渐进派的路径最为明晰;而模型派、探索派则在垂直场景和模型能力上不断试水创新。长期来看,AI原生消费硬件的终极形态仍未定型,但谁能在模型能力、硬件形态与应用生态之间实现真正融合,谁讲主导下一代智能终端的入口之争。
本文来自微信公众号 “腾讯研究院”(ID:cyberlawrc),作者:刘琼 林屹涵 马思宇,36氪经授权发布。