英伟达给联想递了张“牌”

奇点研究社·2026年06月05日 20:03

一个“够格”的硬件底座

过去三年，端侧AI始终处于一种尴尬状态。

手机厂商在讲端侧大模型，PC厂商在讲AI PC，汽车厂商在讲智能座舱，几乎所有人都在描绘同一个未来：AI不再住在云端，而是直接运行在用户身边的设备里。

但每次走到落地环节，故事总会卡住。模型能跑，却跑不快；功能能做，却做不深；演示看起来惊艳，真正交到用户手里却变成了阉割版体验。

问题不在AI本身，大模型的能力突飞猛进，Agent开始具备规划、推理和执行复杂任务的能力，但终端硬件的发展速度，远远跟不上AI的进化速度。

刚刚结束的Computex，黄仁勋发布了英伟达的PC处理器RTX Spark，号称全球首款专为"个人智能体"打造的 Windows PC 超级芯片，戴尔、惠普、联想、微软Surface，首批合作名单几乎是整个Windows PC行业的点名册，预计今年秋天开始出货。

这未必是一款立刻改变PC市场格局的产品，但却是端侧AI发展三年来重要的硬件信号，它意味着那些过去只能在云端完成的任务，有机会被搬到本地设备上运行。

AI PC的故事讲了三年，终于等来一个像样的底座。

端侧AI的硬件天花板被打破

在谈及RTX Spark之前，我们要先搞清楚，AI PC喊了三年，究竟走到了哪一步？

如果从供给侧来看，这个行业其实已经完成了绝大部分准备工作。芯片厂商解决了本地推理的硬件问题，英特尔推出Core Ultra系列、AMD发布Ryzen AI平台、高通凭借骁龙X Elite重返PC市场，NPU成为新一代处理器发布会上出现频率最高的关键词。

DeepSeek、通义千问等大模型也开始推出面向端侧的轻量化版本，让本地运行AI成为可能。

整机厂的投入更是几乎不计成本。联想先后发布YOGA AI元启和小新AI PC系列，戴尔把整条产品线重新命名向AI靠拢，华硕、惠普、华为也都把AI PC列为核心战略。

根据Canalys数据，2024年全球AI PC出货量已达到约4800万台，占全年PC出货量近20%；机构预测2025年这一比例将进一步提升至40%以上。

但供给侧的整装待发，并没有在需求侧激起相应的水花。行业回答的是“AI能否进入PC”，用户关心的是AI进入PC之后，能帮我做什么？

大多数消费者不会因为电脑拥有45 TOPS还是60 TOPS的NPU算力而产生换机冲动。戴尔高管曾在采访中提到：消费者并不是基于AI来购买的，事实上AI可能让他们更困惑，而不是帮助他们理解一个具体的结果。

这句话戳中了AI PC的症结，行业一直在强调算力，却始终没有创造出足够强烈的换机理由。再往下追问，为什么行业始终没能创造出有吸引力的AI应用？

症结的根源，是算力底座本身就不够用。

2024年微软提出Copilot+ PC认证标准时，核心门槛是NPU算力不低于40 TOPS。这个标准在当时有其合理性，NPU功耗低、适合处理轻量的本地AI任务，比如实时字幕、图像识别、语义搜索等。

但随着智能体的繁荣，端侧AI的发展目标已经改变，过去大家讨论的是“如何让AI在设备上跑起来”，现在大家讨论的是“如何让Agent在设备上干活”。

两者对于硬件的要求完全不在一个量级。NPU本质上仍然是一种高度专用化的计算单元。它擅长规则明确、流程固定的任务。一旦遇到需要复杂推理和多步规划的Agent任务，就显得力不从心了。

传统Windows PC的CPU和GPU各自独占内存，数据在两者之间搬运的成本极高。当AI模型的参数量动辄以十亿计，这种割裂的内存设计成为了物理瓶颈，不是算力不够，而是数据根本“喂不进去”。

而这个问题，英伟达想用RTX Spark一次性解决。

RTX Spark的核心创新是通过NVLink-C2C技术将CPU和GPU深度绑定，实现了600GB/s的双向内存带宽，这项技术原本只存在于数据中心级别的Grace Hopper超级芯片上。

统一内存架构带来的最大改变，是CPU和GPU能够共享同一块内存池。这套架构此前在消费级市场只有一个玩家做到过，就是苹果的M系列芯片。

但英伟达拥有苹果没有的东西：CUDA。

很多人把CUDA理解为一个开发工具，实际上，它更像是AI时代最重要的基础设施。过去二十年，CUDA已经成为全球AI开发者最熟悉的开发环境。PyTorch、TensorRT、llama.cpp等主流AI开发工具的第一适配平台都是CUDA，全球绝大多数AI模型的训练和推理管线都建立在CUDA之上。

把原本属于数据中心的能力，下放到消费级PC，才是RTX Spark的杀手锏。

高通的Snapdragon X2 Elite Extreme的NPU算力在纸面上更高（约80 TOPS对比RTX Spark的神经处理单元），但高通没有CUDA，它的AI加速依赖QNN框架，与主流AI开发者生态之间存在一道不小的鸿沟。

苹果的M5芯片在端侧AI性能和能效上依然是基准，是行业标杆，但苹果运行的是macOS，而非Windows生态。

对整个Windows生态而言，RTX Spark带来的意义显然不同。

而且英伟达选择的入场时机也很巧妙。过去十年，高通几乎承担了Windows ARM生态的拓荒工作。Prism模拟层逐渐成熟，Windows ARM开始具备日常使用能力。

与此同时，苹果M系列证明了ARM架构可以在性能和功耗上同时超越x86。英伟达等到路修好了，才开着CUDA这辆“重卡”驶来。

不过RTX Spark目前还未上市，价格未知，市场反应尚待验证。天风国际分析师郭明錤根据供应链调查判断，搭载N1X和N1芯片的设备未来两年出货量约1000万台，主要面向对本地端AI算力有需求的重度用户，这是一个相当小众的开始。

RTX Spark之所以会引发如此高的关注，在于它释放出一个信号：在端侧本地运行百亿参数模型，不再是极客的专属游戏，而是即将走入消费市场的“标配”。

英伟达下场，联想等到“东风”

在RTX Spark的首发合作名单里，联想的出现并不意外。

联想是目前全球AI PC市场份额最大的整机厂，微软披露的数据显示其在Windows AI PC细分市场的全球份额达到31%。当英伟达需要第一批把RTX Spark推向消费者的合作伙伴时，联想几乎是最自然的选择。

Computex 2026展台上，联想展示了Yoga Pro 9n：一台15英寸的笔记本，搭载RTX Spark平台，定位创作者、AI开发者和专业用户。

对于英伟达来说，RTX Spark不是数据中心产品，而是面向消费者的新平台。

再强的芯片，也需要整机厂把它送到用户手里，而联想是全球最大的PC厂商，也是目前AI PC布局最激进的玩家之一。

从2024年开始，杨元庆便不断向外界强调“混合式AI”的概念。在个人端，联想推出天禧AI智能体，希望成为用户跨设备的个人助手；在企业端，推出擎天AI平台以及覆盖多个行业场景的智能体矩阵。

在联想的构想中，未来用户不再打开一个个应用完成工作，而是直接向智能体提出需求，由AI自主规划任务、调用工具、协调资源并完成执行。

能看出，联想想讲述“下一代人机交互入口”的故事，这套逻辑成立的前提，便是端侧算力足够强大。RTX Spark的出现，第一次让这个缺口有了被补上的可能。

这也是为什么联想比其他PC厂商更值得关注，因为它并不是今天才开始布局AI，过去几年积累的软件能力和生态能力，决定了它有机会成为第一批把算力升级转化为用户体验升级的厂商。

数据也支撑这个判断：联想上个财年AI相关业务收入同比增长105%，AI PC渗透率占其全部PC出货量的30%。

联想已经为AI PC投入了足够长的时间和资源，当新的算力平台出现时，自然会比大多数整机厂更容易吃到第一波红利。

不过机会和挑战往往同时出现。联想擅长供应链管理、渠道能力和规模化制造，可AI时代竞争的重点，正在转向智能体体验、软件生态和用户留存。

此外，联想同时是英伟达、AMD、高通、英特尔四家芯片巨头的合作伙伴，杨元庆的说法是"不同芯片厂商有不同长项，AI云端是英伟达，PC终端是英特尔AMD，移动端是高通"。

这套多元化逻辑有其合理性，但也意味着联想必须在所有方向上同步投入，在软件层保持对每一代新芯片的快速适配。

英伟达的RTX Spark路线图已经规划了三代产品，每一代迭代都要求联想的软件栈跟上，这也是一个持续的工程压力。

当RTX Spark带来新一轮算力跃迁之后，联想能否把这种硬件升级转化为用户真正能够感知的体验升级，是一大考验。如果把视野再放大一些，这个难题其实也不仅仅属于联想。

高端之外，数十亿终端的潜力战场

RTX Spark能够满足有足够购买力、有本地AI算力需求的高端PC用户，但端侧AI的战场，远比这宽广。

全球有超400亿台智能终端设备，包括手机、汽车、可穿戴设备、智能家居等，这些设备不可能搭载RTX Spark级别的芯片，它们的算力预算以TOPS计，不以Petaflop计；它们的功耗窗口以毫瓦计，不以瓦计。

但它们同样需要在本地运行AI，同样需要在断网、弱网环境下完成感知、理解和决策。

如何在极度受限的端侧设备上，把AI能力做到极致？这是RTX Spark照不到的战场，也是端侧AI普及的关键。

这也是国产厂商面壁智能试图回答的问题。面壁的核心产品MiniCPM系列端侧小模型，专为资源受限设备设计，从AI手机、AI PC，到智能座舱、可穿戴设备都有落地。

面壁提出的"密度定律"认为，大模型的知识密度每3.3个月翻一番，模型会变得越来越小，但能力越来越强，这是一个关于小模型效率的长期押注。

今年5月，面壁发布的MiniCPM5-1B，在部分能力维度上已经超越了GPT-4o的早期版本，而参数量只有10亿。

面壁和英伟达的RTX Spark也是一种互补。RTX Spark打开了高端PC端侧AI的天花板，面壁做的是在资源受限条件下让更多设备获得AI能力。

RTX Spark打开了高端PC端侧AI的天花板，让复杂Agent能够在本地跑起来；面壁则在资源受限终端上，让更多设备获得可用AI能力。

一个是“算力充足，如何释放潜力”，一个是“算力受限，如何用好每一个TOPS”。

面壁CEO李大海曾说，2026年装上面壁端侧模型的设备数将达到2025年的10倍。这意味着端侧AI的普及不会仅依赖高端PC，也需要在低算力设备上建立可持续的小模型生态。

谁能在更小的资源预算内提供更好的体验，谁就有机会胜出。

英伟达的入场，像一声发令枪，把开发者的注意力和资本的目光引向端侧，推动更多应用开始针对本地AI能力进行优化。

这些势能会漫过RTX Spark本身，扩散到整个端侧AI生态。

当然，理想与现实之间还隔着几道坎，Windows ARM的软件适配率仍然不足30%，消费市场对AI PC的真实换机意愿还存在争议。

但谁又能说今天的小众，不会成为明天的主流，就像2020年苹果发布M1的时候，没人能预见五年后它在笔记本电脑处理器的市场份额几乎与AMD持平。

从Tegra的移动芯片失败，到收购ARM的折戟、Grace CPU在数据中心的试水，再到今天RTX Spark的正式入场，英伟达用二十年时间，把AI算力从数据中心搬到了个人电脑。

RTX Spark未必就是最终答案，其销量、价格、软件生态和市场接受度，都还有待验证，但它改变了端侧AI产业的起跑线。

这样看来，英伟达更像搭台者，联想、面壁，以及所有试图在端侧AI重写规则的人，才是主角。

本文来自微信公众号“奇点研究社”，作者：奇点团队，36氪经授权发布。

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

英伟达给联想递了张“牌”

端侧AI的硬件天花板被打破

英伟达下场，联想等到“东风”

高端之外，数十亿终端的潜力战场

最近内容

36氪AI测评

36氪寻求报道

下一篇