英伟达给联想递了张“牌”

奇点研究社·2026年06月05日 20:03
一个“够格”的硬件底座

过去三年,端侧AI始终处于一种尴尬状态。

手机厂商在讲端侧大模型,PC厂商在讲AI PC,汽车厂商在讲智能座舱,几乎所有人都在描绘同一个未来:AI不再住在云端,而是直接运行在用户身边的设备里。

但每次走到落地环节,故事总会卡住。模型能跑,却跑不快;功能能做,却做不深;演示看起来惊艳,真正交到用户手里却变成了阉割版体验。

问题不在AI本身,大模型的能力突飞猛进,Agent开始具备规划、推理和执行复杂任务的能力,但终端硬件的发展速度,远远跟不上AI的进化速度。

刚刚结束的Computex,黄仁勋发布了英伟达的PC处理器RTX Spark,号称全球首款专为"个人智能体"打造的 Windows PC 超级芯片,戴尔、惠普、联想、微软Surface,首批合作名单几乎是整个Windows PC行业的点名册,预计今年秋天开始出货。

这未必是一款立刻改变PC市场格局的产品,但却是端侧AI发展三年来重要的硬件信号,它意味着那些过去只能在云端完成的任务,有机会被搬到本地设备上运行。

AI PC的故事讲了三年,终于等来一个像样的底座。

端侧AI的硬件天花板被打破

在谈及RTX Spark之前,我们要先搞清楚,AI PC喊了三年,究竟走到了哪一步?

如果从供给侧来看,这个行业其实已经完成了绝大部分准备工作。芯片厂商解决了本地推理的硬件问题,英特尔推出Core Ultra系列、AMD发布Ryzen AI平台、高通凭借骁龙X Elite重返PC市场,NPU成为新一代处理器发布会上出现频率最高的关键词。

DeepSeek、通义千问等大模型也开始推出面向端侧的轻量化版本,让本地运行AI成为可能。

整机厂的投入更是几乎不计成本。联想先后发布YOGA AI元启和小新AI PC系列,戴尔把整条产品线重新命名向AI靠拢,华硕、惠普、华为也都把AI PC列为核心战略。

根据Canalys数据,2024年全球AI PC出货量已达到约4800万台,占全年PC出货量近20%;机构预测2025年这一比例将进一步提升至40%以上。

但供给侧的整装待发,并没有在需求侧激起相应的水花。行业回答的是“AI能否进入PC”,用户关心的是AI进入PC之后,能帮我做什么?

大多数消费者不会因为电脑拥有45 TOPS还是60 TOPS的NPU算力而产生换机冲动。戴尔高管曾在采访中提到:消费者并不是基于AI来购买的,事实上AI可能让他们更困惑,而不是帮助他们理解一个具体的结果。

这句话戳中了AI PC的症结,行业一直在强调算力,却始终没有创造出足够强烈的换机理由。再往下追问,为什么行业始终没能创造出有吸引力的AI应用?

症结的根源,是算力底座本身就不够用。

2024年微软提出Copilot+ PC认证标准时,核心门槛是NPU算力不低于40 TOPS。这个标准在当时有其合理性,NPU功耗低、适合处理轻量的本地AI任务,比如实时字幕、图像识别、语义搜索等。

但随着智能体的繁荣,端侧AI的发展目标已经改变,过去大家讨论的是“如何让AI在设备上跑起来”,现在大家讨论的是“如何让Agent在设备上干活”。

两者对于硬件的要求完全不在一个量级。NPU本质上仍然是一种高度专用化的计算单元。它擅长规则明确、流程固定的任务。一旦遇到需要复杂推理和多步规划的Agent任务,就显得力不从心了。

传统Windows PC的CPU和GPU各自独占内存,数据在两者之间搬运的成本极高。当AI模型的参数量动辄以十亿计,这种割裂的内存设计成为了物理瓶颈,不是算力不够,而是数据根本“喂不进去”。

而这个问题,英伟达想用RTX Spark一次性解决。

RTX Spark的核心创新是通过NVLink-C2C技术将CPU和GPU深度绑定,实现了600GB/s的双向内存带宽,这项技术原本只存在于数据中心级别的Grace Hopper超级芯片上。

统一内存架构带来的最大改变,是CPU和GPU能够共享同一块内存池。这套架构此前在消费级市场只有一个玩家做到过,就是苹果的M系列芯片。

但英伟达拥有苹果没有的东西:CUDA。

很多人把CUDA理解为一个开发工具,实际上,它更像是AI时代最重要的基础设施。过去二十年,CUDA已经成为全球AI开发者最熟悉的开发环境。PyTorch、TensorRT、llama.cpp等主流AI开发工具的第一适配平台都是CUDA,全球绝大多数AI模型的训练和推理管线都建立在CUDA之上。

把原本属于数据中心的能力,下放到消费级PC,才是RTX Spark的杀手锏。

高通的Snapdragon X2 Elite Extreme的NPU算力在纸面上更高(约80 TOPS对比RTX Spark的神经处理单元),但高通没有CUDA,它的AI加速依赖QNN框架,与主流AI开发者生态之间存在一道不小的鸿沟。

苹果的M5芯片在端侧AI性能和能效上依然是基准,是行业标杆,但苹果运行的是macOS,而非Windows生态。

对整个Windows生态而言,RTX Spark带来的意义显然不同。

而且英伟达选择的入场时机也很巧妙。过去十年,高通几乎承担了Windows ARM生态的拓荒工作。Prism模拟层逐渐成熟,Windows ARM开始具备日常使用能力。

与此同时,苹果M系列证明了ARM架构可以在性能和功耗上同时超越x86。英伟达等到路修好了,才开着CUDA这辆“重卡”驶来。

不过RTX Spark目前还未上市,价格未知,市场反应尚待验证。天风国际分析师郭明錤根据供应链调查判断,搭载N1X和N1芯片的设备未来两年出货量约1000万台,主要面向对本地端AI算力有需求的重度用户,这是一个相当小众的开始。

RTX Spark之所以会引发如此高的关注,在于它释放出一个信号:在端侧本地运行百亿参数模型,不再是极客的专属游戏,而是即将走入消费市场的“标配”。

英伟达下场,联想等到“东风”

在RTX Spark的首发合作名单里,联想的出现并不意外。

联想是目前全球AI PC市场份额最大的整机厂,微软披露的数据显示其在Windows AI PC细分市场的全球份额达到31%。当英伟达需要第一批把RTX Spark推向消费者的合作伙伴时,联想几乎是最自然的选择。

Computex 2026展台上,联想展示了Yoga Pro 9n:一台15英寸的笔记本,搭载RTX Spark平台,定位创作者、AI开发者和专业用户。

对于英伟达来说,RTX Spark不是数据中心产品,而是面向消费者的新平台。

再强的芯片,也需要整机厂把它送到用户手里,而联想是全球最大的PC厂商,也是目前AI PC布局最激进的玩家之一。

从2024年开始,杨元庆便不断向外界强调“混合式AI”的概念。在个人端,联想推出天禧AI智能体,希望成为用户跨设备的个人助手;在企业端,推出擎天AI平台以及覆盖多个行业场景的智能体矩阵。

在联想的构想中,未来用户不再打开一个个应用完成工作,而是直接向智能体提出需求,由AI自主规划任务、调用工具、协调资源并完成执行。

能看出,联想想讲述“下一代人机交互入口”的故事,这套逻辑成立的前提,便是端侧算力足够强大。RTX Spark的出现,第一次让这个缺口有了被补上的可能。

这也是为什么联想比其他PC厂商更值得关注,因为它并不是今天才开始布局AI,过去几年积累的软件能力和生态能力,决定了它有机会成为第一批把算力升级转化为用户体验升级的厂商。

数据也支撑这个判断:联想上个财年AI相关业务收入同比增长105%,AI PC渗透率占其全部PC出货量的30%。

联想已经为AI PC投入了足够长的时间和资源,当新的算力平台出现时,自然会比大多数整机厂更容易吃到第一波红利。

不过机会和挑战往往同时出现。联想擅长供应链管理、渠道能力和规模化制造,可AI时代竞争的重点,正在转向智能体体验、软件生态和用户留存。

此外,联想同时是英伟达、AMD、高通、英特尔四家芯片巨头的合作伙伴,杨元庆的说法是"不同芯片厂商有不同长项,AI云端是英伟达,PC终端是英特尔AMD,移动端是高通"。

这套多元化逻辑有其合理性,但也意味着联想必须在所有方向上同步投入,在软件层保持对每一代新芯片的快速适配。

英伟达的RTX Spark路线图已经规划了三代产品,每一代迭代都要求联想的软件栈跟上,这也是一个持续的工程压力。

当RTX Spark带来新一轮算力跃迁之后,联想能否把这种硬件升级转化为用户真正能够感知的体验升级,是一大考验。如果把视野再放大一些,这个难题其实也不仅仅属于联想。

高端之外,数十亿终端的潜力战场

RTX Spark能够满足有足够购买力、有本地AI算力需求的高端PC用户,但端侧AI的战场,远比这宽广。

全球有超400亿台智能终端设备,包括手机、汽车、可穿戴设备、智能家居等,这些设备不可能搭载RTX Spark级别的芯片,它们的算力预算以TOPS计,不以Petaflop计;它们的功耗窗口以毫瓦计,不以瓦计。

但它们同样需要在本地运行AI,同样需要在断网、弱网环境下完成感知、理解和决策。

如何在极度受限的端侧设备上,把AI能力做到极致?这是RTX Spark照不到的战场,也是端侧AI普及的关键。

这也是国产厂商面壁智能试图回答的问题。面壁的核心产品MiniCPM系列端侧小模型,专为资源受限设备设计,从AI手机、AI PC,到智能座舱、可穿戴设备都有落地。

面壁提出的"密度定律"认为,大模型的知识密度每3.3个月翻一番,模型会变得越来越小,但能力越来越强,这是一个关于小模型效率的长期押注。

今年5月,面壁发布的MiniCPM5-1B,在部分能力维度上已经超越了GPT-4o的早期版本,而参数量只有10亿。

面壁和英伟达的RTX Spark也是一种互补。RTX Spark打开了高端PC端侧AI的天花板,面壁做的是在资源受限条件下让更多设备获得AI能力。

RTX Spark打开了高端PC端侧AI的天花板,让复杂Agent能够在本地跑起来;面壁则在资源受限终端上,让更多设备获得可用AI能力。

一个是“算力充足,如何释放潜力”,一个是“算力受限,如何用好每一个TOPS”。

面壁CEO李大海曾说,2026年装上面壁端侧模型的设备数将达到2025年的10倍。这意味着端侧AI的普及不会仅依赖高端PC,也需要在低算力设备上建立可持续的小模型生态。

谁能在更小的资源预算内提供更好的体验,谁就有机会胜出。

英伟达的入场,像一声发令枪,把开发者的注意力和资本的目光引向端侧,推动更多应用开始针对本地AI能力进行优化。

这些势能会漫过RTX Spark本身,扩散到整个端侧AI生态。

当然,理想与现实之间还隔着几道坎,Windows ARM的软件适配率仍然不足30%,消费市场对AI PC的真实换机意愿还存在争议。

但谁又能说今天的小众,不会成为明天的主流,就像2020年苹果发布M1的时候,没人能预见五年后它在笔记本电脑处理器的市场份额几乎与AMD持平。

从Tegra的移动芯片失败,到收购ARM的折戟、Grace CPU在数据中心的试水,再到今天RTX Spark的正式入场,英伟达用二十年时间,把AI算力从数据中心搬到了个人电脑。

RTX Spark未必就是最终答案,其销量、价格、软件生态和市场接受度,都还有待验证,但它改变了端侧AI产业的起跑线。

这样看来,英伟达更像搭台者,联想、面壁,以及所有试图在端侧AI重写规则的人,才是主角。

本文来自微信公众号“奇点研究社”,作者:奇点团队,36氪经授权发布。

+1
8

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000
特邀作者

记录AI时代变革,见证商业奇点时刻。

下一篇

赛力斯想要第二曲线,字节跳动想要新标杆。

3小时前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业