黄仁勋这一刀老深了

王智远·2026年06月03日 15:55

换了新的局

有朋友问我，怎么看英伟达和微软一起做ARM架构的AI PC。

我说，这是个好问题，芯片参数这东西，翻两页新闻全知道；真正有意思的是，有人在拆一个存在了40年的联盟。

PC行业有个老词，叫Wintel；Windows加Intel，一个出操作系统，一个出CPU。锁死了全世界几十亿台电脑的底层架构。

40年了，你买一台Windows电脑，CPU不是英特尔就是AMD，都是x86架构，没第三个选项。

这个联盟，被捅了两刀。

第一刀，2020年苹果发M1；把英特尔踢出Mac，自己造CPU自己配系统，效果很好，代价是苹果只管自己的地盘。macOS跟Windows毛关系都没有。

第二刀，2024年高通做骁龙X Elite。做Windows on ARM笔记本；我翻了一下Canalys的数据。2024年Q3，骁龙X总共出货72万台。市场份额0.8%。

没起来的核心原因就一个：软件生态。

微软连ARM版Windows 11的官方安装包都拖着不肯发。大量应用要转译，反作弊软件、企业驱动也没搞定。高通有芯片，没生态，一个人撬不动Wintel的锁。

6月1日，黄仁勋在台北Computex发了RTX Spark。

英伟达、微软、ARM三家在同一时间发了同一条消息：「A new era of PC」。

跟高通那次完全不一样，高通过来做骁龙X的时候，微软态度是「支持」，发了几台Surface，推了个Copilot+ PC的概念，然后，Windows对ARM的适配继续拖。

这次微软是主动的，Build 2026大会上，纳德拉把Windows重新定义成本地AI Agent的运行平台，发了Aion 1.0本地模型、Windows Local AI运行时、Project Solara。

微软第一次把端侧AI当正经事来干，是压了筹码。

你再回头看，就清楚了，苹果那刀砍在自己的院子里，高通那把锁撬了半天没撬动，这次呢？造芯片的和造锁的坐一桌了。锁都换了。

......

换的那把锁，叫RTX Spark。黄仁勋在Computex上给它一个词：超级芯片（Superchip），不是营销话术。你把架构看一遍就知道，他没吹。

过去两年，PC行业一直在喊AI PC。怎么喊的？拿一颗x86处理器，旁边贴一个NPU，也就是神经网络处理单元。跑点轻量AI任务。

微软给Copilot+ PC定的门槛是NPU算力40 TOPS。

40 TOPS能干嘛？

语音转文字。做一些图像识别，支撑Windows Copilot做点基础的文本补全；想在本地跑一个百亿参数的大语言模型？不够。差一个数量级都不止。

RTX Spark的思路完全不一样。

这颗芯片，700亿个晶体管，台积电3nm；它把20核的Grace CPU和一颗Blackwell架构GPU封在同一块芯片上，中间用NVLink-C2C连，带宽600GB/s。

GPU那边6144个CUDA核心，AI算力1 petaflop FP4。大概是之前那些NPU的25倍。

翻译一下，GPU性能大概相当于一块笔记本版的RTX 5070。以前这个级别的GPU是独立显卡，插在主板上。现在它跟CPU长到一起了。

内存也改了。

传统笔记本，CPU一份内存，GPU一份内存，各跑各的；RTX Spark用统一内存架构，最高128GB，CPU和GPU共享。

你在本地加载一个大模型，不用在CPU和GPU之间来回搬数据，直接在同一块内存里跑。

这个架构不陌生，苹果M系列走的就是这条路，统一内存、CPU和GPU封在一起、芯片级集成。

RTX Spark做的事，是在Windows阵营里第一次复刻了这个思路；同时把GPU规模拉到了苹果给不了的级别。

它有个前身，DGX Spark，英伟达年初发布的桌面AI工作站，定价3999美元。同一颗芯片的桌面版。RTX Spark是它的笔记本化。

OEM已经排好了，微软Surface Laptop Ultra打头阵，戴尔、惠普、联想、华硕、MSI全部跟进。今年秋天上市，RTX Spark是把AI引擎放到了中间，整台电脑围着它转。

......

芯片是好芯片。问题是，谁要它？郭明錤在RTX Spark发布前一天发了一条分析。他拿的是供应链数据。

搭载这颗芯片的设备，未来两年出货量大概1000万台；1000万台，听着不少。你放到全球PC市场里算一下。一年卖2.5亿台。1000万分两年，一年500万。占比2%。

郭明錤给了个定性：小众市场。瞄准对端侧AI算力有需求的重度用户。

这个判断背后藏着一个更扎心的事实。他说，目前PC上的AI应用，核心全在云端。

你打开浏览器用ChatGPT，用Claude，用Gemini。算力跑在别人服务器上；你通过API调大模型的token，算力也在云端，你的电脑在这个过程中干的活，就是一个浏览器。

什么芯片跑浏览器，有差别吗？没有。

郭明錤举了两个例子：

2026年PC行业最热的事之一是MacBook Neo。苹果出了一款低价MacBook，卖疯了。出货量预估从500万台调到1000万台。

消费者买的是什么？低价、设计、生态。跟端侧AI算力半毛钱关系都没有。

第二个是便宜的小主机，Mac mini这类产品，因为能7×24小时挂着跑AI Agent，很多开发者关注。听着像端侧AI的场景对吧？

实际上，这些Agent的推理算力几乎全部来自云端，小主机干的事是保持在线、调度任务，真正的计算不在本地。

所以我说，这事指向一个根本问题：端侧AI目前没有杀手级应用。不是硬件不够。

RTX Spark的算力，在本地跑百亿参数的模型绰绰有余。问题是，跑它干嘛？用户想不出一个非要在本地跑不可的理由。

微软不是没看到这件事。

Build 2026上发的那一堆东西，本质上都在回答同一个问题：操作系统怎么让端侧AI变得有用。

Aion 1.0是一个140亿参数的本地小模型，支持工具调用，直接内置在Windows里；以后Windows上的AI Agent不用每次都去云端取指令，一部分推理和决策可以在你电脑上直接完成。

方向是对的。就是刚起步。

端侧AI真正能干、云端干不了的事，其实很清楚，隐私数据不出本机，跨应用的数据调度不经过第三方服务器。低延迟的实时响应。

这些能力需要操作系统层面的深度整合，不是装一个App能解决的。

那现在是什么局面？很清晰：芯片已经准备好了，操作系统刚迈出第一步，用户需求还停留在「用浏览器上ChatGPT」的阶段。

三样东西跑在三条不同的时间线上，芯片最快，生态最慢。

......

英伟达又不傻。份额没多大，干这事图什么？

黄仁勋在Computex的媒体问答上说了一句：英伟达已经不是一家GPU公司了，是一家基础设施公司，放在PC语境里，意味不一样。

英伟达做RTX Spark，不是来抢英特尔那点CPU份额的。PC市场一年3000多亿美元，听着很大；英伟达光数据中心业务，上个季度就做了752亿美元。PC那点钱，犯不着让它专门打一仗。

它要另一件东西，我查了一下。今年3月GTC大会上，英伟达纪念CUDA二十周年，公布了一个数字：600万开发者。

这600万人用CUDA写代码，跑在英伟达的GPU上。覆盖AI训练、推理、科学计算、图形渲染、视频生产。整个AI产业的软件栈，底层是CUDA。

CUDA的护城河是迁移成本。

大学教CUDA，论文发CUDA基准测试，创业公司招CUDA工程师；一个团队一旦在CUDA上积累了代码、工具链和工程经验，换平台？代价是组织级的。

这600万开发者现在在哪？在数据中心里。用几万美元一块的芯片。RTX Spark干的事，是把CUDA拉到笔记本上。

这些人写的代码，不用改、不用重新编译，直接在一台笔记本上跑。架构是通的。

黄仁勋在发布会上还说了一句：我们要重新发明人类最重要的工具；说的就是PC。

他同时还宣布了一件事，RTX Spark之后的第二代、第三代芯片已经在规划中，未来英伟达每一代平台架构，都会包含一颗Spark芯片，30多款笔记本、10多款台式机，同时上市。

这不是试水，不过，CUDA能不能真正长到每一台终端上，取决于一个英伟达自己控制不了的变量：价格。

全球DRAM现在处在供应紧张的周期里，内存涨价；笔记本版第一批产品的起步价不会低；想让CUDA覆盖的不只重度用户，要更多代的产品，和制程、内存的成本曲线配合。

英伟达选在这个时间落子。说白了，因为它看到了一个窗口：

微软第一次认真对待端侧AI；ARM架构在Windows上第一次有了成规模的OEM支持；CUDA的开发者基数已经够大。

你看，三件事凑到一起了，这是背后动机。

本文来自微信公众号“王智远”（ID：Z201440），作者：王智远，36氪经授权发布。

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

黄仁勋这一刀老深了

最近内容

36氪AI测评

36氪寻求报道

下一篇