黄仁勋这一刀老深了
有朋友问我,怎么看英伟达和微软一起做ARM架构的AI PC。
我说,这是个好问题,芯片参数这东西,翻两页新闻全知道;真正有意思的是,有人在拆一个存在了40年的联盟。
PC行业有个老词,叫Wintel;Windows加Intel,一个出操作系统,一个出CPU。锁死了全世界几十亿台电脑的底层架构。
40年了,你买一台Windows电脑,CPU不是英特尔就是AMD,都是x86架构,没第三个选项。
这个联盟,被捅了两刀。
第一刀,2020年苹果发M1;把英特尔踢出Mac,自己造CPU自己配系统,效果很好,代价是苹果只管自己的地盘。macOS跟Windows毛关系都没有。
第二刀,2024年高通做骁龙X Elite。做Windows on ARM笔记本;我翻了一下Canalys的数据。2024年Q3,骁龙X总共出货72万台。市场份额0.8%。
没起来的核心原因就一个:软件生态。
微软连ARM版Windows 11的官方安装包都拖着不肯发。大量应用要转译,反作弊软件、企业驱动也没搞定。高通有芯片,没生态,一个人撬不动Wintel的锁。
6月1日,黄仁勋在台北Computex发了RTX Spark。
英伟达、微软、ARM三家在同一时间发了同一条消息:「A new era of PC」。
跟高通那次完全不一样,高通过来做骁龙X的时候,微软态度是「支持」,发了几台Surface,推了个Copilot+ PC的概念,然后,Windows对ARM的适配继续拖。
这次微软是主动的,Build 2026大会上,纳德拉把Windows重新定义成本地AI Agent的运行平台,发了Aion 1.0本地模型、Windows Local AI运行时、Project Solara。
微软第一次把端侧AI当正经事来干,是压了筹码。
你再回头看,就清楚了,苹果那刀砍在自己的院子里,高通那把锁撬了半天没撬动,这次呢?造芯片的和造锁的坐一桌了。锁都换了。
......
换的那把锁,叫RTX Spark。黄仁勋在Computex上给它一个词:超级芯片(Superchip),不是营销话术。你把架构看一遍就知道,他没吹。
过去两年,PC行业一直在喊AI PC。怎么喊的?拿一颗x86处理器,旁边贴一个NPU,也就是神经网络处理单元。跑点轻量AI任务。
微软给Copilot+ PC定的门槛是NPU算力40 TOPS。
40 TOPS能干嘛?
语音转文字。做一些图像识别,支撑Windows Copilot做点基础的文本补全;想在本地跑一个百亿参数的大语言模型?不够。差一个数量级都不止。
RTX Spark的思路完全不一样。
这颗芯片,700亿个晶体管,台积电3nm;它把20核的Grace CPU和一颗Blackwell架构GPU封在同一块芯片上,中间用NVLink-C2C连,带宽600GB/s。
GPU那边6144个CUDA核心,AI算力1 petaflop FP4。大概是之前那些NPU的25倍。
翻译一下,GPU性能大概相当于一块笔记本版的RTX 5070。以前这个级别的GPU是独立显卡,插在主板上。现在它跟CPU长到一起了。
内存也改了。
传统笔记本,CPU一份内存,GPU一份内存,各跑各的;RTX Spark用统一内存架构,最高128GB,CPU和GPU共享。
你在本地加载一个大模型,不用在CPU和GPU之间来回搬数据,直接在同一块内存里跑。
这个架构不陌生,苹果M系列走的就是这条路,统一内存、CPU和GPU封在一起、芯片级集成。
RTX Spark做的事,是在Windows阵营里第一次复刻了这个思路;同时把GPU规模拉到了苹果给不了的级别。
它有个前身,DGX Spark,英伟达年初发布的桌面AI工作站,定价3999美元。同一颗芯片的桌面版。RTX Spark是它的笔记本化。
OEM已经排好了,微软Surface Laptop Ultra打头阵,戴尔、惠普、联想、华硕、MSI全部跟进。今年秋天上市,RTX Spark是把AI引擎放到了中间,整台电脑围着它转。
......
芯片是好芯片。问题是,谁要它?郭明錤在RTX Spark发布前一天发了一条分析。他拿的是供应链数据。
搭载这颗芯片的设备,未来两年出货量大概1000万台;1000万台,听着不少。你放到全球PC市场里算一下。一年卖2.5亿台。1000万分两年,一年500万。占比2%。
郭明錤给了个定性:小众市场。瞄准对端侧AI算力有需求的重度用户。
这个判断背后藏着一个更扎心的事实。他说,目前PC上的AI应用,核心全在云端。
你打开浏览器用ChatGPT,用Claude,用Gemini。算力跑在别人服务器上;你通过API调大模型的token,算力也在云端,你的电脑在这个过程中干的活,就是一个浏览器。
什么芯片跑浏览器,有差别吗?没有。
郭明錤举了两个例子:
2026年PC行业最热的事之一是MacBook Neo。苹果出了一款低价MacBook,卖疯了。出货量预估从500万台调到1000万台。
消费者买的是什么?低价、设计、生态。跟端侧AI算力半毛钱关系都没有。
第二个是便宜的小主机,Mac mini这类产品,因为能7×24小时挂着跑AI Agent,很多开发者关注。听着像端侧AI的场景对吧?
实际上,这些Agent的推理算力几乎全部来自云端,小主机干的事是保持在线、调度任务,真正的计算不在本地。
所以我说,这事指向一个根本问题:端侧AI目前没有杀手级应用。不是硬件不够。
RTX Spark的算力,在本地跑百亿参数的模型绰绰有余。问题是,跑它干嘛?用户想不出一个非要在本地跑不可的理由。
微软不是没看到这件事。
Build 2026上发的那一堆东西,本质上都在回答同一个问题:操作系统怎么让端侧AI变得有用。
Aion 1.0是一个140亿参数的本地小模型,支持工具调用,直接内置在Windows里;以后Windows上的AI Agent不用每次都去云端取指令,一部分推理和决策可以在你电脑上直接完成。
方向是对的。就是刚起步。
端侧AI真正能干、云端干不了的事,其实很清楚,隐私数据不出本机,跨应用的数据调度不经过第三方服务器。低延迟的实时响应。
这些能力需要操作系统层面的深度整合,不是装一个App能解决的。
那现在是什么局面?很清晰:芯片已经准备好了,操作系统刚迈出第一步,用户需求还停留在「用浏览器上ChatGPT」的阶段。
三样东西跑在三条不同的时间线上,芯片最快,生态最慢。
......
英伟达又不傻。份额没多大,干这事图什么?
黄仁勋在Computex的媒体问答上说了一句:英伟达已经不是一家GPU公司了,是一家基础设施公司,放在PC语境里,意味不一样。
英伟达做RTX Spark,不是来抢英特尔那点CPU份额的。PC市场一年3000多亿美元,听着很大;英伟达光数据中心业务,上个季度就做了752亿美元。PC那点钱,犯不着让它专门打一仗。
它要另一件东西,我查了一下。今年3月GTC大会上,英伟达纪念CUDA二十周年,公布了一个数字:600万开发者。
这600万人用CUDA写代码,跑在英伟达的GPU上。覆盖AI训练、推理、科学计算、图形渲染、视频生产。整个AI产业的软件栈,底层是CUDA。
CUDA的护城河是迁移成本。
大学教CUDA,论文发CUDA基准测试,创业公司招CUDA工程师;一个团队一旦在CUDA上积累了代码、工具链和工程经验,换平台?代价是组织级的。
这600万开发者现在在哪?在数据中心里。用几万美元一块的芯片。RTX Spark干的事,是把CUDA拉到笔记本上。
这些人写的代码,不用改、不用重新编译,直接在一台笔记本上跑。架构是通的。
黄仁勋在发布会上还说了一句:我们要重新发明人类最重要的工具;说的就是PC。
他同时还宣布了一件事,RTX Spark之后的第二代、第三代芯片已经在规划中,未来英伟达每一代平台架构,都会包含一颗Spark芯片,30多款笔记本、10多款台式机,同时上市。
这不是试水,不过,CUDA能不能真正长到每一台终端上,取决于一个英伟达自己控制不了的变量:价格。
全球DRAM现在处在供应紧张的周期里,内存涨价;笔记本版第一批产品的起步价不会低;想让CUDA覆盖的不只重度用户,要更多代的产品,和制程、内存的成本曲线配合。
英伟达选在这个时间落子。说白了,因为它看到了一个窗口:
微软第一次认真对待端侧AI;ARM架构在Windows上第一次有了成规模的OEM支持;CUDA的开发者基数已经够大。
你看,三件事凑到一起了,这是背后动机。
本文来自微信公众号“王智远”(ID:Z201440),作者:王智远,36氪经授权发布。















