CPU,夯爆了

半导体行业观察·2026年05月28日 12:26
短短几个月里,数据中心CPU市场的想象空间从600亿美元、1200 亿美元,进一步被推高到2000亿美元级别。CPU确实在加速膨胀,那么问题来了,AI 时代的数据中心,为什么突然需要这

AI从训练转向推理,CPU在AI时代日益重要且不可或缺。这点从芯片巨头和研调机构对未来市场空间(TAM)的预测和修正就能很直观的感受到:

2026年5月,AMD首席执行官苏姿丰(Dr. Lisa Su)在2026年一季度财报电话会上上调了对全球服务器CPU市场的长期预测:预计到2030年,服务器CPU的TAM将以超过35%的年复合增长率(CAGR)高速飙升,达到1200亿美元以上。而就在数月前,这一数字的预测还仅为600亿美元。

华尔街投行花旗银行(Citi)在2026年5月中旬的客户报告中更加乐观,将2030年全球CPU市场规模锚定在1315亿美元。Arm官方也将其相关的TAM锁定在了千亿美元级别。

英伟达则更为激进,其在2027财年一季度电话会中提到,Vera CPU将为英伟达打开一个“全新的2000亿美元TAM”,并称公司今年已能看到接近200亿美元的CPU收入可见度。 随后路透社的报道称,黄仁勋确认英伟达对CPU市场这2000亿美元的预测包括中国市场,并表示公司正在加速Vera Rubin平台生产。

短短几个月里,数据中心CPU市场的想象空间从600亿美元、1200 亿美元,进一步被推高到2000亿美元级别。CPU确实在加速膨胀,那么问题来了,AI 时代的数据中心,为什么突然需要这么多CPU?

Agentic AI,重新定价CPU

随着AI基础设施正在从训练中心转向推理中心,进一步转向智能体中心。CPU的参与度正在迅速增加。

早期传统大模型推理更像是一次请求、一次响应:用户输入问题,模型生成答案。此时,GPU 负责大部分矩阵计算,CPU 主要承担调度和数据准备。但 Agentic AI 不一样,它要持续规划任务、调用工具、访问数据库、执行代码、检索知识、协调多个子智能体,并在长上下文中保持状态。

AMD CEO Lisa Su 在财报电话会上指出,随着推理和智能体AI负载快速增长,服务器CPU 的计算需求正在被重新放大。原因在于,这类应用并不只依赖GPU和加速器完成模型计算,还需要CPU承担大量系统层面的工作,包括任务编排、数据调度、并行执行、资源协调,以及作为GPU和加速器集群的头节点,对整个AI系统进行统一调度。

TrendForce 引述 AMD 财报电话会信息称,随着智能体 AI 发展,行业正在从长期以来“一颗 CPU 对四到八颗 GPU”的配置逻辑,转向下一代数据中心中更高密度、甚至接近 1:1 CPU-GPU 配比的方向。

英特尔公司CEO陈立武在摩根大通第54届全球科技大会上,也指出,有客户向英特尔反馈CPU与GPU的配置比例从1:8向1:1靠拢,甚至可达4:1。陈立武还表示,物理AI(具身智能)市场更是相当大。因此,我认为我有机会在CPU上发力,并推动新的架构来驱动定制化(purpose-built)的工作负载,以针对特定的工作负载进行优化。加速器也是同样的情况,我们要确保我们拥有它。最近,英特尔刚从高通雇来了Alex(阿历克斯)来构建物理AI,从硅片优化一直到软件、到系统平台工程的整个全栈,并推动机器人或数字工人(digital workers)的解决方案。

英伟达强调,今天的数据中心已经演变为可以产生持续收入的 AI 工厂。客户真正购买的不是某一颗 GPU,而是一整套 AI 基础设施能力。因此,衡量 AI 基础设施价值的关键指标,也不再是 GPU 单价,而是单位功耗下的 token 产出、单位成本下的 token 产出、系统在线率、资源利用率、部署投产速度、软件栈长期可用性,以及设备资产的全生命周期价值。

CPU 市场被上修的根本逻辑:CPU 不再只是服务器里的通用计算单元,而是AI工厂里的系统调度中枢。当 AI 从训练走向推理,从推理走向 Agentic AI,从单机服务器走向万卡集群和 AI Factory,数据中心真正竞争的已经不是一颗 GPU,而是一个系统。在这个系统中,CPU承担的是秩序角色:它调度任务、管理内存、搬运数据、协调加速器、处理控制流、支撑数据库和工具调用,并把 GPU、DPU、NIC、存储和软件栈组织成一个可运行、可扩展、可计费的 AI 工厂。

x86双雄,激战正酣

从数据来看,目前在价值更高、利润最丰厚的大型云厂商数据中心服务器CPU采购中,AMD几乎已经与英特尔平分秋色。

2026 年一季度,AMD的数据中心业务收入达到58亿美元,同比增长57%,主要由 EPYC CPU 和 Instinct GPU需求拉动。公司同时提到,服务器CPU收入连续第四个季度创纪录,同比增长超过50%;主要云厂商都在扩大 EPYC 使用范围,以支持从通用计算、数据处理,到加速器头部节点和新兴Agentic应用在内的一系列AI工作负载。

Mercury Research数据显示,AMD在服务器CPU市场的出货量份额已攀升至33.2%,而营收份额达到了创纪录的46.2%。这意味着在2026年Q1全球所有出货的服务器CPU中,每3颗里就有大体1颗是AMD的。AMD卖出的处理器平均价格(ASP)显著高于英特尔。

这暴露了一个隐忧——虽然英特尔依然握有近三分之二(约66.8%)的服务器CPU数量出货控制权,但由于其中包含价格较低的常规或中低端芯片,导致其最终拿到的收入蛋糕被蚕食到仅剩53.8%左右。

英特尔作为是传统服务器CPU的基本盘玩家,主要是靠至强(Xeon)生态长期覆盖企业、云、数据库、HPC、网络和边缘计算。Xeon 6包括P-core和E-core两条路线:E-core 侧重高核心密度和性能功耗比,P-core则面向更广泛负载、AI 和 HPC,并在每个核心中内置 AI 加速能力。

面对高价值数据中心市场被不断分流,英特尔正在把 Clearwater Forest,也就是 Xeon 6+,视为下一轮反击的关键产品。作为英特尔首款基于 18A 制程打造的服务器处理器,Clearwater Forest 预计将于 2026 年上半年发布,目标客户主要覆盖超大规模数据中心、云服务商以及电信运营商。

这款产品的核心逻辑,是用更先进的制程和更高密度的核心设计,去回应云端客户对性能、能效和部署密度的要求。Clearwater Forest 最高将提供 288 个能效核心,相比上一代 Sierra Forest,其能效核心的单周期指令执行能力提升约 17%。对于英特尔而言,这不仅是一颗新一代 Xeon 处理器,更是其借助18A制程重塑服务器CPU竞争力的一次关键尝试。

虽然CPU市场在膨胀,但竞争维度也在升维。

AMD已经把CPU与GPU、机柜级系统绑定在一起讲。AMD的第六代 EPYC Venice 采用 Zen 6 架构和 2nm 工艺,面向云、企业和 AI 工作负载;其中Verano是 AMD 第一款专为 AI 基础设施打造的 EPYC CPU。AMD 还表示,Venice 将覆盖吞吐优化、性能功耗比优化、性能价格比优化和 AI 基础设施优化等不同方向,并计划在 2026 年晚些时候发布。

AMD也正在加速对供应链的投资。Lisa Su 在台北表示,全球CPU市场需求高于一年前所有人的预期,CPU 市场已经趋紧;AMD正在与台湾伙伴扩大产能,并计划向台湾 AI 产业投资超过 100 亿美元,重点包括先进封装、基板和机柜级系统制造。其合作伙伴包括 ASE、SPIL、PTI、Wiwynn、Wistron、Inventec、Unimicron、AIC、Nan Ya PCB 和 Kinsus 等。

陈立武在摩根大通第54届全球科技大会上透露,Intel 18A 已经支持 Panther Lake 进入量产阶段,良率每月提升约 7%,进展超出内部预期。

在CPU方向上,他强调,英特尔必须推动更深层次的架构变革,逐步转向更具定制化特征的芯片设计;而在加速器方向上,英特尔将通过与 SambaNova 的合作补齐相关能力。

陈立武表示:“先进封装、晶圆代工能力,以及我们正在引入的新一代CPU架构,这些组合在一起非常令人兴奋。”他对英特尔未来竞争方式的理解,已经不再局限于单颗芯片本身。陈立武指出,未来必须走向全栈式发展,而不能只停留在硅片或网络层面。企业不仅要构建软件能力,还要进行内存优化,并真正推动平台级方案,最终向客户交付完整的机箱级系统架构。在这个过程中,没有任何一家企业能够单打独斗。陈立武特别强调合作的重要性,英特尔需要合作伙伴补齐能力,也需要生态伙伴共同支撑客户落地。

英伟达Vera CPU,来势汹汹

对于英伟达而言,一方面凭借GPU稳坐数据中心龙头位置,另一方面随着Vera CPU 出手,GPU巨头开始进入CPU 腹地。

英伟达过去已经有Grace CPU,并通过 Grace Blackwell 进入 CPU-GPU 超级芯片阶段。英伟达官方资料显示,GB200 NVL72 将 36 颗 Grace CPU 和 72 颗 Blackwell GPU 连接在一个机柜级、液冷系统中,形成 72-GPU NVLink 域,以服务实时万亿参数模型推理等场景。

Vera则是更强劲的下一步。

在2027财年一季度电话会上,NVIDIA表示,Vera基于定制 Arm 核心,并与 Rubin GPU 和 NVLink端到端协同设计;相比 x86替代方案,Vera宣称可实现最高1.5倍单核性能、2倍性能功耗比和4倍机柜密度。英伟达还称 Vera Rubin 将在 2026 年下半年开始生产出货,Q3 起步,并通过跨五个加速机柜集成七类专用芯片,较Blackwell实现最高35倍推理吞吐和最高10倍AI Factory收入提升。

英伟达不是想只做GPU,它要把 CPU、GPU、NVLink、DPU、NIC、交换机和软件栈整合成一个完整平台,整个一锅端。

这对英特尔、AMD、Arm、Broadcom、Marvell 等厂商都会产生压力。对英特尔和 AMD 来说,英伟达正在侵入CPU腹地;对 Broadcom和Marvell来说,英伟达通过Spectrum-X、ConnectX、BlueField和NVLink体系,也在继续压缩外部互联芯片供应商的系统话语权;对Arm来说,Vera是好消息,也是复杂信号——它强化了 Arm 架构在数据中心的存在感,但也可能让 Arm 生态更多被英伟达平台绑定。

Arm下场做芯片,

服务器CPU生态生变

Arm是这轮CPU市场扩张中最值得关注的变量之一。

Arm 的 AGI CPU 是其第一款真正意义上的量产级芯片产品,专门面向智能体 AI 工作负载设计。这款处理器基于Arm Neoverse CSS V3平台打造,目标场景是高性能计算和高密度机柜部署。采用了明显的机柜优先设计思路。根据 Arm 官方资料,一个 36kW 风冷 ORv3 机柜,目标配置可以部署 30 台 1U 服务器,每台服务器搭载两颗 Arm AGI CPU,合计可提供 8160 个高性能 CPU 核心。

从规格上来看,Arm AGI CPU 最高可提供 136 个 Neoverse V3 核心,每个核心配备 2MB 二级缓存,采用 Armv9.2 架构,支持 bfloat16 和 INT8 AI 指令,热设计功耗为 300W。同时,它支持 12 通道 DDR5-8800 内存,每个核心最高可获得 6GB/s 的内存带宽,并配备 96 条 PCIe Gen6 通道,支持 CXL 3.0 内存扩展和互连能力。

Arm在官方博客提到,Meta是AGI CPU 的主导合作伙伴和客户,双方共同开发这款芯片,用于优化 Meta 面向千兆瓦级 AI 基础设施的部署,并与 Meta 自研的 MTIA 加速器协同工作。

Arm在2026财年四季度电话会中明确提到,到FYE31,公司预计AGI CPU收入将达到150 亿美元,IP收入达到100亿美元,合计收入目标为250亿美元。

对 Arm 来说,AGI CPU 不是一次简单的产品发布,而是公司商业模式的一次边界扩张。过去,Arm 更多站在服务器 CPU 产业的底层,通过架构授权和 IP 版税参与 AWS、Google、Microsoft、NVIDIA、Ampere 等客户的数据中心芯片增长;但 AGI CPU 的出现,意味着 Arm 第一次以成品硅片供应商的身份直接进入数据中心 CPU 市场。

不过,Arm 的角色也因此变得更加微妙。一方面,它依然可以通过 Neoverse 架构、CSS 计算子系统和 IP 授权模式,持续从云厂商自研 CPU 中获益;另一方面,当 AGI CPU 进入量产级芯片市场后,Arm 也可能与部分采用其 IP 授权的客户形成新的竞争边界。

但无论如何,Arm 已经不再只是过去那个以移动端架构闻名的 IP 公司。它正在成为数据中心 CPU 市场中越来越重要的底层架构提供者和基础设施级玩家。

写在最后

在AI的上半场,行业记住了GPU的狂飙;而在AI的下半场,加速膨胀的CPU正用实力证明,重塑科技未来的系统级算力新秩序,依然离不开这位历久弥新的主控之王。

而这片CPU的新蓝海,注定不会是风平浪静。无论是AMD在营收份额上的步步紧逼,英特尔依托18A先进制程的生死反击,英伟达凭借Vera平台祭出的“一锅端”式系统包揽,还是Arm带着AGI成品硅片打破商业边界的亲自下场,都预示着一场升维的算力战争才刚刚打响。

本文来自微信公众号“半导体行业观察”(ID:icbank),作者:杜芹DQ,36氪经授权发布。

+1
6

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

最有深度的半导体新媒体,实讯、专业、原创、深度。

下一篇

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业