CPU，夯爆了

半导体行业观察·2026年05月28日 12:26

短短几个月里，数据中心CPU市场的想象空间从600亿美元、1200 亿美元，进一步被推高到2000亿美元级别。CPU确实在加速膨胀，那么问题来了，AI 时代的数据中心，为什么突然需要这

AI从训练转向推理，CPU在AI时代日益重要且不可或缺。这点从芯片巨头和研调机构对未来市场空间（TAM）的预测和修正就能很直观的感受到：

2026年5月，AMD首席执行官苏姿丰（Dr. Lisa Su）在2026年一季度财报电话会上上调了对全球服务器CPU市场的长期预测：预计到2030年，服务器CPU的TAM将以超过35%的年复合增长率（CAGR）高速飙升，达到1200亿美元以上。而就在数月前，这一数字的预测还仅为600亿美元。

华尔街投行花旗银行（Citi）在2026年5月中旬的客户报告中更加乐观，将2030年全球CPU市场规模锚定在1315亿美元。Arm官方也将其相关的TAM锁定在了千亿美元级别。

英伟达则更为激进，其在2027财年一季度电话会中提到，Vera CPU将为英伟达打开一个“全新的2000亿美元TAM”，并称公司今年已能看到接近200亿美元的CPU收入可见度。随后路透社的报道称，黄仁勋确认英伟达对CPU市场这2000亿美元的预测包括中国市场，并表示公司正在加速Vera Rubin平台生产。

短短几个月里，数据中心CPU市场的想象空间从600亿美元、1200 亿美元，进一步被推高到2000亿美元级别。CPU确实在加速膨胀，那么问题来了，AI 时代的数据中心，为什么突然需要这么多CPU？

Agentic AI，重新定价CPU

随着AI基础设施正在从训练中心转向推理中心，进一步转向智能体中心。CPU的参与度正在迅速增加。

早期传统大模型推理更像是一次请求、一次响应：用户输入问题，模型生成答案。此时，GPU 负责大部分矩阵计算，CPU 主要承担调度和数据准备。但 Agentic AI 不一样，它要持续规划任务、调用工具、访问数据库、执行代码、检索知识、协调多个子智能体，并在长上下文中保持状态。

AMD CEO Lisa Su 在财报电话会上指出，随着推理和智能体AI负载快速增长，服务器CPU 的计算需求正在被重新放大。原因在于，这类应用并不只依赖GPU和加速器完成模型计算，还需要CPU承担大量系统层面的工作，包括任务编排、数据调度、并行执行、资源协调，以及作为GPU和加速器集群的头节点，对整个AI系统进行统一调度。

TrendForce 引述 AMD 财报电话会信息称，随着智能体 AI 发展，行业正在从长期以来“一颗 CPU 对四到八颗 GPU”的配置逻辑，转向下一代数据中心中更高密度、甚至接近 1:1 CPU-GPU 配比的方向。

英特尔公司CEO陈立武在摩根大通第54届全球科技大会上，也指出，有客户向英特尔反馈CPU与GPU的配置比例从1:8向1:1靠拢，甚至可达4:1。陈立武还表示，物理AI（具身智能）市场更是相当大。因此，我认为我有机会在CPU上发力，并推动新的架构来驱动定制化（purpose-built）的工作负载，以针对特定的工作负载进行优化。加速器也是同样的情况，我们要确保我们拥有它。最近，英特尔刚从高通雇来了Alex（阿历克斯）来构建物理AI，从硅片优化一直到软件、到系统平台工程的整个全栈，并推动机器人或数字工人（digital workers）的解决方案。

英伟达强调，今天的数据中心已经演变为可以产生持续收入的 AI 工厂。客户真正购买的不是某一颗 GPU，而是一整套 AI 基础设施能力。因此，衡量 AI 基础设施价值的关键指标，也不再是 GPU 单价，而是单位功耗下的 token 产出、单位成本下的 token 产出、系统在线率、资源利用率、部署投产速度、软件栈长期可用性，以及设备资产的全生命周期价值。

CPU 市场被上修的根本逻辑：CPU 不再只是服务器里的通用计算单元，而是AI工厂里的系统调度中枢。当 AI 从训练走向推理，从推理走向 Agentic AI，从单机服务器走向万卡集群和 AI Factory，数据中心真正竞争的已经不是一颗 GPU，而是一个系统。在这个系统中，CPU承担的是秩序角色：它调度任务、管理内存、搬运数据、协调加速器、处理控制流、支撑数据库和工具调用，并把 GPU、DPU、NIC、存储和软件栈组织成一个可运行、可扩展、可计费的 AI 工厂。

x86双雄，激战正酣

从数据来看，目前在价值更高、利润最丰厚的大型云厂商数据中心服务器CPU采购中，AMD几乎已经与英特尔平分秋色。

2026 年一季度，AMD的数据中心业务收入达到58亿美元，同比增长57%，主要由 EPYC CPU 和 Instinct GPU需求拉动。公司同时提到，服务器CPU收入连续第四个季度创纪录，同比增长超过50%；主要云厂商都在扩大 EPYC 使用范围，以支持从通用计算、数据处理，到加速器头部节点和新兴Agentic应用在内的一系列AI工作负载。

Mercury Research数据显示，AMD在服务器CPU市场的出货量份额已攀升至33.2%，而营收份额达到了创纪录的46.2%。这意味着在2026年Q1全球所有出货的服务器CPU中，每3颗里就有大体1颗是AMD的。AMD卖出的处理器平均价格（ASP）显著高于英特尔。

这暴露了一个隐忧——虽然英特尔依然握有近三分之二（约66.8%）的服务器CPU数量出货控制权，但由于其中包含价格较低的常规或中低端芯片，导致其最终拿到的收入蛋糕被蚕食到仅剩53.8%左右。

英特尔作为是传统服务器CPU的基本盘玩家，主要是靠至强（Xeon）生态长期覆盖企业、云、数据库、HPC、网络和边缘计算。Xeon 6包括P-core和E-core两条路线：E-core 侧重高核心密度和性能功耗比，P-core则面向更广泛负载、AI 和 HPC，并在每个核心中内置 AI 加速能力。

面对高价值数据中心市场被不断分流，英特尔正在把 Clearwater Forest，也就是 Xeon 6+，视为下一轮反击的关键产品。作为英特尔首款基于 18A 制程打造的服务器处理器，Clearwater Forest 预计将于 2026 年上半年发布，目标客户主要覆盖超大规模数据中心、云服务商以及电信运营商。

这款产品的核心逻辑，是用更先进的制程和更高密度的核心设计，去回应云端客户对性能、能效和部署密度的要求。Clearwater Forest 最高将提供 288 个能效核心，相比上一代 Sierra Forest，其能效核心的单周期指令执行能力提升约 17%。对于英特尔而言，这不仅是一颗新一代 Xeon 处理器，更是其借助18A制程重塑服务器CPU竞争力的一次关键尝试。

虽然CPU市场在膨胀，但竞争维度也在升维。

AMD已经把CPU与GPU、机柜级系统绑定在一起讲。AMD的第六代 EPYC Venice 采用 Zen 6 架构和 2nm 工艺，面向云、企业和 AI 工作负载；其中Verano是 AMD 第一款专为 AI 基础设施打造的 EPYC CPU。AMD 还表示，Venice 将覆盖吞吐优化、性能功耗比优化、性能价格比优化和 AI 基础设施优化等不同方向，并计划在 2026 年晚些时候发布。

AMD也正在加速对供应链的投资。Lisa Su 在台北表示，全球CPU市场需求高于一年前所有人的预期，CPU 市场已经趋紧；AMD正在与台湾伙伴扩大产能，并计划向台湾 AI 产业投资超过 100 亿美元，重点包括先进封装、基板和机柜级系统制造。其合作伙伴包括 ASE、SPIL、PTI、Wiwynn、Wistron、Inventec、Unimicron、AIC、Nan Ya PCB 和 Kinsus 等。

陈立武在摩根大通第54届全球科技大会上透露，Intel 18A 已经支持 Panther Lake 进入量产阶段，良率每月提升约 7%，进展超出内部预期。

在CPU方向上，他强调，英特尔必须推动更深层次的架构变革，逐步转向更具定制化特征的芯片设计；而在加速器方向上，英特尔将通过与 SambaNova 的合作补齐相关能力。

陈立武表示：“先进封装、晶圆代工能力，以及我们正在引入的新一代CPU架构，这些组合在一起非常令人兴奋。”他对英特尔未来竞争方式的理解，已经不再局限于单颗芯片本身。陈立武指出，未来必须走向全栈式发展，而不能只停留在硅片或网络层面。企业不仅要构建软件能力，还要进行内存优化，并真正推动平台级方案，最终向客户交付完整的机箱级系统架构。在这个过程中，没有任何一家企业能够单打独斗。陈立武特别强调合作的重要性，英特尔需要合作伙伴补齐能力，也需要生态伙伴共同支撑客户落地。

英伟达Vera CPU，来势汹汹

对于英伟达而言，一方面凭借GPU稳坐数据中心龙头位置，另一方面随着Vera CPU 出手，GPU巨头开始进入CPU 腹地。

英伟达过去已经有Grace CPU，并通过 Grace Blackwell 进入 CPU-GPU 超级芯片阶段。英伟达官方资料显示，GB200 NVL72 将 36 颗 Grace CPU 和 72 颗 Blackwell GPU 连接在一个机柜级、液冷系统中，形成 72-GPU NVLink 域，以服务实时万亿参数模型推理等场景。

Vera则是更强劲的下一步。

在2027财年一季度电话会上，NVIDIA表示，Vera基于定制 Arm 核心，并与 Rubin GPU 和 NVLink端到端协同设计；相比 x86替代方案，Vera宣称可实现最高1.5倍单核性能、2倍性能功耗比和4倍机柜密度。英伟达还称 Vera Rubin 将在 2026 年下半年开始生产出货，Q3 起步，并通过跨五个加速机柜集成七类专用芯片，较Blackwell实现最高35倍推理吞吐和最高10倍AI Factory收入提升。

英伟达不是想只做GPU，它要把 CPU、GPU、NVLink、DPU、NIC、交换机和软件栈整合成一个完整平台，整个一锅端。

这对英特尔、AMD、Arm、Broadcom、Marvell 等厂商都会产生压力。对英特尔和 AMD 来说，英伟达正在侵入CPU腹地；对 Broadcom和Marvell来说，英伟达通过Spectrum-X、ConnectX、BlueField和NVLink体系，也在继续压缩外部互联芯片供应商的系统话语权；对Arm来说，Vera是好消息，也是复杂信号——它强化了 Arm 架构在数据中心的存在感，但也可能让 Arm 生态更多被英伟达平台绑定。

Arm下场做芯片，

服务器CPU生态生变

Arm是这轮CPU市场扩张中最值得关注的变量之一。

Arm 的 AGI CPU 是其第一款真正意义上的量产级芯片产品，专门面向智能体 AI 工作负载设计。这款处理器基于Arm Neoverse CSS V3平台打造，目标场景是高性能计算和高密度机柜部署。采用了明显的机柜优先设计思路。根据 Arm 官方资料，一个 36kW 风冷 ORv3 机柜，目标配置可以部署 30 台 1U 服务器，每台服务器搭载两颗 Arm AGI CPU，合计可提供 8160 个高性能 CPU 核心。

从规格上来看，Arm AGI CPU 最高可提供 136 个 Neoverse V3 核心，每个核心配备 2MB 二级缓存，采用 Armv9.2 架构，支持 bfloat16 和 INT8 AI 指令，热设计功耗为 300W。同时，它支持 12 通道 DDR5-8800 内存，每个核心最高可获得 6GB/s 的内存带宽，并配备 96 条 PCIe Gen6 通道，支持 CXL 3.0 内存扩展和互连能力。

Arm在官方博客提到，Meta是AGI CPU 的主导合作伙伴和客户，双方共同开发这款芯片，用于优化 Meta 面向千兆瓦级 AI 基础设施的部署，并与 Meta 自研的 MTIA 加速器协同工作。

Arm在2026财年四季度电话会中明确提到，到FYE31，公司预计AGI CPU收入将达到150 亿美元，IP收入达到100亿美元，合计收入目标为250亿美元。

对 Arm 来说，AGI CPU 不是一次简单的产品发布，而是公司商业模式的一次边界扩张。过去，Arm 更多站在服务器 CPU 产业的底层，通过架构授权和 IP 版税参与 AWS、Google、Microsoft、NVIDIA、Ampere 等客户的数据中心芯片增长；但 AGI CPU 的出现，意味着 Arm 第一次以成品硅片供应商的身份直接进入数据中心 CPU 市场。

不过，Arm 的角色也因此变得更加微妙。一方面，它依然可以通过 Neoverse 架构、CSS 计算子系统和 IP 授权模式，持续从云厂商自研 CPU 中获益；另一方面，当 AGI CPU 进入量产级芯片市场后，Arm 也可能与部分采用其 IP 授权的客户形成新的竞争边界。

但无论如何，Arm 已经不再只是过去那个以移动端架构闻名的 IP 公司。它正在成为数据中心 CPU 市场中越来越重要的底层架构提供者和基础设施级玩家。