AI 算力大考:缺电只是表象,制造才是真正的天花板

山自·2026年03月16日 19:08
AI 的未来,缺的从来不是电,而是造芯片的能力。而这场制造能力的竞赛,才刚刚开始。

当所有人都在讨论 AI 数据中心的电力焦虑时,半导体行业专家、SemiAnalysis 创始人 Dylan Patel 在最新播客中抛出了一个颠覆性观点:AI 算力扩张的核心瓶颈从来不是电力,而是先进半导体的制造能力。从 EUV 光刻机的产能桎梏,到 HBM 内存的资源争夺战,再到英伟达凭供应链布局筑起的护城河,AI 产业的竞争正从云端的算法创新,彻底下沉到物理世界的制造硬实力。2026 年英伟达 GTC 大会的芯片战略转向,更是印证了这一趋势 ——CPU 重回舞台中心,200 亿美元押注 Groq 推理芯片技术,背后都是对制造瓶颈的精准应对。AI 的未来,终究要受限于硅片的生产速度。

电力焦虑是伪命题?制造才是不可逾越的硬约束

在过去的 AI 算力讨论中,“缺电” 始终是高频词。动辄数万千瓦的 AI 数据中心电力需求,让人们默认电力供应是制约算力扩张的第一要素。但 Dylan Patel 在播客中直言,这是对 AI 产业瓶颈的根本性误判:电力是价格问题,而制造是可获得性问题,二者有着本质区别。

电力的短缺并非不可解。高 AI 回报率驱动下,资本愿意为算力支付昂贵的供电成本。如今头部科技企业早已跳出公共电网的限制,采用分布式发电、燃气轮机 + 储能备用系统,甚至是临时高成本供电方案来保障数据中心运行。英伟达数据中心业务 75% 的年营收增长,足以支撑企业为电力支付溢价 —— 只要能拿到芯片,电力总有解决办法。但先进半导体制造能力的缺失,是金钱无法在短期内填平的鸿沟。

Dylan Patel 强调,AI 算力的底层约束,最终落在了EUV 光刻机这类关键设备上。一台最先进的 ASML High-NA EUV 光刻机售价超过 3 亿美元,生产周期长达 18 个月以上,全球年产能仅有数十台。这类设备的制造涉及精密光学、高端材料、超精密机械等数十个尖端领域,并非单纯的资金投入就能快速扩产。更关键的是,EUV 光刻机的供应链高度集中,核心零部件的生产能力被少数企业垄断,即便到 2030 年,其产能缺口仍将是半导体行业的主要瓶颈。

除了光刻机,先进晶圆制造和封装技术的产能也同样紧张。2026 年的 CPU 市场正遭遇《Futurum Group》所称的 “安静的供应危机”,AMD、英特尔已向中国客户发出供应短缺预警,CPU 交付周期延长至 6 个月,价格涨幅超 10%。芯片分析师 Ben Bajarin 的一句话道破本质:“晶圆不会长在树上,我们不可能凭空多收获 10% 的硅片,整个行业都面临产能挤压。” 这种制造能力的短缺,并非某一家企业的问题,而是全球半导体产业的系统性瓶颈。

AI 产业的发展,终究要回归物理世界的基本规律。从逻辑芯片到存储芯片,从先进制程到封装测试,每一个环节的制造能力,都决定了算力扩张的速度。当算法创新的速度远超硬件制造的速度时,制造能力自然成为了 AI 算力的真正天花板。

HBM 引发的全球制造资源零和博弈

如果说 EUV 光刻机是 AI 制造瓶颈的 “地基问题”,那么高带宽内存(HBM) 就是当下最紧迫的 “承重墙危机”。Dylan Patel 在播客中预测,未来 1-2 年,全球将迎来一场 “巨大的内存危机”,而这场危机的本质,是 AI 对制造资源的虹吸效应,引发了一场零和博弈。

HBM 是 AI 芯片的核心组件,其高带宽、低功耗的特性完美适配 AI 大模型的训练和推理需求。随着 agentic AI(智能体 AI)的兴起,AI 对数据处理的需求呈指数级增长,HBM 的需求也随之暴增。但 HBM 的制造难度极高,良率偏低,产能扩张速度远跟不上需求增长。目前全球 HBM 产能主要集中在三星、SK 海力士、美光三家企业,而头部 AI 厂商为了保障算力供应,纷纷开启了 HBM 产能锁定模式。

英伟达就是这场产能争夺战的典型赢家。为了匹配其 GPU 的算力需求,英伟达提前与内存厂商签订了长期 HBM 供应协议,将大量产能收入囊中。这种 “头部锁定” 形成了正向循环:AI 厂商锁定产能→内存厂商将更多资源投向 HBM 生产→HBM 产能进一步向头部集中。但这一循环的背后,是对消费电子产业的资源挤压 —— 手机、PC 等消费电子所需的普通 DRAM、NAND 闪存产能,正被不断压缩。

Dylan Patel 指出,AI 的增长本质上是通过抢占其他行业的制造资源实现的。内存厂商出于利润考量,会优先将产能分配给单价更高、利润更丰厚的 HBM,而非消费电子内存。2025 年以来,消费电子行业已经出现了内存供应紧张的迹象,部分中低端手机、PC 产品因内存短缺被迫延迟发布。这种资源的重新分配,正在重塑全球半导体供应链的格局:AI 产业的繁荣,正以消费电子产业的产能牺牲为代价。

更值得警惕的是,这种资源虹吸效应正在向整个半导体制造环节蔓延。除了 HBM,AI 芯片所需的先进制程晶圆、特殊封装材料,都在与其他行业争夺有限的制造资源。当 AI 成为半导体产业最主要的需求来源时,整个行业的产能分配逻辑都将被改写,而这种改写,必然伴随着行业间的利益博弈和资源冲突。

不是技术,是提前锁定的制造产能

提到 AI 芯片,英伟达无疑是绕不开的名字。这家市值达 4.4 万亿美元的芯片巨头,占据了全球 AI GPU 市场的绝对主导地位。人们往往将其成功归因于技术优势 ——CUDA 生态的壁垒、GPU 的并行计算能力,但 Dylan Patel 在播客中揭开了英伟达真正的护城河:不是技术领先,而是对制造产能的提前锁定

半导体行业的竞争,遵循着 “先到先得” 的底层法则。英伟达深谙这一点,将现金流优先投入到供应链安全上,而非单纯的研发。早在 2023 年,英伟达就通过财报披露,与台积电签订了先进制程的长期产能协议,锁定了台积电 3nm、4nm 制程的大量产能,为其 GPU 和 CPU 的生产提供了保障。这种 “早鸟效应”,让英伟达在产能短缺的大背景下,始终能保持稳定的芯片供应。2026 年英伟达数据中心业务单季度营收超 620 亿美元,同比增长 75%,稳定的产能供应是其业绩增长的核心支撑。

相比之下,谷歌、亚马逊等科技巨头即便拥有自研芯片的技术能力,也难逃产能挤压的困境。谷歌的 TPU 虽然在 AI 训练和推理中表现出色,但其产能受制于台积电的晶圆供应,无法快速扩张;亚马逊的 Trainium 芯片同样面临产能不足的问题,难以满足自身云业务的算力需求。正如 Dylan Patel 所说,在制造能力成为瓶颈的时代,技术优势如果没有产能支撑,终究只是纸上谈兵

英伟达的产能布局,不仅局限于 GPU,更延伸到了整个 AI 算力生态。2021 年,英伟达发布首款数据中心 CPU Grace,2026 年第二代 CPU Vera 已进入量产阶段,并与 Meta 达成多年合作协议,实现了 Grace CPU 的大规模独立部署,计划 2027 年将 Vera CPU 落地 Meta 数据中心。为了保障 CPU 产能,英伟达同样提前锁定了相关制造资源,其 “稳健的供应链” 让其在 CPU 市场供应短缺的情况下,仍能实现 “零交付延迟”。

除了锁定自有芯片的产能,英伟达还通过开放生态,将更多制造资源纳入自己的体系。2025 年,英伟达开放 NVLink 网络技术的第三方授权,与英特尔、高通、Arm 等企业达成合作,让第三方 CPU 能更好地与英伟达 GPU 集成。同时,英伟达还支持 RISC-V 开放指令集,与 SiFive 达成协议,让 RISC-V 芯片能通过 NVLink 与英伟达 GPU 连接。这种 “平台无关” 的战略,本质上是通过生态整合,最大化利用全球有限的制造资源,进一步巩固自己的算力优势。

2025 年圣诞节前,英伟达斥资 200 亿美元从 Groq 获得芯片技术授权,并挖来其 CEO Jonathan Ross(谷歌初代 TPU 开发者),更是其应对制造瓶颈、完善算力生态的关键一步。Groq 的 LPU(语言处理单元)专为 AI 推理设计,采用片上 SRAM 内存,速度远超传统 GPU,且能与英伟达 GPU 形成互补。英伟达收购其技术,并非单纯的技术升级,而是通过整合专用芯片技术,提升现有算力的利用效率,在制造产能有限的情况下,实现算力的 “内生增长”。

正如 Jensen Huang 在财报电话会议中所说,英伟达对 Groq 的布局,与六年前收购 Mellanox 一脉相承 —— 通过整合细分领域的核心技术,延伸自己的架构,将制造资源的价值发挥到极致。2026 财年第四季度,英伟达网络业务单季度营收达 110 亿美元,与 AMD 整体营收相当,这正是 Mellanox 技术整合的成果。而 Groq 技术的加入,将让英伟达在 AI 推理市场占据更有利的位置,在制造产能有限的情况下,通过技术整合实现算力效率的提升。

CPU 回归:AI 算力生态的制造瓶颈新体现

2026 年英伟达 GTC 大会的一大看点,是CPU 的回归。在 GPU 称霸 AI 算力市场多年后,英伟达宣布将推出针对 agentic AI 优化的 CPU,甚至计划展示纯 CPU 机架。这一战略转向,看似是算力生态的完善,实则是 AI 制造瓶颈的又一重要体现。

agentic AI 的兴起,让 AI 算力的需求结构发生了根本性变化。与传统的问答式 Chatbot 不同,agentic AI 是任务导向的智能体,需要协调多个智能体协同工作,移动大量数据,进行复杂的逻辑调度。这一过程不仅需要 GPU 的并行计算能力,更需要 CPU 的通用计算能力和串行处理能力 ——CPU 成为了 AI 工作流的 “调度中心”,负责协调 GPU、加速器等硬件,确保整个算力系统的高效运行。

英伟达 AI 基础设施主管 Dion Harris 直言:“在 AI 和 agentic 工作流的扩张中,CPU 正成为新的瓶颈。” 而 CPU 的供应短缺,正是制造能力不足的直接体现。目前全球数据中心 CPU 市场由英特尔(60%)和 AMD(24.3%)主导,英伟达仅占 6.2%,但随着 agentic AI 的需求激增,CPU 的市场规模正快速扩大,美银预测,2025 年至 2030 年,CPU 市场规模将从 270 亿美元增长至 600 亿美元,翻一番还多。

面对 CPU 的供应瓶颈,英伟达的应对策略依然是 “定制化 + 产能锁定”。与英特尔、AMD 的通用型 CPU 不同,英伟达的 Grace 和 Vera CPU 专为 AI 工作流设计,放弃了核心数量的比拼(Grace CPU 为 72 核,远低于英特尔、AMD 的 128 核),转而提升单线程性能,确保 GPU 这一 “昂贵资源不会闲置等待”。这种定制化设计,让英伟达 CPU 能更好地匹配 GPU 的算力需求,提升整个算力系统的效率,在制造产能有限的情况下,实现算力利用效率的最大化。

同时,英伟达的 CPU 基于 Arm 架构,而非英特尔、AMD 的 x86 架构。Arm 架构的低功耗特性更适合数据中心场景,且制造工艺更灵活,能更好地利用现有制造资源。英伟达选择 Arm 架构,也是对制造瓶颈的适应 —— 在 x86 架构产能紧张的情况下,通过 Arm 架构实现 CPU 产能的快速扩张。

CPU 的回归,也反映了 AI 算力生态的复杂化。过去,AI 算力的核心是 GPU,而现在,AI 算力需要 GPU、CPU、加速器、网络芯片等多种硬件的协同工作。每一种硬件的制造能力,都可能成为算力扩张的瓶颈。英伟达布局 CPU,正是为了打通算力生态的各个环节,消除供应链中的短板,在制造能力有限的大背景下,构建一个高效、完整的算力生态。

从算法创新到制造能力的全链条竞争

Dylan Patel 在播客中总结道:AI 产业正在从虚拟概念向实体制造回归,最终决定行业上限的,将是物理世界的产能约束,而非数字世界的算法创新。这一判断,不仅揭示了当下 AI 算力的瓶颈,更指明了未来 AI 产业的竞争方向 —— 从单一的技术竞争,转向涵盖制造、供应链、生态的全链条竞争。

在这场竞争中,制造能力将成为最核心的竞争力。掌握 EUV 光刻机、先进晶圆制造、高端封装等核心制造技术的企业,将占据产业链的顶端;能提前锁定制造产能、构建稳定供应链的企业,将在算力竞争中占据主动。正如英伟达的成功所证明的,在制造能力成为瓶颈的时代,供应链布局的重要性,甚至超过了技术创新本身

同时,AI 产业的资源争夺战还将继续升级。HBM 对消费电子内存的挤压,只是一个开始。未来,AI 还将与汽车、工业、航空航天等行业争夺半导体制造资源,全球半导体供应链的格局将被不断改写。在这场零和博弈中,只有那些能为半导体产业带来更高利润、更大需求的行业,才能获得更多的制造资源。而 AI,无疑是当下最具竞争力的那个。

电力问题虽然不再是核心瓶颈,但仍将是 AI 产业的重要考量。随着算力的不断扩张,AI 数据中心的电力需求仍将持续增长,资本驱动的非常规供电模式将成为主流。但与制造能力不同,电力问题的解决,更多依赖于企业的资金实力和运营能力,而非技术壁垒。在制造能力成为核心瓶颈的情况下,电力问题将成为筛选企业的 “门槛”,而非决定行业上限的 “天花板”。

对于中国 AI 产业而言,这场制造瓶颈带来的挑战更为严峻。目前,中国在 EUV 光刻机、先进制程晶圆制造、高端 HBM 内存等核心领域,仍与国际先进水平存在较大差距,制造能力的短缺,成为了中国 AI 算力扩张的最大制约。要突破这一瓶颈,需要从底层技术入手,加大对半导体制造设备、材料、工艺的研发投入,构建自主可控的半导体制造供应链。同时,也需要借鉴英伟达的经验,通过生态整合和产能布局,最大化利用现有制造资源,提升算力利用效率。

2026 年的 AI 产业,正站在一个关键的转折点上。算法创新的红利仍在释放,但制造能力的约束已经显现。当人们不再讨论 “下一个大模型是什么”,而是开始关注 “下一片硅片何时能生产出来” 时,AI 产业才算真正走向成熟。毕竟,再先进的算法,终究要运行在实实在在的芯片上;再宏大的 AI 愿景,终究要受限于物理世界的制造能力。

AI 的未来,缺的从来不是电,而是造芯片的能力。而这场制造能力的竞赛,才刚刚开始。

本文来自微信公众号“山自”,作者:Rayking629,36氪经授权发布。

+1
19

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

殊途之争!

1小时前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业