AI并非“泡沫”，而是产业趋势

半导体产业纵横·2026年01月26日 20:24

生成式人工智能创造的不是泡沫，而是一种趋势。

云服务商的资本支出（Capex）已经达到了无法再用“显著增长”来形容的程度。排名前八的云服务商的投资额将从2021年的1451亿美元增长到2026年的6020亿美元，增长超过四倍。这种增长速度简直令人难以置信。

即便如此，市场中仍不乏对这一主流避险配置的质疑声：“又是一场泡沫”“迟早会破裂” 之类的论调甚嚣尘上。但此类说法毫无事实依据，并非单纯的主观臆断，本质上更是对现实的刻意回避。究其根源，当下的投资规模扩张，并非由经济周期、市场情绪或泡沫化趋势驱动，而是源于物理定律的底层支撑 —— 海量的算力需求。

核心关键在于，生成式人工智能的计算负载绝非 “搜索功能的延伸”，而是属于更高维度的 “学习与推理” 范畴。正如后文将详细阐释的，谷歌搜索的算力架构以 CPU 为核心，而 ChatGPT 的推理环节则以 GPU 为核心展开大规模矩阵运算，其所需的计算量更是前者的 1 万至 10 万倍。

换言之，云服务厂商的算力投入并非出于主动选择，而是源于行业竞争的必然要求 —— 若不跟进布局，便会在赛道中陷入落后。对于当下的云平台而言，无法支撑生成式人工智能的运行，就等同于丧失核心价值。也正因如此，这场算力投资的浪潮不仅不会止步，更具备了不可逆的行业必然性。

云投资正以惊人的速度增长

图1呈现了全球头部八大云服务商的资本投入趋势，这八家企业分别为亚马逊（AWS）、微软（Azure）、谷歌云（Google Cloud）、Meta（原 Facebook）、甲骨文（OCI）、阿里云、腾讯云与字节跳动。

图1：排名前 8 的云服务提供商的资本投资情况。来源：根据 TrendForce 数据制作

正如本文开篇所述，这八家企业的资本开支规模将从 2021 年的 1451 亿美元攀升至 2026 年的 6020 亿美元，增幅超四倍。这样的资本投入已非单纯的 “增长”，而是迈入了加速扩张的阶段。

尽管 2022-2023 年期间其资本开支出现短暂回落，但这绝非可以放松警惕的信号。从 2024 年开启的回升态势能够清晰看出，头部云服务商的布局已再度 “加码升级”，而这一投资拐点恰好出现在 OpenAI 推出 ChatGPT 之后。

换言之，这些企业布局生成式人工智能相关投资，并非只因它是被追捧的 “下一个金矿”，更在于其作为行业游戏规则改变者，彻底重构了云计算基础设施的底层需求。

驱动云计算领域投资扩张的因素多元且复杂：数据中心建设、土地储备、电力配套、冷却技术、网络架构、存储能力、安全体系…… 但贯穿所有维度的核心逻辑，始终是爆发式增长的计算需求。算力需求的指数级攀升，直接推动了全产业链各环节成本的同步上涨，本质而言，云计算行业的这场投资增长，就是一场对海量算力资源的争夺战。

当下市场对算力的极致需求，早已无法用传统网络与搜索服务的扩容逻辑来解释。生成式人工智能对云计算的要求，并非简单的 “再添一个胃”，而是倒逼整个行业重构算力 “消化系统”，打造出足以承载海量需求的超大规模算力底座。

Google搜索和ChatGPT相似但不相同

在此，需要纠正一个极具误导性的核心认知偏差：将谷歌搜索与生成式人工智能简单等同为 “用户提出问题、平台给出答案” 的同类工具。

如图2所示，二者的用户操作表层逻辑看似高度相似，交互形式几乎别无二致。但现实是，坐拥全球超 30 亿用户的谷歌搜索，正面临用户向 ChatGPT 等生成式人工智能产品迁移的趋势，而后者的用户规模也已突破 10 亿量级，持续快速扩张。

图2：谷歌搜索与 ChatGPT 5 用户提问行为示例。

自去年开始使用 ChatGPT 付费版后，个人便极少再使用谷歌搜索，核心原因正是前者的使用体验更为高效便捷。而这一体验上的差异，正被全球越来越多的用户感知，也直接推动了生成式人工智能用户规模的持续攀升。

更为关键的是，即便用户提出的是完全相同的问题，谷歌搜索与 ChatGPT 等生成式人工智能在云端完成的底层处理逻辑，却有着本质区别。

这一核心差异可通过图3清晰呈现：谷歌搜索依托以 CPU 为核心的索引式检索架构，而 ChatGPT 的推理过程，则是以 GPU 为核心展开的大规模矩阵运算。从算力消耗来看，谷歌搜索单轮处理的浮点运算量（FLOPs）约为 10 亿至 100 亿次，ChatGPT 的推理运算量则达到 10 万亿至 1000 万亿次，二者的算力需求相差 1 万至 10 万倍。

图3：谷歌搜索与 ChatGPT 5 算力及处理成本对比。

不仅如此，ChatGPT 单次处理所需的服务器耗时，是谷歌搜索的 10-100 倍；能源消耗与碳排放，均为谷歌搜索的 10-200 倍；综合成本更是达到谷歌搜索的 50-2000 倍，算力与资源消耗的差距呈指数级拉大。

简言之，生成式人工智能绝非所谓的 “高端版搜索”，其背后是完全不同的计算逻辑，且承载着远为繁重的算力负载。正因如此，生成式人工智能的规模化落地，意味着云端处理的计算单元必须向超大规模升级 —— 这并非依靠价格谈判、市场推广就能解决的商业问题，而是从物理底层提出的硬性要求：既需要 AI 半导体（如 GPU）、高带宽内存（HBM）等核心硬件支撑，也离不开电力、冷却系统、网络架构的配套升级，甚至对底层的布线、封装技术都提出了全新要求。

市场中常有一种论调：“技术效率终将提升，算力需求自然会下降。” 不可否认，AI 领域的技术效率确在持续优化，但算力需求的下降速度，早已跟不上生成式人工智能的应用边界拓展、使用频次提升与性能迭代速度。即便单轮计算的算力消耗因效率提升而降低，若社会层面的生成式人工智能使用频次增长十倍，整体算力需求仍会同步攀升。更何况，随着输入输出的文本长度持续增加，图像、视频类推理场景的落地应用，算力需求还将迎来新一轮的爆发式增长。

换言之，云计算行业的持续高投入，并非源于市场的 “盲目热情” 或 “投资过热”，而是算力需求发生结构性变革的必然结果。对头部云厂商而言，一旦停止算力布局，就意味着直接确认市场竞争的落后态势。推动其持续加码投资的，从来不是敢于冒险的勇气，而是源于行业竞争的深层恐惧 —— 对错失算力浪潮、陷入竞争被动的恐惧，才是这场算力投资竞赛的核心驱动力。

人工智能与以往的泡沫经济有着本质区别

由此引出核心问题：当前这场围绕生成式AI的云计算投资热潮，真的是一场泡沫吗？

答案很明确：将当前现象简单斥为“泡沫”是完全错误的，核心原因在于，过去的泡沫与当前热潮的“需求性质”存在本质差异。可通过定量分析清晰佐证这一点。

图4呈现了全球半导体出货量及其同比增速趋势，清晰勾勒出Windows 95泡沫、IT泡沫与内存泡沫的完整轨迹。从数据可见，过往的各类泡沫均呈现“快速增长后骤降”的特征——这背后的核心逻辑是，当时的需求严重依赖“暂时性增长”与“库存调整”，缺乏持续的底层支撑。

图4：全球半导体出货量及较上年增长率。来源：作者根据 WSTS 数据制作

图5A通过对比表形式，呈现了Windows 95泡沫、IT泡沫、内存泡沫及当前AI热潮（暂统称“热潮”）从第N年到第N+3年的同比增速变化；图5B则进一步量化了这一波动：Windows 95泡沫期间增速达41.7%，随后骤降至-8.6%；IT泡沫增速36.8%，后续跌至-32.0%；内存泡沫增速13.4%，继而滑落至-12.0%。这种“繁荣后迅速萧条”的剧烈波动，正是过往泡沫的典型特征。

来源：作者根据WSTS数据制作

与之形成鲜明对比的是生成式AI相关需求的增速表现：2023年同比增速为-8.1%，2024年回升至19.7%，2025年预计达22.5%——这意味着2024年及2026年将持续保持正增长。正如众多行业专家论证的那样，直至2030年，生成式AI相关需求大概率不会出现负增长。

简而言之，当下正在发生的并非“泡沫”，而是一场单一、庞大且具备强大惯性的“结构性趋势”。

此次趋势与过往泡沫的核心差异，在于需求来源的本质不同：过往需求多源于个人电脑普及、智能手机更新换代等“替换购买浪潮”，属于阶段性的消费端需求爆发；而当前的需求核心，是计算基础设施的刚性升级需求。更关键的是，生成式AI并非“销售产品即完成闭环”的传统业态——它将渗透到社会经济的方方面面，融入各类服务场景，整合至搜索与办公系统，成为企业生产力提升的核心基石。

由于这一核心基石建立在极其庞大的计算量之上，云计算投资便不再是“经济繁荣期的可选配置”，而是成为支撑社会高效运转的“基础结构”。从这个意义上讲，那些将生成式AI相关投资斥为“泡沫”的观点，本质上是对这一结构性变革的逃避。这种“基础设施级的算力需求爆发”，是过往教科书式的泡沫案例中从未出现过的全新形态。

到2030年，投资将持续增长

基于这一逻辑，2030年之前，相关投资的持续增长将是大概率事件。那么，头部八大云服务厂商的资本支出最终将增长至何种规模？图6呈现了这八大厂商数据中心投资的预测情况，并划分了悲观、基准、乐观三种情景。

图6：八大云服务提供商的数据中心投资预测。来源：TrendForce 新闻稿及作者预测

值得注意的是，即便在最悲观的情景下，投资规模仍将保持持续增长——核心原因在于，生成式AI相关的算力布局已成为行业“竞争入场券”，而非可选择性的“奢侈品”。

这正是生成式AI时代云计算竞争的残酷之处：对云服务厂商而言，停止投资并不会带来“利润率提升”，反而会直接导致“AI性能落后、客户流失、平台价值崩塌”。换句话说，放缓或停止算力相关投资，并非理性的商业决策，更像是对市场竞争的主动认输。

事实上，相关投资的退出成本极高：GPU与高带宽内存（HBM）等核心硬件价格昂贵，电力供应、散热技术的升级需要长期投入，且整个产业链的供应链体系错综复杂。即便面临诸多挑战，投资仍在持续推进——因为市场已形成明确的竞争格局：“缺乏足够算力支撑的企业，将直接被市场淘汰”，甚至来不及进入投资回报率（ROI）的考量阶段。

归根结底，当前头部云厂商的持续投资，已不再是“购买未来的不确定性”，而是“守护当前市场地位”的刚性需求。只要这一“算力决定竞争力”的市场结构不发生根本改变，到2030年投资持续增长的趋势，似乎也成为了必然结果。

数据中心逻辑电路市场正在快速扩张

云计算投资的增加将直接推动半导体市场的扩张。特别是数据中心逻辑芯片，未来市场必将迎来增长。

图7显示了数据中心逻辑芯片市场（2024 年至 2030 年）的预测。GPU 市场预计将从 1000 亿美元增长一倍以上至 2300 亿美元，而 AI ASIC 市场预计将增长九倍以上，从 90 亿美元增长至 840 亿美元。

图7：数据中心逻辑预测（2024 → 2030 年）。来源：作者根据 Yole Group 的预测数据制作

值得注意的是，生成式人工智能的发展不会止步于英伟达的GPU。超大规模数据中心运营商不愿依赖单一供应商，因为这意味着他们将失去价格谈判能力。他们倾向于采用专用于特定应用的人工智能ASIC芯片，以“提升性能而非降低性能，并降低成本”。其中许多芯片由博通公司设计。

换句话说，人工智能半导体市场不会是“GPU独占的黄金时代”，而是会转型为“GPU仍将占据主导地位，而AI ASIC（博通）将发展壮大，成为市场两大支柱”的市场格局。即使GPU继续扮演主导角色，AI ASIC也必将增长。这就是数据中心逻辑市场的现实。

尽管内存供应短缺，但其价格仍在持续飙升

图 8显示了生成式 AI 将最积极消耗内存的领域。DRAM市场预计将从 2024 年的 970 亿美元翻一番，达到 1940 亿美元，其中 HBM 市场将达到 980 亿美元。

图8：存储器市场预测（2024 → 2030 年）来源：作者根据 Yole Group 的预测数据制作

这意味着到2030年，HBM将占据DRAM市场的一半份额。这不仅是市场扩张，更是内存行业主导地位的转变。

此外，图 9显示，DRAM 和 NAND 的现货价格预计将在 2023 年至 2026 年间上涨。以往“价格上涨，产量增加，价格趋于稳定”的常识已不再适用。提高 HBM 的产量并非易事，提高良率也面临挑战，封装也是一个重要因素。设备和材料方面都存在诸多限制，供应难以满足需求。

图9：DRAM 和 NAND 现货价格上涨。来源：作者根据 TrendForce 数据制作

此外，内存制造商正将重心转向人工智能服务器内存，因为这类内存利润更高。这将减少用于个人电脑和智能手机的通用内存供应，并推高价格。换句话说，人工智能的普及将导致内存市场长期短缺和价格高企。

简而言之，内存短缺问题将持续存在，价格也将持续上涨。这并非“特殊且暂时的现象”，而可能成为人工智能时代的新常态。

台积电的主要盈利产品从N5转向N3

最能有效利用这股“人工智能浪潮”获利的半导体制造商很可能是台积电。图 10显示了台积电按制程节点划分的销售额趋势，直观地展现了其主要盈利产品从 N7 到 N5，再到 N3 的转变过程。

图 10：台积电按节点划分的季度销售额。来源：作者根据台积电历史运营数据制作

图11显示了各节点晶圆投入量的变化趋势。从图中可以看出，未来只有 N5、N3 和 N2 节点的投入量会增长，而其他节点的投入量则呈下降趋势。这并非一句空洞的“前沿技术很重要”，而是事实：只有前沿技术的投入量在增长。换句话说，台积电已经转型为一家完全依靠前沿技术盈利的晶圆代工厂。

图11：台积电各节点季度晶圆投入量（2025年第四季度预测）。来源：Claus Aasholm，以及作者估算

生成式人工智能需要海量的计算，这需要大量的高性能人工智能半导体，而这又需要庞大的先进工艺产能。台积电是唯一能够满足这一需求的公司。这种简单的因果关系正是半导体行业发展的驱动力。

N3的主导地位从苹果转移到英伟达和博通

此前，苹果一直是台积电最大的客户，推动着台积电尖端工艺的发展。然而，这种情况正在发生改变。

图12和图13显示了台积电按公司划分的 N3 晶圆投入预测。数据显示，英伟达和博通的投入量将在 2025 年至 2026 年间增长，超过苹果。

图 12：台积电对各公司 3nm 晶圆投入量的预测（每月 1000 片晶圆）。来源：TrendForce

图 13：台积电对各公司 3nm 晶圆投入量的预测。来源：TrendForce

这不仅仅关乎客户排名。从尖端半导体的发展史来看，这标志着一个时代的转变：从智能手机处理器引领潮流的时代，过渡到人工智能半导体主导尖端技术的时代。

苹果利用尖端技术提升用户体验。英伟达和博通则利用尖端技术称霸云计算领域。二者的区别显而易见。人工智能半导体并非“卖出去就完事”，它们将作为“持续运行的基础设施”而广泛应用。换句话说，对尖端工艺的需求具有极强的粘性。

N3 将成为台积电的主要盈利产品，这不仅反映了台积电的实力，也反映了人工智能如何重塑了尖端产品的需求结构。

同样的现象也可能出现在台积电的N2芯片上，台积电将于2025年第四季度开始量产N2芯片。苹果或许会率先使用N2芯片，但不出六个月，英伟达和博通很可能就会占据主导地位。换句话说，苹果将成为打造最先进生产线的先驱，随后英伟达和博通将成为市场主导者，为台积电的利润做出巨大贡献。

真正的瓶颈在于CoWoS

然而，人工智能半导体的发展存在许多瓶颈，其中最严重的是 2.5D 封装（如 CoWoS）的产能。

图 14显示了 2.5D 封装的产能趋势。人工智能半导体无法通过先进工艺节点制造的“单芯片”实现，必须与 HBM 结合才能形成系统。CoWoS 对此至关重要，只要这种产能不足，人工智能半导体的供应就将持续短缺。

图 14：2.5D 封装容量趋势。来源：TrendForce

换句话说，当前人工智能市场的制约因素最终将归结为一点：“CoWoS 不足”。

这里有一个与直觉相悖的预测：一旦CoWoS的限制解除，投资会趋于平静吗？答案恰恰相反：投资将会增加。

这是因为人工智能半导体目前供应受限，即使云服务提供商想要购买也无力承担。一旦供应限制解除，此前被抑制的投资将会爆发。云服务提供商将抓住机会大量采购他们一直等待的半导体，建设人工智能数据中心，进一步加剧竞争。投资非但不会“趋于平静”，反而极有可能“进入下一阶段”。

生成式人工智能创造的不是泡沫，而是一种趋势。这正在半导体行业引发一场“结构性变革”。而且，这场变革是不可逆转的。

*声明：本文系原作者创作。文章内容系其个人观点，我方转载仅为分享与讨论，不代表我方赞成或认同，如有异议，请联系后台。

本文来自微信公众号 “半导体产业纵横”（ID：ICViews），作者：汤之上隆，36氪经授权发布。

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。