高通新发AI推理芯片,瞄准每年3000亿美元市场

电厂·2025年10月29日 19:11
从2026年开始,高通将与英伟达、谷歌、华为等企业在AI推理的赛场上同台竞技。

北京时间10月27日晚间,高通发布了AI200及AI250两款AI数据中心芯片,以及基于两款芯片的加速卡和机架级解决方案;两款芯片计划分别于2026和2027年投入商用。

这也是继高通在2019年发布Cloud AI 100、2023年发布Cloud AI 100 Ultra后,又一次推出数据中心AI推理新品。

消息发布当天,高通股价急剧拉升,盘中一度飙升22%达205美元,这也是高通自2024年6月下旬以来的最高股价,最终闭盘收于每股188美元,涨幅为11.09%。包括摩根大通、美银证券、TD Cowen等多家投行更新了对高通的评级并维持买入,最高买入价格看至200美元。

同一天,高通还宣布将与沙特阿拉伯AI企业“HUMAIN”合作,推进AI200和 AI250落地应用。

随着AI应用需求暴增,市场对AI推理芯片需求水涨船高。今年英伟达、谷歌、华为均已公布AI推理芯片新品。面向AI推理的蓝海市场,各家比拼的将不仅是技术能力,更是跑马圈地的速度。

对高通而言,此次对AI推理的发力不仅是涉足热门方向,也是推进其数据中心业务布局的最新一步。近年,高通曾多次公开展露其对数据中心市场的兴趣,除了AI推理芯片,高通同样在数据中心CPU等方向展开了产品布局。

在官宣AI200及AI250发布的新闻稿最后,高通也写道:高通致力于制定一个按年推进节奏的数据中心路线图,专注于提供行业领先的AI推理性能、能源效率及TCO(总拥有成本)。

跻身2025数据中心推理芯片竞速赛道

“AI推理”指已经过训练的模型经过部署后,对新输入的数据进行逻辑推导与预测。与之对应的则是“AI训练”,指模型通过分析庞大的数据集、学习其中的模式与关系。

在实际应用中AI训练与推理芯片之间并没有严格、明确的划分,但相较训练场景要求芯片具备绝对强大的并行计算能力,推理场景更强调芯片的能效、时延、成本等综合性能。本次发布的高通新品同样着力于针对总拥有成本 (TCO) 和性能进行平衡设计。

据官方信息,AI200及AI250基于高通NPU技术,其中基于AI200的机架级AI推理解决方案支持每张卡768GB的LPDDR(低功耗双倍数据速率内存),以提高内存容量和降低成本;而AI250 解决方案将首次使用基于近内存计算的创新内存架构,有效内存带宽大幅提升且功耗更低。

此外两种机架解决方案均采用直接液冷散热方案,采用PCIe进行纵向扩展,采用以太网进行横向扩展,采用机密计算以确保安全的AI工作负载,单机架功耗为160kW。

高通新品于此时亮相是想踩中AI推理市场爆发的宝贵时间窗口。

今年以来,AI推理市场动态频出。比如9月份,AI推理创企Groq官宣已达成7.5亿美元的新融资,并称接下来计划建成“全球最大推理数据中心”。

同样在9月份,OpenAI已与老牌云计算巨头甲骨文达成合作的消息在市场中广为流传,据称OpenAI已敲定将在5年内从甲骨文采购逾3000亿美元的推理算力——这也是有史以来经披露的最大云计算合同。消息一出,甲骨文股价一度急剧拉升,单日最大涨幅超36%。

而据巴克莱银行旗下研究机构预测,到2026年,AI推理计算需求将占通用人工智能总计算需求的70%以上,推理计算的需求甚至可以超过训练计算需求、达到后者的4.5倍;而现有芯片资源可能难以满足这一需求,需增加当前预测4倍的芯片资本支出,总额或将接近3000亿美元。

面向巨大的需求缺口,包括高通在内的许多厂商正在摩拳擦掌。

今年4月,谷歌于Google Cloud Next 25大会上发布了TPU芯片“Ironwood”,号称其为首个专门为大规模AI推理而设计的TPU加速器。

9月,英伟达发布了针对AI视频生成和软件开发等大规模上下文处理任务的“RubinCPX” GPU。后者基于Rubin架构打造,能够在计算密集型的上下文推理阶段实现突破性性能表现,计划于2026年底上市。

同样于9月举办的华为全联接大会上,昇腾多系列新品亮相,其中“950PR”将于2026年第一季度对外推出、着力提升推理Prefill(AI推理过程中的关键阶段)性能。

换句话说,从2026年开始,高通将与英伟达、谷歌、华为等企业在AI推理的赛场上同台竞技。以巴克莱所预测的3000亿美元资本支出推算,即便占据到1%的市场份额,对高通而言也是不容小觑的营收增长。

“重返”数据中心市场,发掘业绩新引擎

高通并未说明AI200和AI250所采用的制程及基本架构方案,但考虑到AI100并非GPU而是ASIC,新款产品有可能也采用了ASIC的基础架构。ASIC (专用集成电路)是一种为特定任务设计的全定制芯片,相较GPU,在能效方面表现更优。

尽管已经在6年内推出多款AI推理芯片,高通AI推理业务贡献的营收几乎可以忽略不计。

7月底公布、截至6月30日的2025第三财季业绩报告显示,高通QCT半导体业务该季营收为89.93亿美元,主要来自手机芯片、汽车芯片、物联网业务;QTL技术授权板块营收为13.18亿美元。

过往多年,高通曾多番尝试开发数据中心产品,但成效甚微。2018年,高通服务器芯片负责人Anand Chandrasekher官宣离职,并传出整个服务器部门裁员50%的消息,被市场解读为高通已放弃这一业务方向。

直到2024年,Amon于Computex 2024展会接受采访时确认高通将重返数据中心市场,并从2025年开始推进产品动作。

2025年5月,高通表示计划采用英伟达技术,来定制生产数据中心CPU,用以搭配和连接英伟达GPU使用、助力英伟达GPU实现更加快速的通信。

6月,高通宣布其间接全资子公司Aqua Acquisition Sub LLC将以24亿美元收购半导体IP企业Alphawave,后者的优势在于拥有高端接口IP,能够增强高通在数据中心市场的竞争力。此桩收购预计在2026年第一季度完成。

此外,高通近日宣布与沙特阿拉伯的 HUMAIN 合作,HUMAIN 正在开发阿拉伯语多模态大语言模型(ALLaM),并计划将其与高通的边缘设备生态深度集成,形成从芯片到应用的完整技术闭环。

而在与沙特阿拉伯公司HUMAIN的合作中,高通将为该项目提供“全球人工智能推理服务”,使之成为世界上首个完全优化的边缘到云混合人工智能(项目),使沙特阿拉伯成为全球人工智能中心。

左-HUMAIN CEO Tareq Amin;右-高通CEO Cristiano Amon

尽管布局节奏紧凑,数据中心板块为高通贡献营收仍需时间。

7月底,2025第三财季业绩说明会,高通总裁兼CEO Cristiano Amon曾在电话会中讲到,公司正积极拓展AI芯片布局,已经与一家超大规模云端服务供应商展开深入洽谈,最快将于2028会计年度开始贡献数据中心相关营收。

除了AI,高通也在极力推进产品在智慧驾驶、物联网等多元化场景的落地。

考虑到苹果与高通的基带购买协议将于2026年末到期,而苹果是高通营收占比约20%的单一大客户,“能否在苹果‘撤出’后培育新的营收支柱?”将是市场亟待高通解答的命题。

本文来自微信公众号“电厂”,作者:董温淑,36氪经授权发布。

+1
7

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

快手可灵AI赋能影视创作,推动人机协同与高质量发展。

2小时前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业