GPU汹涌,非GPU洗牌
芯东西12日17日报道,今天,上海GPU龙头沐曦股份在上交所科创板敲钟,开盘价为700.00元/股,截至午间休市股价大涨687.79%,总市值达到3298.82亿元,将全球算力产业的竞争推向全新高度。
近一段时间以来,全球算力产业都处于重磅事件密集爆发期。
海外,非GPU赛道的谷歌TPU狂揽千亿级订单,在GPU垄断的算力市场撕开缺口,上周博通CEO爆料Anthropic向博通下总计210亿美元(折合人民币约1486亿元)订单,还叠加Meta等科技巨头的采购意向;GPU层面,因害怕失去中国市场,美国批准英伟达H200 AI芯片对华出售。
反观国内,算力产业热度同样持续攀升,北京AI芯片明星企业清微智能拿下超20亿元大额融资,背后是业界少见的投资阵容。此外还有国内AI芯片创企密集披露并购、上市计划,本土算力生态加速成型。
上述海内外算力产业的密集动向,共同指向一个不可逆的行业变革:全球算力市场长期由英伟达GPU垄断的市场格局正在松动。
在大模型发展初期,市场对通用算力的强需求让英伟达GPU迅速占据绝对主导地位,几乎形成“无GPU不训练”的行业局面。
如今,一方面谷歌TPU、亚马逊Trainium3等非GPU芯片在一些场景对GPU实现规模化替代,国内市场2025年上半年非GPU算力卡占比已达30%,寒武纪MLU、昆仑芯ASIC、清微智能可重构芯片(RPU)等产品已形成差异化优势。
另一方面在投资市场,英特尔被传计划以16亿美元(约合人民币112.9亿元)(含债务)收购非GPU路线AI芯片独角兽SambaNova,挽救自己在AI时代落下的竞争力,还有非GPU路线独角兽Groq两年间拿下超30亿美元(折合人民币约213亿元)融资。
▲海外非GPU路线企业最新动向汇总
可以看到,非GPU芯片势力崛起已势不可挡。
在此背景下,全球算力产业下一步将往哪走?非GPU路线能有多大市场空间?未来会百花齐放还是一支独大?非GPU赛道哪条路线有望最先冲出重围?我们试图通过拆解全球算力格局及国内几家头部企业的技术路线,找到这些问题的答案。
01 全球算力产业的下一程,将面临路径分化
从需求端、底层技术、全球算力生态构建的三个核心维度来看,全球算力产业格局变革具有一定的必要性及急迫性。
首先在需求端,今年被称作大模型落地元年,推理场景算力需求增加,单纯堆砌GPU的粗放模式已经难以适配当前大模型规模化落地需求,这正倒逼企业寻找更高效的算力解决方案。
同时,AI深入千行百业使得行业多元、细分需求接连出现,如AI视频生成、AI医疗诊断、工业数字孪生等场景对算力能效比、适配性的要求各不相同。叠加企业主动分散供应链风险、规避单一厂商依赖,非GPU算力产品迎来关键的市场切入契机。
其次是技术端,传统冯·诺依曼架构的存算分离矛盾凸显,其设计逻辑已难以突破硬件性能的物理边界,需要架构革新突破瓶颈。
非GPU路线实现多点突破,如谷歌TPU专用架构、国产可重构芯片的动态适配能力等,已经在特定场景下形成性能与成本优势。
最后是生态层面,打破单一架构生态垄断已经成为行业共识,国产开源框架正通过兼容适配、自主优化,快速构建本土生态协同体系。
因此全球算力产业正在朝着打破单一架构,不同路径百花齐放的局面发展。
就在近日新华社发布的一则报道提到:“在AI芯片领域,北京已经形成了自主可控的“芯片矩阵”,昆仑芯、寒武纪、摩尔线程、清微智能……一系列国产明星产品性能领先。”
这之中既有GPU路线的摩尔线程,还有非GPU中ASIC路线的昆仑芯、寒武纪,以及非GPU中可重构计算的清微智能。四家企业分属不同技术路线的发展态势,恰恰印证了北京在AI芯片赛道多元布局、保障供应链安全的远见。
在这些明显的行业趋势背后,我们还能捕捉到驱动行业发展的几大核心趋势:
第一是GPU与非GPU两大技术路线正并行发展。GPU路线凭借成熟的生态兼容性和通用计算能力,在需要兼顾图形渲染、科学计算与AI训练的场景中将持续发挥优势;非GPU路线,则随着大模型的快速演进,在AI推理领域率先展现出强劲增长潜力。
其中可重构架构凭借通用计算能力,已经在AI主流场景中占据重要地位。
第二,全球算力产业的重心不再唯硬件性能论,而是朝着软件、模型、场景适配等的全栈布局发展,通过协同创新让算力资源被充分释放出来,避免算力资源限制,并针对不同硬件架构对模型进行压缩、量化、适配。
这一趋势本质上是要实现算力效能最大化。
第三是中国厂商的话语权正在提升。在算力领域长期由欧美厂商主导的市场格局下,中国企业在非GPU赛道展现出不容小觑的竞争力。
综上,全球算力产业的下一程必然会走向路径分化。
02 非GPU路线市场稳步上升,国内渗透率高于全球
全球知名市研机构Gartner预计,到2027年,针对AI推理应用的算力需求将导致AI加速器(通常指非GPU的AI专用芯片)的出货量超越GPU。
与此同时,在全球算力产业中,非GPU路线正在快速成长为与GPU分庭抗礼的核心力量,算力市场双轨并行的格局有了雏形。
全球知名市研机构IDC发布的报告显示,今年上半年,中国非GPU芯片市场在加速计算领域增长显著。2025年上半年,中国非GPU服务器市场占比约为30%,预计到2028年市场占有率将接近50%。
AI在千行百业的加速渗透对这一趋势有着极大的推动作用。
英伟达创始人、CEO黄仁勋曾经在采访中透露,中国的AI应用发展速度极快,其社会接纳新技术的节奏非常快。这是一个让他深感担忧的领域,因为归根结底,这场工业革命的胜负将取决于AI应用层面的发展,取决于谁能成为技术普及的引领者。
相比于GPU,非GPU技术路线在成本、能效比、场景适配性上更为契合当下AI主流应用场景。
其硬件采购与运维成本更低,更适配中小企业及大规模分布式部署需求;能通过定制化架构实现低功耗与高精度的平衡,实现更优能效比;适配自动驾驶、工业物联网等边缘端场景的算力需求;同时具备更强的实时性、稳定性与灵活性,适配差异化AI任务。
尤其在智算中心、大模型部署、云计算、泛机器人、智能驾驶等主流AI应用场景中,非GPU路线有适配特定负载的高能效比、更低的全生命周期成本、更强的国产供应链自主可控性,且能通过从0到1的定制化架构实现大模型推理高吞吐与低延迟,兼容多业务负载。
对于规模达千亿乃至万亿级的AI市场而言,非GPU方案必然会占据一席之地。
不过,客观来讲,非GPU发展尚没有GPU成熟,大部分非GPU芯片生态成熟度不足,缺乏完善的软件工具链、丰富的开源框架支持。再加上其发展处于早期,对企业的早期研发投入能力也是不小的考验。
这也从侧面印证,GPU与非GPU两条技术路径各有优劣,并非简单的替代关系。
03 拆解国内头部芯片企业布局,可重构赛道势头正猛
想要探究当前国内非GPU赛道的发展格局,可以聚焦几家核心企业作为切入点。
北京AI产业具有代表性,2024年其AI核心产业规模已经达到近3500亿元,占全国近一半,助攻这一产业发展的底层芯片玩家更为关键。
因此新华社报道提到的昆仑芯、寒武纪、摩尔线程、清微智能,这四家北京芯片代表企业,正是国内AI产业蓬勃发展的生动缩影,透过它们的发展轨迹,更能清晰窥见国内AI芯片产业格局的深刻变革。
▲北京四家芯片代表企业2025年上半年出货量位居国内前列
这四家企业中,摩尔线程为GPU阵营,其余三家均为非GPU阵营,其中寒武纪、昆仑芯主攻ASIC路线,清微智能以可重构架构实现通用计算为核心发力方向。
值得注意的是,这并不是当下非GPU赛道的全部路线,不过这几家受到北京市认可的企业极具代表性,既展现出国产非GPU的布局脉络,也凸显了政府层面的有力支持。
因为GPU的技术优势已经在业界有广泛认知,因此我们主要拆解了另外两条非GPU路线。
ASIC架构是一种为特定用途定制设计的集成电路,谷歌TPU就是ASIC芯片。ASIC最核心的优势就是性能、功耗,再加上支持深度定制的特性使得其在AI应用浪潮中得以大展拳脚。
寒武纪的ASIC芯片采用自研架构,构建了覆盖云端、边缘端和终端的完整产品线。以其首款采用Chiplet技术的芯片思元370为例,该芯片最大算力高达256TOPS(INT8),是寒武纪第二代产品思元270算力的2倍。
昆仑芯基于其自研XPU架构,昆仑芯R200可提供高达256 TOPS(INT8)和128 TFLOPS FP16的算力,性能可达主流GPU的1.5倍。在实际部署中,其单机4卡R200方案可实现4800 tokens/s的推理吞吐量,满足千亿参数大模型的实时交互需求。
这些实例足以印证,AI领域中非GPU架构对GPU的规模化替代进程已全面开启。
不过ASIC的不足之处在于,因为需要定制化所以其从需求定义到量产交付的每个环节都需投入大量时间与资源,不仅如此,ASIC架构一旦固化便难以调整,面对算法快速迭代的场景,往往需要重新流片,进一步拉高研发风险与周期成本。
相比之下,兼容GPU、ASIC路线优势的可重构计算路线发展势头更猛,核心在于它踩中了AI产业从算力集中到场景细分转型的行业趋势,可以解决GPU通用但低效、ASIC高效但硬件固化的痛点,且通过底层架构创新实现了性能与性价比的平衡。相比行业同类型产品实现成本整体降低50%、能效比提升3倍。截至今年12月,清微智能的可重构芯片累计出货量已超3000万颗,2025年其算力卡订单累计超3万张,在全国十余座千卡规模智算中心实现规模化落地。
▲清微智能AI算力芯片TX81
此外,可重构数据流技术路线还与AI计算需求天然适配。在实现芯片高效互联这一核心环节上,可重构数据流派自研的TSM-LINK算力网格技术,支持多芯片点对点直连,可实现数据的高效传输,从根源上规避传统交换机架构存在的带宽瓶颈与通信延迟问题。而GPU架构在适配晶圆级芯片集成时,只能依赖外部交换机完成互联,性能损耗与延迟问题难以避免。
在芯片设计层面,可重构数据流架构从底层架构设计阶段就具备三维扩展的天然优势,能够与晶圆级芯片技术、3.5D堆叠等先进立体封装技术深度结合,形成清晰且可持续的升级迭代路径。据悉,清微明年推出的下一代芯片会带来大幅度性能跃升,有望实现对国际主流前沿AI芯片的弯道超车。
▲GPU与非GPU技术路线基本性能对比
因此从本质上来看,可重构计算路线不是对GPU、ASIC的替代,而是通过找到其中的平衡,取两家之所长,契合了AI规模化落地的核心需求。
04 结语:算力产业进入多元共生新时代
总的来看,当下AI算力领域格局已较为清晰:GPU凭借成熟生态与极致并行计算能力,在通用大模型训练、图形渲染等核心场景仍占据不可撼动的统治地位,但正面临功耗攀升、成本高的结构性挑战;而非GPU路线则凭借更高能效比、更低全生命周期成本及自主可控优势,在AI推理、专用算力需求等主流AI应用领域快速崛起,共同推动算力体系向多元化、异构融合方向演进。
以大模型、生成式AI为代表的新一轮AI浪潮催生出前所未有的AI算力需求,同时国产大模型企业强势突围,带动了国内AI算力需求的持续增长,中国AI算力产业迎来新的机遇和挑战。
当下,国产非GPU企业异军突起,正与国内大模型厂商形成合力,为国内AI算力产业注入新的活力。目前来看,非GPU技术路线尽管相比GPU并不成熟,但因其天然优势与AI应用落地相契合,正迸发出强大生命力。
本文来自微信公众号“芯东西”,作者:程 茜,36氪经授权发布。















