真武芯片亮相,标志着阿里AI“三位一体”基本告成
今天(2026年1月29日),对于中国AI产业,乃至中国芯片产业而言,是一个很有意义的日子:平头哥(阿里巴巴集团芯片业务主体)官网公布了一款名为“真武810E”的高端AI芯片。在此之前,关于平头哥自研PPU的说法,早已在市面上广为流传,还曾登上《新闻联播》——其中出现的少量技术参数,引发了国内芯片圈子的热烈讨论。现在,平头哥自研PPU“真武”,终于正式出现在外界视野之中了。
请注意:虽然这是“真武”的第一次公开亮相,但是在此之前,它早已投入实用了,规模还颇大:迄今已经在阿里云实现了多个万卡集群部署,服务了国家电网、中科院、小鹏汽车、新浪微博……等各行各业的400多家客户。它不是一款停留在PPT上的芯片,也不是一款还在早期试用阶段的芯片,而是已经扎扎实实地积累了大量客户案例、形成了一定的生态系统。早在半年多以前,我的一位阿里云的朋友就表示:“我觉得平头哥自研芯片的水平不比市面上的主流方案差。”当时我半信半疑,现在我差不多能理解他的自信了。
“真武”的水平究竟有多高?对这个问题,我让Gemini大模型总结了主流英文媒体的报道,大致结论如下:
96GB显存、700GB/s片间互联,具备与H20类似的竞争力;
已经大规模使用于阿里千问大模型的训练和推理流程之中;
ICN片间互联技术,以及AI产品软件栈,均为平头哥自主研发、独立知识产权。
下一代产品的研发也早在如火如荼的进行之中了。
我的个人观点是,在AI推理任务上,“真武”显然胜任,并且在一定范围内具备较强的性价比;在训练任务上,目前可了解的信息还太少,但应该也只是时间问题。如果未来一段时间内,千问大模型的新版本部分乃至全部使用PPU训练,我也不会感到奇怪;当然这个过程会很复杂,不能急于求成。
在美国长期“算力封锁”、国内算力紧缺的情况下,平头哥自研PPU的亮相,绝不仅仅是一次技术发布,更具备重要的战略意义。它意味着中国AI产业对算力的选择更多、回旋空间更大了,其中的自研产品比例更高了。自从2018年正式成立以来,平头哥已经走过了八个年头,“真武”是多年以来坚持自主研发路线的结晶。这条道路不容易走,但是飞轮一旦转动起来,前途是很远大的。
不过,今天我想聊的,不仅是芯片这个话题。毕竟AI是一个很长的产业链,芯片是其中的重要一环,但不是唯一一环。从上游的算力硬件(以芯片为核心),到中游的云服务,到下游的基础大模型——至少在这三个环节都有布局,才算是布局了整个产业链。而放眼全球,哪些科技公司堪称在三个环节都有较强的技术实力呢?我数来数去,也只有两家:谷歌、阿里巴巴。
先说谷歌:自研芯片TPU的实力有目共睹,而且已经向第三方大规模出货;谷歌云的增长势头极快,而且大部分新增收入来自AI;基座大模型Gemini最近一年多高歌猛进,大有反超GPT的势头。谷歌的“全栈技术实力”,在硅谷无人能敌,而且三个环节之间形成了良好的协同效应:TPU降低了Gemini的训练和推理成本,Gemini与谷歌云共同构成了“AI+云”生态,而谷歌云和Gemini的成功又构成了对TPU最好的广告。谷歌因此成为了2025年股价表现最好的硅谷科技巨头,市值突破了4万亿美元。
反观另外两个云计算巨头——亚马逊和微软,其布局都谈不上完整。亚马逊的自研芯片Trainium有一定的技术实力,但是比谷歌TPU落后很多,外部客户群也尚未建立起来;亚马逊的自研基座大模型也是水平一般,主要依靠对Anthropic等外部开发商的投资。至于微软,自研芯片的发展程度还不及亚马逊,至于基座大模型更是基本依赖对OpenAI的投资。这两巨头的AI战略,都是聚焦于云平台一个环节,另外两个环节则只投入有限资源,依靠投资和合作进行布局。这是一种“聪明”、“省力”,但是对全产业链掌控能力不足的路线。
而阿里则选择了与谷歌一致的那条更艰难的路线:全栈自研,在AI芯片、云计算和基座大模型三个环节均追求顶尖的自主研发。大模型端的通义实验室,云平台端的阿里云,再加上AI芯片端的平头哥,共同构成了所谓“通云哥”的AI大三角,或曰“三位一体”的AI全栈技术能力。这个模式,投入巨大、研发周期长、风险集中,但是一旦成功,其回报十分可观,而且可以构筑起难以撼动的竞争壁垒。在我看来,谷歌AI帝国从2023年的风雨飘摇,嬗变到2025年的春风得意,其中发挥决定性作用的就是全栈自研能力。
在云计算环节,阿里云的技术实力早已毋庸置疑,它是与微软Azure、亚马逊AWS、谷歌GCP并列的全球四大公有云平台之一,其基础设施覆盖全球29个地域、服务500多万客户;阿里云的“飞天”,是国内唯一自研的云计算操作系统。2025年云栖大会上,吴泳铭曾提出阿里要做“超级AI云”,成为全球仅有的5-6个“超级云计算平台”之一。至少从研发和技术基建角度看,上面的说法并不夸张,还有很强的可行性。
在基座大模型环节,通义实验室的水平同样不需要证明。就我个人而言,用的最多的两个国产大模型,就是千问和DeepSeek。沙利文(Frost & Sullivan)的研究显示,2025年上半年中国企业级大模型调用市场,千问的占比名列第一。在海外,千问的开源版本尤其受欢迎,是Hugging Face等平台上讨论最多的开源大模型家族之一(或许还可以去掉“之一”)。就在去年,新加坡国家人工智能计划(AISG)放弃了Meta的LLaMA系列大模型,转向了千问开源架构。从这个角度看,千问比Gemini和GPT更加全面,因为后两者基本都聚焦于闭源赛道。
至于芯片环节,在“真武”公布之前,市面上对阿里的真实水平,其实并不了解。AI圈子的很多朋友都告诉我:“平头哥在国产AI芯片厂商当中处于第一梯队,甚至可能是最先进的之一。”然而,在今天之前,大家对于PPU的技术参数、应用范围,还是只有模糊的认识。现在官方信息来了,相信今后还会有更多、更全面的信息披露。无论从什么角度看,平头哥PPU在国产芯片当中的领先位置,从现在开始应该无人能质疑了。
2025年,是谷歌TPU的爆发之年,Gemini的成功促使越来越多的外部客户订购TPU;未来几年,谷歌很可能超过AMD,成为全球排名第二的GPU厂商。同样的事情完全有可能发生在平头哥身上——千问大模型越先进、其中的“PPU比例”越高,“真武”以及后续的PPU产品就越好卖。如果外部客户产生了兴趣,可以先通过阿里云租用PPU算力,再决定是否采购PPU。在长期,PPU的外部需求肯定是“两条腿走路”,通过阿里云交付的算力以及客户直接采购的算力,其规模都会很大,带动每token的边际成本越来越低,形成“通云哥”的生态正循环。
“通云哥”的黄金三角已经成型,从今往后,对于阿里的AI战略,外界不应采取孤立的研究方式,而是应该将其视为一个有机整体去研究。所有大厂都在讲“AI生态”,但是迄今为止,真正构筑了完整全面的自研AI生态的,在国内也仅有阿里一家。人类才刚刚进入AI时代,迈向AGI(通用人工智能)的长征才开了一个头,未来五年、十年乃至更长的时间里,阿里的AI生态将为全世界的AI产业带来什么样的贡献和影响?没人知道答案,我只知道肯定是十分巨大、深远的。
本文来自微信公众号 “互联网怪盗团”(ID:TMTphantom),作者:怪盗团团长裴培 怪盗团团长裴培,36氪经授权发布。















