5年狂赚5825倍,中国最像英伟达的公司终于上市了

硅基观察Pro·2025年12月05日 19:28
5年5825倍的造富神话

今天,A股上演了一场真正的“印钞狂欢”。

被大家念叨了很久的“国产GPU第一股”——摩尔线程,终于登陆科创板了。

你看这股价,首日一度高开468.78%,开盘价每股650元,市值一度突破3000亿元。

在这波狂欢里,创始人张建中赢麻了,仅直接持股市值就达287.56亿。早期投资人也赚得盆满钵满。最早的投资人沛县乾曜累计浮盈高达5825倍。

在2020年12月,和而泰投了摩尔线程3000万,现在变成了26.68亿,5年时间直接涨了近88倍。

资本为什么这么疯狂?就冲着它脑门上那个全市场最性感的标签—— “中国版英伟达”。

这可不是瞎贴金。摩尔线程的班底那可是正儿八经的“英伟达嫡系”,张建中更是长期担任英伟达全球副总裁、中国区总经理。

借助这个热乎劲,今天我们就来盘一盘,这家被捧上神坛的公司,成色到底怎么样?

01

5年4代GPU,最新性能接近英伟达H20

显卡这玩意儿,如果不谈场景只谈参数,那就是在耍流氓。

咱们把话说明白点。

搞AI计算,核心指标其实就看三个:算力、显存、带宽。

显存决定了你能处理的模型大小,算力代表着能同时处理多少数据,带宽则代表固定期限能传输多少数据。

如果显存不够,大模型直接跟你说拜拜,就像小显卡跑3A大作直接爆显存一样,不讲道理。

如果算力和带宽不够,那就是老牛拉破车,别人跑完了,你还在那loading。

好,铺垫完了,咱们来看看摩尔线程。

自2020年成立以来,摩尔线程已推出“苏堤”、“春晓”、“曲院”、“平湖”四代GPU架构,从第三代曲院开始重心转向AI计算,最新一代“平湖”GPU于2024年发布,基于该GPU的S5000的最新产品。

看数据,S5000在FP32精度下的算力是32 TFLOPS。同时,平湖架构GPU最大显存容量推断为80GB,推断S5000显存容量应为80GB,带宽未知。

这是什么概念?咱们拉出英伟达的GPU看看:A100的FP32算力是19.5,H20是44,H100是67。

单看FP32这一项,S5000一拳打翻了A100,甚至快摸到了H20的尾巴。虽然离H100那种“怪物”还有差距,但看着是不是挺热血沸腾?

且慢,先别急着开香槟。

上面的参数并不能代表S5000的实际AI算力水平,原因就出在这个“FP32”上。

AI计算中,需要用到不同精度的数据,FP32是其中一种,此外还有FP64、FP16/BF16、FP8、FP4、INT8等多种常见数据类型。

字母后面的数字代表在存储里占用的字节,数字增大,数据精度评估。FP32能表示小数点后7位左右,FP16能达到小数点后3位左右,INT8能表示-128到127之间的整数。

相应的,数据位数越大,占用内存越大,计算速度也更慢。因此,不同AI任务需要找到最合适的数据类型,像医学、军事、科学等领域对误差比较敏感的,就需要用到FP64数据。

现在的AI大模型,不是在那搞火箭轨道计算,所以不需要那么高的精度。

现在大家为了快,为了省内存,都在搞混合精度。FP16、BF16,甚至FP8(8位浮点)才是现在AI训练和推理的“主战场”。

就像你切菜,不需要拿着做眼科手术的手术刀去切,拿着菜刀(FP8/FP16)反而砍得更快。

所以,S5000那个漂亮的FP32数据,在AI领域里,参考价值得打个折。关键得看它在FP16或者FP8下的表现。

关于这点,有媒体曾经披露过,据参与S5000产品测试的人士透露,S5000是国内真正对标H100的产品,其FP8计算能力对DeepSeek-V3/R1这样的MoE大模型训练“是个绝配”。

但由于相关信息较少,摩尔线程S5000的实际表现仍未可知。

再看看隔壁的友商们,那也是卷得飞起。

华为昇腾910C NPU目前公布的BF16/FP16总算力达752 TFLOPS,超过了英伟达H20和A100,但不到H100的一半,片上内存(可简单类比显存)和带宽与H100基本在同一水平。

寒武纪目前在售思元590芯片,FP16算力为256TFLOPS,接近A100水平。沐曦集成未公布数据,仅表示曦云C500和C550两款GPU在FP16/BF16指标上,处于英伟达A100的算力区间。

不过,也有行业内部人士称,在实际训练推理环境中,摩尔线程等国产AI计算卡的纸面参数算力往往需要打个折扣。

必须承认,单看指标,摩尔线程离英伟达确实还有很长的路要跑。

但这不重要,重要的是它还在跑。在他们身上,我们把国产GPU死磕到底的那股劲儿。只要还在往前拱,这件事就有戏。给点耐心,挑战者永远值得瑞思拜。

02

一个S5000集群,贡献一半以上营收

虽然大家都说摩尔线程是“国产英伟达”,但只要你翻开本本,就会发现两者的赚钱方式其实大有区别。

比较典型的体现是,英伟达不直接销售AI智算集群,而摩尔线程主要营收却来自于集群产品。

今年上半年,摩尔线程共卖出了5个智算集群,其中4个集成512个S4000 GPU,另一个是集成2048个S5000 GPU的集群,这也是摩尔线程卖出的第一个S5000集群。资料显示,仅这一个S5000集群,就为摩尔线程贡献了3.97亿元营收,占上半年总营收一半以上。

据招股资料显示,这一个S5000集群的客户为“重大科技创新平台”,大概率是某个国家实验室。值得一提的是,目前国产AI计算卡企业中,华为是绝对龙头,客户较为广泛。寒武纪主要客户为字节跳动,据行业内人士透露,沐曦集成则主要面向信创GPU市场。

而英伟达之所以不卖AI智算集群的原因,是因为这事的毛利率比卖芯片可差多了。

现在,英伟达卖 GPU 的毛利率高达70%,而卖AI集群的毛利率可就要低很多,因为AI 智算集群的建设和维护也需要大把的钱。

虽然毛利率低,可对于尚处于追赶阶段的摩尔线程也不算一个坏的选择。

因为相比于卖GPU,卖集群更容易做大营收规模。集群本质上就是把一堆GPU连接在一起,共同执行AI任务,卖一个集群就相当于一次性卖出几百上千甚至更多GPU。

更关键的是,卖集群这事也不是谁想干就能干的。

现阶段AI模型越做越大,单卡或者多卡组合已经满足不了训练需求,同时消费端推理需求暴增,AI大厂和云服务厂商只能建设更大的算力集群来满足行业需求。

比如,马斯克的xAI孟菲斯超级集群一期就集成了10万张H100GPU,亚马逊的Project Rainier更是集成了近50万颗自研芯片。

AI计算是一场对速度的极致考验,每块GPU类似一段高速公路,这些高速路段并没有相连,每行驶一段就得出高速然后重新上另一段高速。

于是,当GPU越来越多,就带了另一个问题:怎么把这些GPU更好地连接起来?

这就引出了建设AI算力集群一个关键技术——GPU互联技术。

英伟达之所以这么牛,是因为它很早就开发出来NVLink技术,相当于把每段高速的连接路段也修成了高速,相邻的几张GPU两两互通,提升计算速度。目前应用的NVLink5.0技术卡间互联带宽高达1.8TB/s,即将推出的6.0技术带宽将升级至3.6TB/s。

在卡间互联上,摩尔线程也推出了自研的MT-Link技术,目前最新的MT-Link3.0互联带宽达1.3TB/s,介于NVLink4.0(带宽900GB/s)和5.0之间。招股资料中,摩尔线程表示MT-Link3.0已经达到行业领先水平。

不过,公司也说了,目前摩尔线程最新的平湖GPU架构和S5000 GPU上,用的还是MT-Link2.0技术,片间互联带宽为800GB/s。也就是说,新研发的3.0技术还没应用到产品上。

虽然摩尔线程在GPU互联技术做得不错,但其AI集群也面临着另一个现实挑战,那就是规模。

一般来说,两两互联的卡数量有着较难突破的物理极限。由于每家厂商采用的互联结构不同,这个极限并不相同,比如英伟达最新的Blackwell架构支持72个GPU互联,谷歌TPU在卡间互联上最多形成4X4X4(即64个TPU)的小立方体,这样的互联极限一般被称为节点。

摩尔线程现有的KUAE2集群技术,每个节点集成8颗模块化GPU,节点之间采用的InfiniBand/RoCE的网络方案进行互联,这两种都是行业主流网络互联方案。KUAE2集群最多可包含1280个节点,最大可支持10240个GPU。

不过,摩尔线程卖出的最大集群仅包含2048张卡。据行业人士透露,在AI计算卡集群上,5000卡是一个关键瓶颈,因为集群规模上去后,对电源、电力、散热以及系统调控等诸多方面都是一个极大的考验。因此相比于动辄10万卡、20万卡互联的英伟达,摩尔线程的KUAE集群技术仍需要进一步完善及迭代。

虽然技术上还在追赶,离万卡集群也还有距离。但在国产替代的大潮下,能把千卡级别的集群卖出去,而且真金白银地赚到钱,已经是一件很了不起的事情了。

只要有人买单,这把火,就还能继续烧下去。

03

5年5825倍的造富神话

除了国产GPU追赶英伟达的故事,摩尔线程上市另一个话题便是,造富。

最直接的体现就是创始团队。公告显示,发行后张建中直接持股9.4127%,按上市首日的价格,即使不算间接持股,张建中持股市值就高达287.56亿元。

最早下场的机构股东同样赚得盆满钵满。

摩尔线程成立三个月,深圳明皓、沛县乾曜就迅速入局。据摩尔线程公布的法律意见书,沛县乾曜是以1元的价格入股,投前估值仅1000万元,沛县乾曜以190.4762万元入股,拿到了13.4%股份。同期入股的深圳明皓以35.28元的价格入股,投了8000万元,拿到了16%股份。

之后,沛县乾曜以253.60元的价格转让了近20万元的注册资本,套现约5000万元。此次发行后沛县乾曜仍持有1699.87万股,占总股本的3.6165%,开盘市值为110.48亿元,以此计算沛县乾曜累计浮盈超5825倍。

深圳明皓先后在2021年10月和今年初分别套现了2000万元和1.57亿元,发行后持有1992.27万股,持股比例为4.2386%,开盘市值为129.49亿元,累计浮盈达163倍。

在之后的天使轮中,摩尔线程引入了红杉资本、闻名泉丰、和而泰、深圳一创、五源启兴五家机构。资料显示,此轮融资投后估值为16.46亿元,和而泰投了3000万元。此次发行后和而泰持股比例为0.8734%,以开盘价计算持股市值26.68亿元,增值了近88倍。

红杉资本曾多次追投,天使轮、Pre-A轮和B轮合计投入约2.12亿元,发行后持股1915.44万股,持股比例为4.0752%,持股市值124.50亿元,增值了近58倍。

不过也有在IPO前提前离场的机构。字节跳动旗下量子跃动在Pre-A轮向摩尔线程投了约5000万元,今年初将其全部股份转让,获利2.27亿元,赚了3.54倍。

即便是在Pre-IPO轮新进入的股东,也赚到了不错收益。摩尔线程Pre-IPO轮投后估值为298.45亿元,开盘市值约3055亿元,新股东浮盈9倍以上。

显然,在国产 GPU 飞速前进的大背景里,这台造富机器显然还没停下。下一段故事,大概才刚刚开始。

本文来自微信公众号“硅基观察Pro”,作者:董武英,36氪经授权发布。

+1
3

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

龙头企业在这里,整条产业链在这里

1小时前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业