5年狂赚5825倍，中国最像英伟达的公司终于上市了

硅基观察Pro·2025年12月05日 19:28

5年5825倍的造富神话

今天，A股上演了一场真正的“印钞狂欢”。

被大家念叨了很久的“国产GPU第一股”——摩尔线程，终于登陆科创板了。

你看这股价，首日一度高开468.78%，开盘价每股650元，市值一度突破3000亿元。

在这波狂欢里，创始人张建中赢麻了，仅直接持股市值就达287.56亿。早期投资人也赚得盆满钵满。最早的投资人沛县乾曜累计浮盈高达5825倍。

在2020年12月，和而泰投了摩尔线程3000万，现在变成了26.68亿，5年时间直接涨了近88倍。

资本为什么这么疯狂？就冲着它脑门上那个全市场最性感的标签—— “中国版英伟达”。

这可不是瞎贴金。摩尔线程的班底那可是正儿八经的“英伟达嫡系”，张建中更是长期担任英伟达全球副总裁、中国区总经理。

借助这个热乎劲，今天我们就来盘一盘，这家被捧上神坛的公司，成色到底怎么样？

01 5年4代GPU，最新性能接近英伟达H20

显卡这玩意儿，如果不谈场景只谈参数，那就是在耍流氓。

咱们把话说明白点。

搞AI计算，核心指标其实就看三个：算力、显存、带宽。

显存决定了你能处理的模型大小，算力代表着能同时处理多少数据，带宽则代表固定期限能传输多少数据。

如果显存不够，大模型直接跟你说拜拜，就像小显卡跑3A大作直接爆显存一样，不讲道理。

如果算力和带宽不够，那就是老牛拉破车，别人跑完了，你还在那loading。

好，铺垫完了，咱们来看看摩尔线程。

自2020年成立以来，摩尔线程已推出“苏堤”、“春晓”、“曲院”、“平湖”四代GPU架构，从第三代曲院开始重心转向AI计算，最新一代“平湖”GPU于2024年发布，基于该GPU的S5000的最新产品。

看数据，S5000在FP32精度下的算力是32 TFLOPS。同时，平湖架构GPU最大显存容量推断为80GB，推断S5000显存容量应为80GB，带宽未知。

这是什么概念？咱们拉出英伟达的GPU看看：A100的FP32算力是19.5，H20是44，H100是67。

单看FP32这一项，S5000一拳打翻了A100，甚至快摸到了H20的尾巴。虽然离H100那种“怪物”还有差距，但看着是不是挺热血沸腾？

且慢，先别急着开香槟。

上面的参数并不能代表S5000的实际AI算力水平，原因就出在这个“FP32”上。

AI计算中，需要用到不同精度的数据，FP32是其中一种，此外还有FP64、FP16/BF16、FP8、FP4、INT8等多种常见数据类型。

字母后面的数字代表在存储里占用的字节，数字增大，数据精度评估。FP32能表示小数点后7位左右，FP16能达到小数点后3位左右，INT8能表示-128到127之间的整数。

相应的，数据位数越大，占用内存越大，计算速度也更慢。因此，不同AI任务需要找到最合适的数据类型，像医学、军事、科学等领域对误差比较敏感的，就需要用到FP64数据。

现在的AI大模型，不是在那搞火箭轨道计算，所以不需要那么高的精度。

现在大家为了快，为了省内存，都在搞混合精度。FP16、BF16，甚至FP8（8位浮点）才是现在AI训练和推理的“主战场”。

就像你切菜，不需要拿着做眼科手术的手术刀去切，拿着菜刀（FP8/FP16）反而砍得更快。

所以，S5000那个漂亮的FP32数据，在AI领域里，参考价值得打个折。关键得看它在FP16或者FP8下的表现。

关于这点，有媒体曾经披露过，据参与S5000产品测试的人士透露，S5000是国内真正对标H100的产品，其FP8计算能力对DeepSeek-V3/R1这样的MoE大模型训练“是个绝配”。

但由于相关信息较少，摩尔线程S5000的实际表现仍未可知。

再看看隔壁的友商们，那也是卷得飞起。

华为昇腾910C NPU目前公布的BF16/FP16总算力达752 TFLOPS，超过了英伟达H20和A100，但不到H100的一半，片上内存（可简单类比显存）和带宽与H100基本在同一水平。

寒武纪目前在售思元590芯片，FP16算力为256TFLOPS，接近A100水平。沐曦集成未公布数据，仅表示曦云C500和C550两款GPU在FP16/BF16指标上，处于英伟达A100的算力区间。

不过，也有行业内部人士称，在实际训练推理环境中，摩尔线程等国产AI计算卡的纸面参数算力往往需要打个折扣。

必须承认，单看指标，摩尔线程离英伟达确实还有很长的路要跑。

但这不重要，重要的是它还在跑。在他们身上，我们把国产GPU死磕到底的那股劲儿。只要还在往前拱，这件事就有戏。给点耐心，挑战者永远值得瑞思拜。

02 一个S5000集群，贡献一半以上营收

虽然大家都说摩尔线程是“国产英伟达”，但只要你翻开本本，就会发现两者的赚钱方式其实大有区别。

比较典型的体现是，英伟达不直接销售AI智算集群，而摩尔线程主要营收却来自于集群产品。

今年上半年，摩尔线程共卖出了5个智算集群，其中4个集成512个S4000 GPU，另一个是集成2048个S5000 GPU的集群，这也是摩尔线程卖出的第一个S5000集群。资料显示，仅这一个S5000集群，就为摩尔线程贡献了3.97亿元营收，占上半年总营收一半以上。

据招股资料显示，这一个S5000集群的客户为“重大科技创新平台”，大概率是某个国家实验室。值得一提的是，目前国产AI计算卡企业中，华为是绝对龙头，客户较为广泛。寒武纪主要客户为字节跳动，据行业内人士透露，沐曦集成则主要面向信创GPU市场。

而英伟达之所以不卖AI智算集群的原因，是因为这事的毛利率比卖芯片可差多了。

现在，英伟达卖 GPU 的毛利率高达70%，而卖AI集群的毛利率可就要低很多，因为AI 智算集群的建设和维护也需要大把的钱。

虽然毛利率低，可对于尚处于追赶阶段的摩尔线程也不算一个坏的选择。

因为相比于卖GPU，卖集群更容易做大营收规模。集群本质上就是把一堆GPU连接在一起，共同执行AI任务，卖一个集群就相当于一次性卖出几百上千甚至更多GPU。

更关键的是，卖集群这事也不是谁想干就能干的。

现阶段AI模型越做越大，单卡或者多卡组合已经满足不了训练需求，同时消费端推理需求暴增，AI大厂和云服务厂商只能建设更大的算力集群来满足行业需求。

比如，马斯克的xAI孟菲斯超级集群一期就集成了10万张H100GPU，亚马逊的Project Rainier更是集成了近50万颗自研芯片。

AI计算是一场对速度的极致考验，每块GPU类似一段高速公路，这些高速路段并没有相连，每行驶一段就得出高速然后重新上另一段高速。

于是，当GPU越来越多，就带了另一个问题：怎么把这些GPU更好地连接起来？

这就引出了建设AI算力集群一个关键技术——GPU互联技术。

英伟达之所以这么牛，是因为它很早就开发出来NVLink技术，相当于把每段高速的连接路段也修成了高速，相邻的几张GPU两两互通，提升计算速度。目前应用的NVLink5.0技术卡间互联带宽高达1.8TB/s，即将推出的6.0技术带宽将升级至3.6TB/s。

在卡间互联上，摩尔线程也推出了自研的MT-Link技术，目前最新的MT-Link3.0互联带宽达1.3TB/s，介于NVLink4.0（带宽900GB/s）和5.0之间。招股资料中，摩尔线程表示MT-Link3.0已经达到行业领先水平。

不过，公司也说了，目前摩尔线程最新的平湖GPU架构和S5000 GPU上，用的还是MT-Link2.0技术，片间互联带宽为800GB/s。也就是说，新研发的3.0技术还没应用到产品上。

虽然摩尔线程在GPU互联技术做得不错，但其AI集群也面临着另一个现实挑战，那就是规模。

一般来说，两两互联的卡数量有着较难突破的物理极限。由于每家厂商采用的互联结构不同，这个极限并不相同，比如英伟达最新的Blackwell架构支持72个GPU互联，谷歌TPU在卡间互联上最多形成4X4X4（即64个TPU）的小立方体，这样的互联极限一般被称为节点。

摩尔线程现有的KUAE2集群技术，每个节点集成8颗模块化GPU，节点之间采用的InfiniBand/RoCE的网络方案进行互联，这两种都是行业主流网络互联方案。KUAE2集群最多可包含1280个节点，最大可支持10240个GPU。

不过，摩尔线程卖出的最大集群仅包含2048张卡。据行业人士透露，在AI计算卡集群上，5000卡是一个关键瓶颈，因为集群规模上去后，对电源、电力、散热以及系统调控等诸多方面都是一个极大的考验。因此相比于动辄10万卡、20万卡互联的英伟达，摩尔线程的KUAE集群技术仍需要进一步完善及迭代。

虽然技术上还在追赶，离万卡集群也还有距离。但在国产替代的大潮下，能把千卡级别的集群卖出去，而且真金白银地赚到钱，已经是一件很了不起的事情了。

只要有人买单，这把火，就还能继续烧下去。

03 5年5825倍的造富神话

除了国产GPU追赶英伟达的故事，摩尔线程上市另一个话题便是，造富。

最直接的体现就是创始团队。公告显示，发行后张建中直接持股9.4127%，按上市首日的价格，即使不算间接持股，张建中持股市值就高达287.56亿元。

最早下场的机构股东同样赚得盆满钵满。

摩尔线程成立三个月，深圳明皓、沛县乾曜就迅速入局。据摩尔线程公布的法律意见书，沛县乾曜是以1元的价格入股，投前估值仅1000万元，沛县乾曜以190.4762万元入股，拿到了13.4%股份。同期入股的深圳明皓以35.28元的价格入股，投了8000万元，拿到了16%股份。

之后，沛县乾曜以253.60元的价格转让了近20万元的注册资本，套现约5000万元。此次发行后沛县乾曜仍持有1699.87万股，占总股本的3.6165%，开盘市值为110.48亿元，以此计算沛县乾曜累计浮盈超5825倍。

深圳明皓先后在2021年10月和今年初分别套现了2000万元和1.57亿元，发行后持有1992.27万股，持股比例为4.2386%，开盘市值为129.49亿元，累计浮盈达163倍。

在之后的天使轮中，摩尔线程引入了红杉资本、闻名泉丰、和而泰、深圳一创、五源启兴五家机构。资料显示，此轮融资投后估值为16.46亿元，和而泰投了3000万元。此次发行后和而泰持股比例为0.8734%，以开盘价计算持股市值26.68亿元，增值了近88倍。

红杉资本曾多次追投，天使轮、Pre-A轮和B轮合计投入约2.12亿元，发行后持股1915.44万股，持股比例为4.0752%，持股市值124.50亿元，增值了近58倍。

不过也有在IPO前提前离场的机构。字节跳动旗下量子跃动在Pre-A轮向摩尔线程投了约5000万元，今年初将其全部股份转让，获利2.27亿元，赚了3.54倍。

即便是在Pre-IPO轮新进入的股东，也赚到了不错收益。摩尔线程Pre-IPO轮投后估值为298.45亿元，开盘市值约3055亿元，新股东浮盈9倍以上。

显然，在国产 GPU 飞速前进的大背景里，这台造富机器显然还没停下。下一段故事，大概才刚刚开始。

本文来自微信公众号“硅基观察Pro”，作者：董武英，36氪经授权发布。

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

5年狂赚5825倍，中国最像英伟达的公司终于上市了

01

5年4代GPU，最新性能接近英伟达H20

02

一个S5000集群，贡献一半以上营收

03

5年5825倍的造富神话

最近内容

下一篇