冲刺"Token工厂第一股",硅基流动越亏越值钱?
“卖Token也能上市?” AI圈最近又炸出一个新物种。
6月30日,硅基流动向港交所递表,剑指“Token工厂第一股”。
这家成立不到三年的公司,讲出了一个全新的故事:不做大模型、不做AI应用,专门做AI产业的 "Token批发商"。
具体来说,就是把英伟达、华为昇腾等不同芯片的算力,和DeepSeek、Qwen、GLM等上百个模型,统一封装成标准化的Token服务,用户按调用量付费,不用关心底层用的什么芯片、什么模型。
听起来很美,资本也很买账。
34个月里,硅基流动完成7轮融资,估值从天使轮2.3亿元的投前估值,一路飙到最新B+轮77.4亿元的投后估值,涨了33倍。
阿里、华为、美团、商汤……半条AI产业链都挤进来当股东,阵容豪华得晃眼。
但翻开招股书,画风就不一样了。
2025年营收5533万元,同比增长653%,可净亏损也达到3.45亿元,是收入的6倍多。
更扎心的是毛利率,直接干到了-24%,相当于每赚1块钱,还要倒贴2毛4。
一边是资本热捧、估值飞天,一边是越卖越亏、毛利率转负。
硅基流动这门“Token生意”,到底是AI时代的水电煤,还是又一个烧钱换规模的资本游戏?
“Token工厂”凭什么这么贵?
硅基流动的爆红,得从一个人和一件事说起。
第一个人是创始人袁进辉。
这位清华计算机系博士,师从中国AI奠基人张钹院士,是AI Infra圈里实打实的“技术老兵”。
2008年毕业后,他进了微软亚洲研究院当主管研究员,搞出了当时世界最快的主题模型训练算法LightLDA,还拿过微软亚研院院长特别奖。
2016年,袁进辉从微软离职创业,搞出了深度学习框架OneFlow,在分布式训练领域一度是国产之光。
2023年,OneFlow被王慧文的“光年之外”收购,后来又跟着并入美团。
但袁进辉拒绝了美团的留任邀请,带着核心团队二次创业,硅基流动就这样诞生了。
第二件事,是2025年春节的那场DeepSeek狂欢。
DeepSeek R1横空出世,全网都在抢着用,算力直接崩了。
硅基流动联手华为云昇腾,首发了国产化部署方案,一夜之间接住了汹涌的流量,上线仅10小时就被迫限流。
这场爆红,让硅基流动一战成名,也坐实了“中国最大独立Token供应商”的名头。
这个定位确实踩中了风口。
招股书援引弗若斯特沙利文的数据,2025年中国词元按吞吐量统计,市场前三名合计拿下约87%的份额,硅基流动排第四,市场份额约为1.5%。
别小看这1.5%。
从描述看,外界可以推测对应的前三名分别是火山引擎、阿里云、百度智能云。
硅基流动作为一家创业公司能在巨头夹缝里啃下一块肉,已经相当不容易。
运营数据也确实亮眼:
截至2026年4月,平台注册用户超过1000万,日均Token吞吐量达到5785亿次;
公有云付费客户从2024年的2455家,飙升到2025年的71.6万家,一年涨了约292倍。
这大概就是资本愿意给77亿估值的底气。
但问题来了:140倍的PS(市销率),到底贵不贵?
对比一下就知道了。
海外同类玩家Fireworks AI,2025年10月C轮融资时估值40亿美元,对应ARR约2.8亿美元,PS约14倍。
Together AI刚官宣了一笔8亿美元的C轮融资,估值直接翻倍到83亿美元,对应今年初约10亿美元的年化收入,PS约8倍。
两家海外对标公司的PS都在10到15倍区间,硅基流动140倍的估值,是它们的近10倍。
这多出来的溢价,市场到底在赌什么?
两条业务线,根都不牢
硅基流动有两条业务线,命运天差地别。
第一条是公有云服务,也就是大家说的MaaS,这是“Token工厂”故事的主角。
2025年,这条线贡献了2926万元营收,占总收入52.9%,首次超过另一块业务。
但它有个致命问题:不赚钱,毛利率是-119%。
也就是说,每收入1块钱,硅基流动要倒贴1块1毛9,卖得越多,亏得越狠。
很多人第一反应是“烧钱换客户”,毕竟2025年光免费代金券就烧了5400多万元。
但这只是表象,更深层的问题是:公有云业务从商业模式上就很难赚钱。
先看价格。
硅基流动上DeepSeek-V3的常规价格一度是输入2元/百万Token、输出8元/百万Token,R1是输入4元、输出16元,加上新用户注册就送2000万免费Token,早期确实比官方便宜三到五成。
但这个优势正在快速缩水:
2026年5月,DeepSeek将V4-Pro的限时5折优惠永久化,降幅达75%,缓存命中的输入价格干到0.025元/百万Token,比硅基流动的老价格便宜出几个量级。
原厂一降价,中间商的价格优势就被打薄了。因为硅基流动的成本结构,从根上就不占优势。
对于闭源模型,它拿不到权重,只能通过原厂 API 或授权渠道转接,相当于 "二道贩子",成本理论上不可能比原厂更低。
对于开源模型,它虽然可以自己租卡部署、做推理优化,但原厂有最大规模的调用量、最深的模型理解、最极致的工程优化,单位成本还是比它低。
硅基流动的便宜,更多是靠补贴让一点、靠优化挤一点、靠比客户自建便宜一点,这不是系统性的成本优势。
真要打价格战,原厂降得起,它降不起。
那用户为什么还用它?
早期用户可能冲着便宜,但真正留下来的,更多是冲着多模型统一接入。
170多个模型随便切,代码几乎不用动,加上智能路由、容灾、成本管控这些企业级功能,省的不是钱,是时间和精力。
问题是,这门“省事”生意的护城河有多深?
再看客户比例。
招股书披露,2026年前四个月,公有云付费客户约64万家,人均ARPU约22元,高价值付费客户占比不到1%。
这说明客户数量被长尾用户快速拉高,但不排除少数大客户贡献了更高的付费金额。
但真正的问题在于,长尾客户天然价格敏感,迁移成本又低,今天你便宜就用你,明天别家更便宜就转走。
而大客户即便付费更多,也更会把价格、稳定性和供应链安全压到极致,议价能力只会更强。
第二条是本地部署解决方案,才是真正的“利润奶牛”。
客户自己有算力,硅基流动把推理引擎和调度系统部署到客户数据中心,收软件许可费、实施费和维保费。
2025年这项业务营收2607万元,占比47.1%,毛利率高达82.5%。
看着很美,但隐忧不小。
一是客户越来越集中:
本地部署客户数量从2024年的28家减少到2025年的20家,2026年前四个月更是只新增5家;
但平均每客户收益从22.4万元暴涨到130.3万元,涨了481%,说明收入越来越依赖少数大客户。
二是规模化有天花板:
本地部署本质是项目制生意,交付周期长、复用率低,更像一家“AI工程服务商”,而不是“Token工厂”。
两条业务线,一个撑估值、一个赚利润,搭配得很精妙。
但“Token工厂”这个核心故事,其实主要是2025年才讲出来的。2024年,公有云收入才106.9万元,本地部署才是绝对主力。
尴尬的是,硅基流动必须继续把MaaS这条亏钱的线做大,才能撑住估值故事,可每做大一分,亏损就扩大一分。
想象力和现金流,短期内只能选一个。
“中立第三方”的护城河有多深?
硅基流动最大的卖点,是中立第三方。
大厂云做MaaS,都是“自研模型+云生态”打包卖,比如豆包之于字节、通义之于阿里。
大模型厂商把推理放在这些云上,总担心调用数据被拿去训练竞品。
硅基流动不做模型、不做应用,只做中间层,恰好解决了这个信任问题。
但这个位置真的稳固吗?
先往上看,硅基流动是纯粹的“租卡方”,对供应链没有话语权。
招股书披露,2025年公司向前五大供应商合计采购1.173亿元,占采购总额70.8%,最大单一供应商占比20.4%。
招股书还提到,往绩记录期内有两名主要业务伙伴同时是公司的客户及供应商。
对照股东名单不难猜到,这大概率就是阿里、华为哈勃这类公司。
这些大客户一边通过股权和算力租赁赚硅基流动的钱,一边旗下的云和模型业务又在市场上跟它抢客户,这仗怎么打?
更关键的是,硅基流动没有定价权:
芯片涨价,成本跟着涨;大厂云降价,售价也得跟着降,两头都是别人说了算。
再往下看,硅基流动没有自研模型,对产品同样没有掌控力。
它能卖什么、卖多贵,很大程度取决于开源社区和模型厂商的脸色。
而它最大的卖点“多模型统一接入”,技术门槛并不高。
火山引擎、阿里云、百度智能云都在做模型市场、做统一API,一旦大厂把开放也做成标配,价格还更低,硅基流动的核心价值随时可能被绕开。
国产芯片厂商也是变量。
昇腾、沐曦、摩尔线程这些芯片,眼下软件栈不够成熟,需要硅基流动这样的中间层做适配。
可万一哪天芯片厂商自己把统一软件栈做出来了,中间层的价值还剩多少?
它的股东名单,其实已经很说明问题。
阿里、华为、美团、商汤、创新工场……一张AI产业链地图,里面有些角色,既是股东,又是供应商,还是竞争对手。
对这些产业资本来说,这笔账怎么算都不亏。
自家MaaS跑出来了,是主营业务的胜利;“独立中间层”这个物种真跑通了,就通过股权分一杯羹,横竖都不亏。
硅基流动140倍PS的估值,本质上押注的是一个时间差。
在国产芯片自研软件方案成熟之前、在竞争对手补齐中立能力之前、在大厂把多模型平台做起来之前,先把位置占住。
但时间差是有保质期的。
招股书披露,截至2025年末账面现金及现金等价物1.72亿元、定期存款1亿元;2026年内公司密集完成A+、B、B+三轮融资,合计融资约14.8亿元,七轮累计融资约19.5亿元,家底不算薄。
但这笔钱能撑多久,仍取决于公有云亏损能不能尽快收窄。
Token工厂到底是AI时代的水电煤,还是又一个资本催熟的泡沫,答案可能要等下一轮周期才能揭晓。
本文来自微信公众号“世界模型工场”,作者:世界模型工场,36氪经授权发布。















