当美团、华为开源,与寒武纪市值破万亿发生在同一日

36氪的朋友们·2026年07月02日 19:45
重估中国芯片。

6月30日,中国AI行业迎来了标志性的一天。

美团、华为“撞车”,同日发布开源模型,算力芯片龙头寒武纪盘中突破“10000亿”市值,模型、芯片和资本共振。

美团新一代开源模型LongCat-2.0,总参数达1.6万亿,测试版调用量跻身全球前三。

1.6万亿参数的国产模型并不稀奇,与4月份上线的DeepSeek相当,重要的是这款模型完全基于国产算力训练——它反映的是“国模国芯”深度融合的趋势。

过去虽然也有基于国产算力训练的模型的先例,但还都达不到1.6万亿这种参数量。另一边,绝大多数模型虽然开始探索国产算力推理,但训练部分仍旧依赖英伟达芯片,这也是作为国产算力上市概念股的寒武纪,在横盘超过9个月之后,才向10000亿市值发起冲击的原因。

另一边,当Mythos 5这样的前沿模型,开始变相“出口管制”,越来越多像美团、华为这样的中国公司推出开源模型,给全球“主权AI”用户,提供了多样化的可选项。

01 中国公司领跑开源

公开数据显示,开源大模型生态的增长速度惊人。

根据美国独立研究机构Interconnects AI发布的ATOM报告,从2025年3月到2026年3月,全球开源模型累计下载量从3.39亿增长到20.4亿,同比增长6倍。2024年11月至2026年1月,中、美、欧开源模型使用量占比分别为72.7%、10.4%、16.8%。

OpenRouter上每月前10名的开放模型,按总Token排名。

相较去年,中国同比增长11.9倍,美国4.1倍,欧洲2.5倍,下载量增速天差地别。

中国开源模型当中,阿里Qwen是一股重要的力量,并在过去一段时间持续“霸榜”。2025年9月,阿里Qwen的下载量首次超过Meta Llama;到2026年3月,Qwen累计下载9.42亿次,已是 Llama 的近两倍。

“全球顶尖的八种模型中,三种来自中国。”2025年3月,盖茨在纽约经济俱乐部讲座中提及。实际上,全球最大AI开源社区Hugging Face的榜单上,排名前十的开源大模型绝大多来自中国。

Meta前首席AI科学家、图灵奖得主Yann LeCun也一直对中国开源模型保持夸夸模式,“目前最好的开源模型来自中国,整个研究社区都在依赖它们。”

中国开源模型领跑,得益于人才、效率和国内开源普惠的优势。

清华大学智能产业研究院(AIR)创始院长张亚勤在2026夏达沃斯称,中国AI人才的培养规模约为美国的5倍,同时DeepSeek等依靠算力、电力带来的极致成本效率,正持续放开开源模型的全球竞争力。

中国开源大模型的“划时代”一战,是DeepSeek R1的亮相。

2025年1月20日,DeepSeek发布开源模型 R1。一周后,英伟达股价暴跌约17%,市值蒸发5900亿美元,这在当时被解读为“市场对巨资构建AI大语言模型的合理性和前景产生质疑。”

如AI泰斗吴恩达做出的判断:当时美国遏制中国AI发展,反而倒逼出一条效率极高的“第二增长曲线。”根据DeepSeek技术报告显示,DeepSeek V3模型,训练仅使用了一个由2048块H800组成的集群。

原HuggingFace亚太生态负责人王铁震提到,目前DeepSeek的强化学习训练算法正直接提升着美国实验室的产出效率。“许多中国开源模型权重都运行在美国硬件上。”中国开源模型,也在加速美国闭源模型的进化。

相比之下,闭源模型的控制权在单一厂商手里,也易受到监管约束。

此前,Fable 5 和 Mythos 5“全球下线”。在经过一系列封号、漏洞修复等处理后又重新上线,但开放后的Fable 5系列,非美国公民无法使用‌。‌‌‌

“美国政府对于顶尖模型越来越多的限制,将把更多用户推入中国AI模型的怀抱。”《经济学人》对此举评价道。

阿里巴巴集团主席蔡崇信的观察是,欧洲的高管、科学家,最在意的也是“主权”。他们怕技术被“一键关停”、怕数据交出去就再也收不回。“开源正好能解决这两个问题。模型下载到自己的数据中心,跟原始制造商就没关系了,数据也能留在自己的防火墙内。”

目前,开源成了大模型的“集体信仰”,国内主要模型几乎全数开源:DeepSeek、Qwen、Kimi、混元、小米MiMo等无一例外。

与此同时,中国大模型的迭代速度也越来越快。模型的更新周期,从过去的“半年一代”缩短到“一月数款”。有网友在X上向马斯克提问,“中国大模型预计何时能够达到Anthropic的Fable水平?”马斯克预测(2027年)一季度。

之后,智谱AI创始人唐杰回复马斯克:“用不了这么久。(Won’t take that long)。”

从“追赶者”变为“领跑者”,中国开源模型只用了一年的时间。只不过,在跑得快的同时,中国大模型还得迈过算力自主的第二道坎。

02 重估国产算力

过去很长一段时间,模型训练依赖英伟达的GPU,但随着美国出口管制不断收紧,Hopper系列、Blackwell系列之后的多款先进芯片均被禁止出口到中国。

2025年,黄仁勋多次表态,中国市场的销量将为零。刚刚结束的英伟达2026年度股东大会上,黄仁勋透露,2026财年英伟达来自中国的营收占比已降至约9%。

《金融时报》报道援引一位交易员的消息,称受出口管制的影响,英伟达的非合规产品价格普遍暴涨,RTX 6000 Pro类算力相对较低的产品,价格也已从年初约5万元人民币涨至最高13万元人民币,上涨了160%。

一道又一道出口禁令,迫使大量算力需求向国内释放,给“寒武纪们”创造了最好的市场机会。6月30日,寒武纪盘中市值冲破10000亿,是国产算力被重估的最好说明。

我们在文章开头提到,越来越多的国产模型,在推理层面引入国产算力。

4月底上线的DeepSeek V4,其技术报告首次将昇腾NPU与英伟达GPU并列验证,这是DeepSeek把推理路径从单一硬件依赖中解耦出来的尝试。与此同时,完成超500亿融资之后,DeepSeek也开始推动数据中心建设,这相当于国产算力的增量空间。

梁文锋想“烧”多少钱,国产算力就有多大机会。

6月17日,智谱上线并开源新一代旗舰大模型GLM-5.2,昇腾、平头哥、摩尔线程等国产算力平台当天即完成“Day 0”级别推理适配,在国产芯片集群上实现高吞吐、低延迟、大并发的稳定运行。

越来越多的中国模型开始释放需求,但国产算力的供给也面临挑战。

“一卡难求,包括我自己,我们虽然生产卡,但是我想用卡也很难。” 华为昇腾内部专家在一次沟通会上表示。

2025年初,由于市面上还能抢到英伟达和AMD等提供的合规产品,彼时业内对国产卡的态度几乎都是“好不好用”的问题;但在过去一年多海外算力断供的真空期,中国大模型面临的则是“不得不用”的问题。

如果说DeepSeek们在推理上迈出了匹配国产算力的关键一步,美团则是通过1.6万亿参数的Long-Cat 2.0上,打开了国产算力训练的想象空间。

中国算力和中国模型的融合,走了很长一段时间,像是《荷马史诗》里那场十年的“奥德赛时期”——漫长、又充满着不确定性。

本文来自微信公众号“腾讯科技”,作者:值得关注的,36氪经授权发布。

+1
7

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

Intel 版 Mac 的“退场”又迎来一个标志性节点。

3小时前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业