霸榜全球大模型,力压Claude、GPT,MiniMax凭什么?

世界模型工场·2026年03月13日 16:33
大模型行业的比赛规则正在改变。
我要联系

MiniMax M2.5连续霸榜全球! 

OpenRouter实时数据显示,这款由Minimax在2月12日发布的模型,自发布以来一个月,始终居于全球大模型周调用量排行榜第一。

它压过的,不是一些普通模型,而是Gemini、DeepSeek、Claude等旗舰模型。

来源:OpenRouter LLM Leaderboard(2026.2.12-2026.3.12)

这个榜单的特别之处在于,它不是实验室跑分,也不是社交媒体热度,而是OpenRouter基于数百万用户真实使用数据形成的排名。

为什么一款“不是最聪明”的模型,能让全球开发者用脚投票?

01 MiniMax为何全球第一?

很多人第一反应,MiniMax M2.5是靠便宜赢的。

相较于美国大模型,它的确是“价格屠夫”。

OpenRouter实时定价显示:

MiniMax M2.5:输入0.27美元/百万Token,输出0.95美元/百万Token。

Claude Opus 4.6:输入5美元/百万Token(约18倍)、输出25美元/百万Token(约26倍)。

一位海外开发者在X上算了一笔账:“跑OpenClaw连续1小时(100 TPS),MiniMax M2.5只要1美元;换Claude一天可能烧几百美元。”

还有网友将MiniMax M2.5称为“Claude Opus 95%性能的便宜版”,表示“差距不是钱,是生存”。

正是这种“用得起”的门槛,把MiniMax M2.5推上了榜首。

但MiniMax M2.5不只是便宜,真正特别的地方在于,这是一款从一开始就不是为“聊天”设计的模型,而是为编程、工具使用、搜索、办公这些真实工作流去做的。

过去很长时间,大模型最主要的使用方式还是聊天、问答、写作辅助,模型之间拼的是谁回答得更自然、推理更强、综合能力更高。

但到了今年,增长最快的一类需求已经变成了Agent(智能体):让模型能自己去搜资料、调工具、改代码、读网页、写文档、跑流程。

OpenRouter的AI应用榜单,清晰地呈现了这种变化。

最近一个月,排在最前面的就是OpenClaw,累计消耗9.62T tokens;紧接着是Kilo Code的5.06T tokens、BLACKBOXAI的2.01T tokens,清一色都是Agent(智能体)产品。

来源:OpenRouter Top Apps(2026.2.12-2026.3.12)

在这样的背景下,MiniMax M2.5的胜出就不难理解了。

MiniMax M2.5采用MoE架构,推理速度快、延迟低,上下文窗口197K,完美匹配Agent长工作流。

在Agent场景里,一个任务要连续调用很多轮,价格差会被成倍放大。

而MiniMax M2.5刚好适合Agent,而且更便宜,完美满足了Agent“高频调用、低成本执行”的需求曲线。

在Reddit和LocalLLaMA社区,开发者们的实测反馈好评如潮:“像Claude Sonnet一样懂工具调用,但多步工作流干净太多”、“它是OpenClaw的主模型,性价比直接把Claude干掉”。

更巧合的是,MiniMax M2.5发布正值开源Agent框架OpenClaw爆发。

MiniMax官方率先上线“OpenClaw专区”教程,OpenClaw文档甚至把MiniMax M2.5列为推荐模型。

在这一波“养龙虾”热潮中,MiniMax直接吃到了OpenClaw爆发的红利。

数据显示,OpenClaw正是MiniMax M2.5月调用量最大的单一应用贡献者之一。OpenClaw的爆发,进一步把MiniMax M2.5推上了神坛。

02 MiniMax霸榜是昙花一现吗?

如果说MiniMax M2.5吃到的是短期流量,那么大概率很快就会回落。但它现在踩中的,是AI应用的主方向。

无论是MiniMax,还是DeepSeek、Kimi、阶跃星辰、Google、Anthropic、OpenAI,全球各大模型公司都在押注Agent,这条路线已经越来越成为行业共识。

对于押对了方向的MiniMax来说,显然具备先发优势。

一旦开发团队围绕MiniMax M2.5,把prompt、tool calling、长上下文处理、多步执行和成本预算跑顺了,切换到其他模型就不只是“换一个脑子”那么简单,而是整套工作流和账单都要重算。

除非替代者明显好很多,否则很多开发者并没有足够动力为一小截性能提升,去承受更高的成本或重新调试的麻烦。

当然,这种优势能不能持续,还要看MiniMax自己是不是跑得够快。

官方模型更新记录显示,2025年12月,MiniMax的模型还是M2.1,到了2026年2月已经发布了M2.5,迭代速度显著超越Anthropic、OpenAI、Google等海外巨头。

这意味着MiniMax在很短的周期内强化了开发者最在意的能力,M2.5的升级方向也清楚地表明在往Agent密集的场景去打磨。

尽管如此,一场围绕Agent的模型混战已经开始加速。

OpenRouter最新公开榜单上,Step 3.5 Flash、Gemini 3 Flash Preview、DeepSeek V3.2、Claude Opus 4.6都在拼命追赶。

比如,阶跃星辰(Step 3.5 Flash)的优势非常直接:免费。

这个策略的杀伤力很强,因为大量开发者和团队还处在试验期,Agent工作流也远没有完全定型,谁能先把试用门槛打到最低,谁就更容易把人拉进来。正因如此,Step 3.5 Flash的调用量迅速抬升。

再比如,Kimi K2.5,它的定位和M2.5一样,明显不是只做聊天,而是朝复杂工作流、工具调用和长链路任务,也在争夺同一类Agent/研究/编程的用户。

所以接下来,MiniMax要拼的不是在榜单上冲得更快,而是能不能把“调用量”沉淀为“Agent默认选项”,并将其变成长期的真金白银。

03 模型霸榜能转化为商业回报吗?

事实上,MiniMax的商业化能力一直为外界称道。

在“大模型烧钱”的普遍焦虑里,MiniMax率先证明了大模型未必只能在“收入增长”和“大幅亏损”之间二选一。

2025年,MiniMax收入同比增长158.9%至7904万美元,经调整净亏损为2.509亿美元,仅同比增加2.7%,毛利率则从12.2%提升到25.4%。

对比同样在港股上市的智谱,后者2025年上半年收入1.909亿元人民币,但经调整净亏损达到17.52亿元人民币,亏损强度明显更高。

在目前已披露数据范围内,MiniMax的经营效率改善更早显现出来。

再来看MiniMax的收入结构。

其中一块是AI-native products(面向终端用户,如海螺AI、Talkie等产品),2025年收入约为5310万美元,占比约2/3。

另一块是Open Platform和其他企业服务(面向B端用户,如模型API、开放平台、企业定制等),2025年收入约2596万美元,占比约1/3。

这表明,MiniMax不是只靠一个榜单上的热门模型赚钱,也不是只靠单一App变现,而是把模型能力同时接进了前台产品和后台平台服务两条线。

MiniMax M2.5作为现阶段最能打的主力大模型,不只是抬高MiniMax自家产品矩阵的能力上限,还在推着平台收入往上长。

2026年前两个月,MiniMax的业务进展已呈现出明显加速态势,模型调用量与新增用户规模均出现跃升。数据显示,M2系列文本模型在2026年2月的平均单日Token消耗量已较2025年12月增长6倍以上。

这恰恰是MiniMax商业化里最值得注意的一点。

很多模型公司也有热度,也能在开发者圈里冲出一轮声量,但最后掉下去,问题往往不是模型不够强,而是它们没有把模型能力转换成一个可收费的商业闭环。

MiniMax不一样,它披露自己70%以上收入来自国际市场,2025年的增长很大程度也来自中国以外的销售。

这表明MiniMax不是只在中国开发者或中文互联网里热,而是已经在更大范围里被用户买单。

资本市场显然也看到了这一点。3月10日收盘,MiniMax市值首次超过百度。

04 结语

MiniMax M2.5这轮霸榜,真正值得关注的是并不是排名,而是大模型行业的比赛规则正在改变。

2026年,市场已经在用另一套更现实的标准投票:谁更适合接进Agent,谁能把成本打下来,谁能让开发者和企业真的用起来?

某种意义上,这场比赛比的已经不是谁更像未来,而是谁更早把未来做成生意。

本文来自微信公众号“世界模型工场”,作者:世界模型工场,36氪经授权发布。

+1
47

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

报道的项目

MiniMax
我要联系
人工智能技术研发商

下一篇

一夜之间,OpenClaw就从一个技术圈爆红的开源项目,变成了一场平台和生态都不愿错过的争夺战。

1小时前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业