小米不想“贱卖”token
最近,小米宣布MiMo大模型面向全球开发者推出Token Plan订阅套餐,雷军亲自发微博官宣:Max档659元/月,面向国际开发者定价100美元/月,与Anthropic Claude Max 5x相同。同一天,雷军发文称MiMo大模型前一日调用量突破1万亿Token。
作为一家从手机做到汽车,制造业基因极强的公司,如今把大模型订阅套餐价格直接锚定全球AI第一梯队,这在行业里还是唯一一家,也引起了不少的争议。仔细看,Mimo Token Plan的订阅制,和大模型行业惯用的订阅制还有一些根本上的不同。
01 罗福莉的发声,不踩Anthropic踩过的坑?
MiMo Token Plan发布三天后,Anthropic宣布禁止Claude Pro和Max订阅用户通过OpenClaw等第三方Agent框架调用。
MiMo大模型负责人罗福莉随即在社交平台发布长文,详细分析了这件事。
她首先解释了Anthropic的困境。Claude的订阅制(Pro 20美元/月,Max 100-200美元/月)原本是为个人用户的正常使用强度设计的,但OpenClaw等Agent框架的调用模式完全不同:在单个用户查询中,框架会以独立API请求的形式发出多轮低价值的工具调用,每个请求都包含超过10万Token的上下文窗口,即使命中缓存,这也是一种浪费,在极端情况下还会拉低其他查询的缓存命中率。
她表示:“实际每次查询的请求数比Claude Code自身的框架高出数倍。换算成API定价,实际成本可能是订阅价格的几十倍。这可不是小差距,而是天壤之别。”
换句话说,Claude订阅制的本质问题是:固定月费无法覆盖Agent场景下的实际算力消耗。用户付200美元,却用掉了几千美元的计算资源。
罗福莉由此引出MiMo Token Plan的设计逻辑。她说,Token Plan支持第三方框架接入,但按Token配额计费,“与Claude新推出的额外使用套餐的逻辑相同”。这意味着用户用多少付多少,不会出现订阅制下“薅羊毛式”的成本倒挂。“我们的目标是长期稳定地交付高质量的模型和服务,而不是让你冲动付费后就弃用。”
她也扮演了一次行业定价的“吹哨人”角色:“我建议LLM公司在弄清楚如何在不造成资金流失的情况下为Coding方案定价之前,不要盲目地竞相压低价格。以极低的价格出售Token,同时对第三方敞开大门,这看起来对用户很有吸引力,但这却是一个陷阱——Anthropic刚刚摆脱的那个陷阱。”
这篇帖子浏览量超过71万,引发了大量讨论。有开发者认同她对OpenClaw上下文管理低效的判断,有人指出Anthropic此举本质上是在保护自家Claude Code的护城河,也有人对MiMo Token Plan本身的Credit换算机制提出质疑。
02 现实的挑战
100美元的定价有一定的合理性。MiMo-V2-Pro的API价格(输入1美元/百万Token,输出3美元)约为Claude同级模型的五分之一,在性价比上确实有竞争力。两周免费推广期间,MiMo-V2-Pro在OpenRouter上单周Token消耗量突破4万亿,日榜、周榜、月榜均排名第一,编程领域市占率一度超过30%。
但挑战来得很快。免费期结束后,MiMo-V2-Pro在OpenRouter上的周调用量从高峰下滑。OpenRouter上的规律比较直接,在达到一定性能阈值后,谁便宜或免费,谁就有可能冲到榜一。它的排名证明了模型能力和可用性,但是同时,调用量受是否免费的影响巨大。
MiMo Token Plan四档方案从39元/月到659元/月,Max档国际定价100美元/月。按Credit换算,MiMo-V2-Pro消耗1 Token等于2 Credits,Max档1600M Credits约等于800M Token的Pro模型调用量。
这个价格对标的是Anthropic Claude Max 5x套餐(100美元/月),后者提供Pro版5倍的使用额度。MiMo Token Plan没有行业普遍存在的5小时使用限额,支持集中消耗Token。
开发者社区的争议也不少。有用户在社交网络上拆解了小米Token Plan的实际消耗:由于Credit倍率机制(Pro模型1 Token消耗2 Credits,超过256K上下文则消耗4 Credits),加上Agent框架大量使用缓存Token,入门套餐的实际可用量远低于字面数字。
也有开发者反馈MiMo-V2-Pro在复杂推理上偶尔出现“无限循环”,以及内容审核系统误拦截正常API调用的问题。
腾讯科技向小米官方求证, Credits到底如何折算为不同模型、不同上下文长度下的真实 token使用量,是否有完整公开的计算逻辑?但截至发稿,未得到官方的回应。
但是从罗福莉的公开发声来看,对“大模型订阅制”算不清账的问题已经提出了质疑,不“贱卖Token”,希望用健康的现金流来换取模型能力的稳定迭代、用户的持续使用,是基本态度。
图:免费期结束后,MiMo-V2-Pro在OpenRouter上的周调用量从高峰下滑。
理想很丰满。但是,从免费到付费的转换率,是所有大模型公司面临的共同难题。从免费到付费切换的过程,也往往会面临最大的争议,MiMo能否在付费的前提下保持用户黏性,是接下来几周最值得观察的数据点。
03 唯一还在做基座大模型的手机厂商?
在小米高调推自己的大模型的同时,也引出了一个疑问,大模型业务之于小米,到底意味着什么?
回到更早的时间线。2023年,雷军推动成立大模型Core团队。同年5月,根据媒体的公开报道,小米曾公开表示“小米不会做ChatGPT,不搞AI的军备竞赛”。
但小米的态度在悄悄发生转变。
2025年4月,MiMo-7B开源;11月,前DeepSeek研究员罗福莉加入,出任大模型负责人;12月发布MiMo-V2-Flash。2026年3月19日凌晨,三款模型同步发布:万亿参数的MiMo-V2-Pro、全模态的Omni和语音合成TTS。发布前,Pro的早期版本以“Hunter Alpha”代号匿名上线OpenRouter,七天突破1万亿Token调用量,一度被社区猜测为“DeepSeek V4”。不到一年,小米的大模型从7B参数走到了万亿参数。
据接近小米的人士透露,小米内部开始认为“大模型是未来科技公司必须要有的能力。小米未来所有产品端的能力,需要有一个主模型去控制、去培养、去指导。这个主模型必须是自己的。因为只有自己拥有,才能决定你的用户习惯、你的输入数据不交给第三方。”
手机、汽车、IoT设备产生的海量用户数据是最核心的资产,如果基座模型依赖第三方,数据主权和产品迭代节奏都将受制于人。
从组织架构看,大模型Core团队归属小米集团技术委员会,不隶属于手机部或汽车部。据了解,小米副总裁曲恒负责管理这条线,但罗福莉拥有很高的独立性,她加入后按照自己的想法组建了团队,核心成员平均年龄25岁,清北毕业生占比超六成。团队运作有较高的自主性。
从财报及管理层对外发声也可以看出,研发投入规模也在快速攀升。小米2025年全年研发开支331亿元,同比增长37.8%,接近全年经调整净利润392亿元。据小米总裁卢伟冰在业绩会上的表述,AI投入约占研发总额的四分之一。
雷军在MiMo-V2-Pro发布当天宣布,2026年小米在AI领域的研发和资本投入将超过160亿元,未来三年至少600亿元。资本开支方面,2025年前三季度累计约130亿元,同比增长86.7%,卢伟冰明确表示增量主要来自汽车和AI。算力上,小米采取自建万卡GPU集群加金山云合作的混合模式。
从行业横向对比来看,小米的选择是孤独的。华为盘古大模型主要通过鸿蒙系统实现端云协同,vivo蓝心大模型服务于OriginOS的AI助手,OPPO安第斯大模型升级了小布助手,荣耀走AI终端生态路线。这些厂商的大模型都是“AI服务于手机”,没有一家独立运营API平台或对外售卖模型订阅。包括苹果、三星在内的全球手机巨头,也没有对外直接提供服务的基座大模型。
vivo副总裁周围的公开表态也许可以代表了多数厂商的态度:未来手机可能进化为“智能体”,但实现路径不一定需要自研基座模型,接入第三方大模型同样可以。
04 大模型成为又一个主线业务?
从种种公开信息来看,大模型之于小米集团,正在发生一些微妙但关键的变化:它不只是一个服务于手机和IoT的底层能力,开始具备向一条独立业务线演进的结构性条件。最直观的信号,是产品形态的变化。
小米已经推出了面向开发者的API平台,并配套提供分层的Token订阅方案。无论规模大小,这一步本身,就已经越过了传统“技术中台”的边界。
雷军曾在公开场合明确提出,小米计划在2026年实现一次关键性的技术整合:在一款终端产品中,让自研芯片、操作系统与AI大模型完成协同落地。
至今为止,能同时覆盖这三层能力的公司并不多。华为通过麒麟芯片、鸿蒙系统与盘古模型,已经形成过相对完整的技术闭环;苹果公司则长期在芯片与操作系统上建立深度一体化,并正在强化其端侧AI能力。
小米如果完成这一组合,也许能进入一个截然不同的竞争维度。
但如果把视角拉回财报,情况又显得克制得多。
根据披露,小米将AI相关业务与智能电动汽车一同归入“创新业务”板块。2025年,该板块收入为1061亿元,其中汽车贡献了约1033亿元,AI相关收入尚未被单独披露。产品和形态已经在向独立业务靠拢,但公开财务信息上还未完成验证。
当小米将高阶订阅方案定在与Claude相近的区间,并开始质疑行业普遍推行的订阅制的时候,目的可能未必在于“价格竞争”。通过锚定头部模型,主动进入同一层级的市场叙事,证明“上桌的能力”可能更为重要。
本文来自微信公众号“腾讯科技”,作者:值得关注的,36氪经授权发布。















