大模型六小龙告别青春期
2026年也将成为大模型六小龙真正的成长分水岭,技术、场景和资本三个因素将共同决定这几家公司成年之后的走向。
不到一个月的时间,大模型六小龙中的五家都集中进行了新一轮的战略表态。
月之暗面今天发布了新模型Kimi2.5,其创始人杨植麟在2025年12月31日发布了一封全员信,公开公司完成新一轮5亿美元融资,并表示会让Kimi成为一个「与众不同」和「不被定义」的大语言模型。1月26日,阶跃星辰公布了超50亿B+轮融资,并宣布前旷视科技创始人印奇出任公司董事长,明确押注AI与智能终端的融合。
百川智能在1月13日开源了新一代医疗大模型Baichuan-M3,王小川表示百川智能还有30亿资金储备,并将在2026年上半年发布AI医疗产品。然后是智谱和MiniMax在1月初先后登录港股,完成了对创业公司来说非常重要的一个阶段性任务。
智谱和MiniMax的上市,无疑是触发这一轮六小龙集中表态的直接原因。在一场进入淘汰阶段的竞争中,同行的伙伴更早实现了公司成长的里程碑,其余人就必须要向自己的员工、支持者和市场展示自己留在牌桌上的实力。于是,月之暗面抢先宣布了新一轮融资,然后阶跃星辰又拿出了超过月之暗面、智谱和MiniMax的50亿融资额度。
但长期来看,这一轮集中表态更像是大模型六小龙告别青春期的宣言。2023年、2024年,大模型六小龙还有一种恰同学少年的感觉,致力于做出中国的「OpenAI」。但进入2025年,错失估值锚点、巨头持续加压、资本主流叙事转向AI应用、技术范式发展放缓等变化,让他们开始更现实地思考生存和发展的问题。
过去一年,大模型六小龙在追求技术极限的理想与实现商业价值的现实之间进行了一轮重新校准。有人在过去一年收缩产品投流,重新回归模型研发;有人选择放弃通用大模型,聚焦垂直领域;更多人在坚持模型训练的同时,开始更积极地向市场证明自己拥有建立确定性的商业路径的能力。
不同的选择往往会带来不同的竞争环境与创业心境。选择继续押注大模型的突破,是一场豪赌,坚持理想主义往往需要更高的心气和更大的风险。选择聚焦垂直领域,也并不会规避竞争,反而需要直面落差,甚至更大的勇气。选择兼顾通用模型与商业成功是现实、稳妥且必然的选择,但常规选项总会让人觉得少了几分锐气。
新一轮的集中表态也预示着,2026年各家会在已经选好的差异化路径上拉开更大的距离。DeepSeek和Gemini在2025年的成功经验告诉我们,无论国内还是海外,AI行业都未到终局。大模型六小龙走出青春期,才开始直面更复杂的行业竞争。
上市也好,融资也罢,都是继续上路之前的一次大规模补给。
01
竞争的复杂度提升了
理想和现实的矛盾是青春期的一个主要标签。在2025年这种矛盾感越来越多的出现在大模型六小龙身上。一方面,大模型六小龙的理想都是要抓住AI带来的颠覆性变革机会,成长为新一代的Google、阿里和腾讯。另一方面,现实却在不断增加他们实现理想的挑战难度,将成为科学家的理想层层削弱到成为物理老师的现实。
DeepSeek的开源发布动摇了大模型六小龙的估值锚点。DeepSeek不但证明了强化学习具备更高的上限,还将开源模型的能力提升到了可以比肩世界顶尖大模型的阶段。大模型六小龙的「科学家理想」被泼了一盆冷水,在2025年初就开始直面更强烈的现实冲击。
而且,这就像一场多人参与的井字棋游戏,大家都在争夺的关键位置突然被人抢在手中,剩下的人不得不去重新考虑该抢占哪个新的位置。DeepSeek之后,即便智谱、月之暗面、MiniMax都在继续推出新的模型,但始终没能在技术层面实现对DeepSeek的声望反超。
反而是,DeepSeek催化的AI普及浪潮,打乱了大模型六小龙的发展节奏,将其带入了更复杂的竞争环境中。这尤其体现为大厂在2025年增强了AI方面的资源投入力度,在模型能力、AI产品等方面展开全方位竞争,进一步挤压了大模型六小龙的成长空间。
首先,2025年的AI竞争更强调模型、产品与运营能力的协同。大厂们一面不断提升豆包、通义千问、混元等基础模型的能力,一面迅速将模型能力注入到自己的AI产品中,通过运营动作在C端建立起用户认知。豆包是其中的佼佼者,通过对话、修图到视频通话、豆包手机助手等模型与产品的结合,建立了大众层面的认知优势。
相较而言,大模型六小龙虽然也在模型、应用层面做出了一些不错的成绩,但他们在用户运营和大众关注度的获取上却明显处于劣势。一个明显的变化是,创始人闫俊杰2024年初还在给MiniMax制定产品用户规模翻十倍,单个产品DAU突破千万的目标,到2025年,DAU在MiniMax的定义中已经成为了一种「虚荣指标」。
其次,开源大模型的成功,将面向B端的AI竞争快速推向了比拼模型+工程化能力的阶段。智谱CEO张鹏就曾提到,DeepSeek上线之初给智谱带来了客户流失。一些客户选择自己部署开源模型,但最后发现运维成本、算力成本比买Token还贵。服务B端客户需要兼具模型能力、工程化落地能力以及低成本的算力。
最后,资本环境在2025年发生了变化。零一万物创始人兼CEO李开复2025年曾表示,国内和海外的投资人都更乐于投资消费者应用、企业应用、AI基础设施类型的创新企业,不再投入基座模型。现实情况也可以看到,继续融资的两家大模型企业这一轮拿的主要都是地方国投的钱,而不是更市场化的资本。
02
重新校准理想与现实
竞争环境的复杂化反过来又推动大模型六小龙各自在2025年对自己的发展规划进行了重新校准,以求找到一条更符合自身现状的成长路径。辅助其校准的参照物既包括国内大厂的发力方向、资源投入和运营效率,也包括来自美国同行的技术判断和商业探索。
第一条路径是继续重压基础模型。大模型六小龙中,月之暗面还在继续坚持自身的热血和理想,按照自己的节奏重新专注于模型训练。
在被DeepSeek泼冷水之前,月之暗面是投流大战的主要参与者之一,希望借此快速建立起C端产品与模型训练的循环。有数据显示,2024年3月至11月,Kimi的广告投放金额曾超过6亿元,单月最高投放近5000万元。
但现实并未让月之暗面如愿以偿。月之暗面在产品投流上先是遇到了更敢花钱的豆包,然后又见识了腾讯对元宝的大规模投入,直接导致投流策略折戟。在模型能力上,Kimi曾凭借超长上下文在大模型产品中一时风头无两,但DeepSeek的出现直接让Kimi的风头归零。
2025年上半年,月之暗面就决定停止大规模品牌投流,将资源集中于底层模型研发,杨植麟还会亲自下场写代码。7月,月之暗面发布并开源了万亿参数的MoE模型Kimi K2,首次拥抱开源和MoE架构。11月举办的一场AMA活动上,杨植麟再次强调要专注于模型训练,但会不断更新Kimi.com ,使其包含最新功能。
第二条路径是冲刺上市,以此来牵动业务的调整。智谱和MiniMax则在2025年开始推动上市,并借此将公司推入一个新的发展阶段。
相较侧重to C的MiniMax,侧重to B和to G的智谱在2025年有更大的调整变动。2025年上半年,智谱有5位高管先后离职,其中包括COO张帆。同时,智谱将to B与to G业务结合,收缩了对C端业务的投入。
技术路线上,智谱也在DeepSeek的冲击下,放弃了此前坚持的稠密模型,转向MoE架构。这个转换被张鹏视为调整伴随的最大风险项。在7月发布的GLM-4.5模型上,智谱完成了关键技术的迭代。同时,智谱还在启动上市之前,迅速拿下了五轮地方国投的融资。
MiniMax的优势在视频、语音等多模态模型上。基于这些模型,MiniMax建立起了面向C端市场的业务基础。MiniMax、海螺AI、MiniMax语音、Talkie等AI等原生应用为MiniMax贡献了七成的收入。在2025年,MiniMax也完成了C端收入支柱的切换,Talkie收入下降的同时,海螺AI的收入快速涨了上来。
第三条路径是收缩战线,聚焦垂直领域。六小龙中,零一万物和百川智能都在2025年3月果断选择放弃通用大模型的训练,将有限的资源投入到对垂直领域的开拓中。
李开复的判断是,从商业角度考虑,未来只有大公司能做超大模型。王小川则表示百川智能在创业之初被裹挟着干了很多医疗以外的事,但事实证明自身不具备开拓多条战线的能力,就选择只做医疗。
同时聚焦垂直领域,二者的思路也不尽相同。李开复为零一万物选择的方向是做平台,为企业做私有化部署,像是要做一个基础模型层上的工程承包商。王小川做医疗,还是从基础的模型做起,在模型能力基础上尝试去改变医疗行业。他认为,AI医疗行业已经到了爆发的节点,百川智能也开始能够给大家交付东西了。
第四条路径是拥抱终端,寻找横向落地场景。刚刚完成融资的阶跃星辰,在2025年就开始将业务重心倾斜向多模态大模型与硬件场景的结合上。
世界人工智能大会期间,阶跃星辰展示了与千里科技、吉利深度合作研发的AgentOS智能座舱,阶跃星辰的端到端语音模型被集成在上面。同时,阶跃星辰还与OPPO、荣耀、中兴达成合作,将自家模型装载到了4200万台手机上。
AgentOS智能座舱
03
生命力来自技术和场景的长跑
经历了2025年的重新校准,大模型六小龙都重新找到了自己的路,并且在2026年的第一个月筹集到了足够继续赶路的资源。
2025年的种种调整和2026年的选择将共同决定这几家公司成年之后的走向。这也会让2026年成为大模型六小龙真正的成长分水岭,而技术、场景和资本三个因素将共同完成对未来走向的定位。
技术依然是AI竞争中的核心变量。DeepSeek的成功和Gemini的翻盘都表明,AI行业的定局远未出现,未来依然存在依靠基础模型突破,一跃跻身最前列的机会。并且,在业内认识的判断中,AI领域会出现新的技术范式。这种技术范式的变化,会增强依靠技术优势实现翻盘的几率。
还在牌桌上、并且刚刚获得新一轮资金储备的大模型企业,依然有技术叙事可讲。这也是为什么,除了月之暗面要追平世界前沿,甚至在「审美」和「价值观」上定义下一代AI,而上市的智谱、MiniMax,没上市的阶跃星辰,也都依然在强调模型研发的原因。
可以看到,智谱首席科学家唐杰在上市后的内部信中表示,2026年将在技术领域聚焦全新的模型架构设计、更通用的RL(强化学习)范式,以及对模型持续学习与自主进化的探索。阶跃星辰要在基座模型能力上重返第一梯队。MiniMax此前就将重点从「模型与产品并重」调整为「模型优先」,并且在增加数学与编程的比重。
技术的价值,最终要通过场景来兑现。大模型六小龙都在聚焦更精准的场景,技术和场景两个点连接起来,就已经能描画出他们各自不同的前进路径。这些路径不是要通过流量灌注实现催熟,而是在寻找真正能长久经营的生意。
智谱很明显因为将模型技术与to G进行了链接,获得了稳固的业务落地场景。同时,智谱还在与月之暗面、MiniMax一同竞争面向小B和专业个人的生产力场景,通过推出Agent产品来寻找打造AI时代Office套件的机会。阶跃星辰和百川智能分别选择了智能终端和医疗场景进行深耕。
同时,场景的持续深耕会带来更多技术需求,反过来也会影响到模型的下一步训练。在这种循环往复中,大模型六小龙的差异会变得更大。
资本因素则决定了由技术和场景确定的路径能够延伸多远。目前来看,大模型六小龙手里的资金并不算充足。
一方面,大模型的研发和场景的打磨与拓展都需要资金提供支撑,且实现突破或形成稳定造血能力所需的时间并不确定。这种消耗不是一个小数目。MiniMax就在招股书中预计,每月现金消耗为2790万美元。
另一方面,来自大厂的竞争压力正在快速增加。随着大厂在AI云、模型能力、入口级应用等多个方向上的全面发力,留给大模型六小龙的生存空间和机会窗口会进一步被挤压。大模型六小龙要在大厂的竞争压力下继续校准自己的发展路径,最终找到自己的生存空间,也需要继续争取资本支持。
智谱和MiniMax选择上市来解决资本问题,但也会受到来自二级市场的更大的市值管理压力。一旦上市,公司的经营决策可能就不会保持作为创业公司的纯粹。同时,从团队上看,上市和创业可能是两种状态,如何在上市之后继续维持企业的创业惯性,也将影响其对技术和场景的探索。
选择继续依靠一级市场补血的月之暗面和阶跃星辰,也会面临更大的资金压力。到了这个时间节点,能够继续跟投、并愿意相信他们的资本已经很少,他们需要拿出更惊人的技术研发和场景拓展结果来说服这些巨鳄。
机会很小,但并不是没有。在新一轮融资宣布之后,近期月之暗面就又传出了获得又一轮融资的消息。
面向未来,已经走出青春期的大模型六小龙与大厂竞争的是同样的几张船票,会有六小龙掉队,也会有大厂降格,而这些都是自然成长过程的一部分。
本文来自微信公众号“窄播”,作者:李威,36氪经授权发布。















