免费AI,悬了

36氪的朋友们·2026年04月10日 21:53
“‘哑铃型’商业范式可能成行业共识”

9日,腾讯云官宣自2026年5月9日起,AI(人工智能)算力相关产品服务价格将上调5%。

就在一天前,智谱正式发布和开源其GLM-5.1模型,模型聚合平台OpenRouter显示,智谱GLM提价10%。同日,DeepSeek上线了“专家模式”,将输入框分为“快速”和“专家”两个入口。4月7日,阿里千问也升级了“深度研究”能力,新增财经分析模块。

这引发市场猜测:AI模型以后还能不能免费使用?

全免费模式或难维系

北京华夏工联网智能技术研究院院长王喜文对中新经纬表示,随着模型升级,“全免费、无分层”的模式注定难以为继。

王喜文解释,大模型推理成本随参数、用户量、调用复杂度线性上涨。训练、算力、运维、研发均是巨额投入,顶级模型单次训练成本高达几千万美元。免费模式下,平台易因资源不足出现频繁宕机。

“DeepSeek这次产品分层反映了成本与算力的现实约束。”上银数字经济混合发起式基金经理惠军认为,大模型推理属于重资产物理消耗,直接关联GPU(图像处理器)集群的运转和电力账单,且成本随着模型规模的增长呈现指数增长,“全免费、无分层”逐渐成为一种不可持续的模式。产品分层是算力供给约束下的理性调整。

惠军提到,C端(用户端)真实请求中大概80%以上可以用成本较低的“快速模式”来覆盖,剩下20%的复杂请求才需要调用大参数的“专家模式”,分层机制可以实现算力分层调度。

加拿大皇家科学院院士李明对中新经纬表示,AI在执行生成等任务时,需要消耗大量电力。如果不向用户收费,企业难以承担这笔开销。他解释,过去谷歌非AI搜索一次耗电0.3瓦时,电费成本靠广告收入足以覆盖。而如今AI一个query(推理)耗电18瓦时,用电量是原来普通检索的60倍。

EPRI(电力研究协会)发布的报告显示,据估计,训练一个像GPT-3的模型将耗费近1300兆瓦时(MWh)的电力。这大致相当于美国130户家庭一年的用电量。而训练更先进的GPT-4,其耗电量估计是GPT-3的50倍。总体而言,维持人工智能增长所需的计算能力大约每100天翻一番。

在2026中关村论坛年会上,智谱CEO张鹏对于最近公司的提价表示,调整价格是为了回归正常的商业价值,长期低价竞争不利于行业发展。

“行业已从烧钱获客转向商业化变现,智谱、Kimi等提价、推付费会员,正是信号。”王喜文认为,未来免费模型将满足轻量需求,付费才可解锁高速、长文本、专业能力。

3月31日,张鹏在2025年度业绩媒体发布会上提到,智谱API调用定价在一季度提升了83%,即便如此,市场依然呈现出供不应求的情况,调用量增长400%。

诺安基金科技组基金经理刘慧影对中新经纬表示,国产大模型的技术能力正在持续提升,其实用价值和商业吸引力显著增强,这为厂商提供了调整价格的基础。

从供需结构来看,以阿里云CodePlan(AI编程订阅服务)、智谱CodePlan为例,即便在价格上调的情况下,相关产品依然处于供不应求的状态。因此,本轮价格调整既是国产大模型价值兑现的体现,也在一定程度上反映了算力短缺的结构性压力。

“‘哑铃型’商业范式可能成行业共识”

“根据企业公开信息,国产领先的前五大模型公司,已经推进产品分层和价格差异化措施。”银河文体娱乐混合基金经理卢轶乔举例,在多模态生成功能上有较大提升的Seedance 2.0模型已对申请试用者进行了用户分层,免费用户需排队等候。

目前来看,几家主流模型厂商已经推出了较完善的付费订阅模式。据中新经纬梳理,今年3月,MiniMax已将原有的Coding Plan升级为支持MiniMax全模态模型的Token Plan,基于此,用户可以在OpenClaw中安装MiniMax模态工具集Skill,创作空间可拓展。

MiniMax模型套餐 来源:MiniMax公众号

智谱的付费订阅以Coding Plan和API调用为主。2月12日,智谱发布GLM Coding Plan价格调整函:取消首购优惠,保留按季按年订阅优惠;套餐价格进行结构性调整,整体涨幅自30%起;已订阅用户价格保持不变。

据Kimi公告,其支持会员连续订阅并提供自动续费功能,包括但不限于连续包月、连续包年等。1月26日,Kimi更新会员权益说明,免费版用户每月可获得1次深度研究、3次OK Computer(Agent模型)、3次PPT的使用次数;付费会员支付不同费用可在每月享受不同次数的相应服务。

据DeepSeek官网,目前DeepSeek-V3.2费用扣除规则为token数量×价格。

DeepSeek-V3.2费用 来源:DeepSeek API官方定价文档

9日,MiniMax相关负责人对中新经纬表示,全免费使用的模型不会取消,目前在MiniMax Agent、海螺AI里,用户都有免费使用额度和积分。月之暗面相关负责人称,在其会员计划里,不同等级的会员token(词元)额度不同,基础对话一直都是免费的。

李明认为,未来免费模型仍会存在,但只能处理简单的问题。

卢轶乔认为,对于token消耗较少的文本客户,或多模态的初始体验用户,各大模型厂商基本仍以培育市场、吸引流量为主要目标。

惠军则表示,AI产业正从以用户增长为目标的粗放式投入阶段逐步转向以投资回报率为核心的精细化运营阶段。一级市场对AI的投资逻辑正发生变化,估值标准从技术指标转向ARR(年度经常性收入)、付费转化率和毛利率。价格调整是资本压力下的商业化能力检验。

惠军提到,未来“哑铃型”商业范式可能会成为行业共识,即轻量模型作为免费的流量入口,复杂功能则转向按Token计费或订阅收费。而未能实现商业闭环的厂商或将面临较大的推理算力成本压力。

在王喜文看来,未来模型厂商很有可能全面采用token付费(含按量+订阅套餐)模式。他解释,因为精准匹配成本与使用量,token计费适配智能体、长文本、编程等高耗场景。国外代表性的大模型公司OpenAI、Anthropic均已验证,该模式更灵活、毛利更高,国内厂商正在快速跟进。

李明认为,AI要长期生存下去,就必须赚钱。AI不生产大米、猪肉或钢铁,没有传统产业的物质产出,因此盈利是其唯一出路。

卢轶乔表示,付费模式能否持续走通,核心仍取决于模型能力能否实现大幅提升,这一变量动态性强、变化较快,暂时无法下绝对定论。

本文来自微信公众号 “中新经纬”(ID:jwview),作者:谢婧雯 薛宇飞,36氪经授权发布。

+1
29

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业