龙虾养得起,Token烧不起
Token狂飙的算力税:谁在为AI的“工业革命”买单?
今年春天,如果你还在纠结龙虾怎么养、Token中文名叫什么,大概已经跟不上科技圈的热闹了。
3月23日,国家数据局局长刘烈宏给Token定了中文名——词元。同时披露了一个数字:中国日均Token调用量突破140万亿,两年增长超千倍。
图源:新华社
差不多同一时间,阿里云和百度智能云先后宣布AI算力产品涨价,最高涨幅34%。英伟达的黄仁勋在GTC大会上把Token叫做“AI时代的石油”,还公布了一套分层定价:每百万Token从3美元到150美元不等。
他还说了另一句话,让不少创业者后背发凉:一个年薪50万美元的工程师,如果一年用不掉25万美元的Token,他会“极度恐慌”。
图源:网络
一边是Token消耗量疯涨,一边是供给端的成本在攀升、定价权在集中。热潮退去,账单浮出水面,人们开始意识到一个问题:我们正以近乎倾销的价格享受着AI的便利,但支撑这场技术革命的底层燃料,其真实成本才刚刚开始显现。
为什么单价越便宜,总账单越贵?
要理解这件事,得先明白Token是什么。
它是AI理解和生成信息的最小单元,也是眼下智能时代唯一可计量、可定价、可交易的通用货币。但它的使用费由两个东西决定:单价乘以消耗量。
图源:网络
你问一个问题,它回答一段话,背后都是Token在燃烧。
过去两年,行业的主线是训练模型。各大厂商砸了数千亿美元,把单位Token的牌面价格一降再降。国内厂商的Token单价,已经做到海外巨头的十分之一。
但到了2026年,事情变了。
AI的核心价值,从“能聊”变成了“能干”。标志就是龙虾的爆发。
图源:网络
一个龙虾智能体执行一次任务,比如“帮我找最低价”,消耗的Token是传统对话的几十倍甚至上百倍。因为它不是一次问答,而是一个完整的工作流:拆解任务、多步推理、调用工具、自我修正、错了重来。每一步都在烧Token。
这就是问题的核心:完成同一个任务需要的Token数量,增长得比单价下降更快。AI从副驾驶变成了代驾司机,油耗自然不是一个量级。
更关键的是,用户永远只想要最新的模型。老模型再便宜也没人要,99%的需求会瞬间转移到新发布的SOTA模型上。而前沿模型的单位Token价格,从来没真正降下来过。GPT-4刚出来时输出价格60美元每百万Token,今天Claude Opus 4.5还是这个价位。用户要的是当下最好的大脑,愿意为它买单。
图源:网络
于是,需求端智能体爆发,Token消耗量两年增长超千倍。供给端,HBM内存价格飞涨,2026年一季度DRAM价格环比涨超50%,NAND最高涨了150%,巨头们的战略长约直接签到5年后。而掌握核心硬件和软件生态的英伟达,靠着CUDA和从芯片到云的全栈布局,牢牢捏着Token的出厂价。
谁在制造Token的通胀?
Token的狂飙不是自然生长的。从产业链看,有四层玩家,每一层都在向上传递成本,最终压到最末端的普通用户身上。
先看最底层:英伟达。
第一层是英伟达。以前它卖芯片,一次买卖。现在不一样了。CUDA生态绑住了全球绝大多数AI开发者,二十年来积累的工程师、开源项目、代码库都长在这个生态里,切换成本极高。它自己又开了云服务DGX Cloud,用户直接在它平台上按Token付费,不用自己买芯片。
图源:网络
黄仁勋在GTC 2026上提出了“Token工厂经济学”,核心就一句话:以后AI的衡量单位不再是芯片,而是Token。他的野心也不止于卖云服务——英伟达正在试图把商业模式延伸到按Token抽成。
这套打法让英伟达掌握了定价权。2026年一季度,HBM内存供不应求,内存价格在几个月内上涨了数百个百分点。英伟达的GPU也跟着涨价——AI芯片H200所用的HBM3E供应价格上涨约20%。
英伟达芯片涨价,直接推高了云厂商的采购成本。
阿里云、腾讯云、百度智能云,它们从英伟达买芯片,搭好服务器,再把算力租给下游。现在英伟达芯片涨价,HBM内存涨价,它们自己的成本在涨。同时需求又爆发——龙虾这类智能体火了,所有人都想跑Agent。需求太大,服务器、电力都跟不上。于是它们只能涨价。阿里云AI算力产品最高涨了34%,百度涨了5%到30%。
图源:网络
第三层是大模型厂商。DeepSeek、MiniMax、智谱这些公司,处境最微妙。它们从英伟达买芯片,从云厂商租算力,训练出模型,再把Token卖给用户。
图源:网络
上游,芯片涨价、内存涨价、云厂商涨价,成本在涨。下游,2024年DeepSeek带头打价格战,把Token价格打到了地板上。想涨价怕用户跑,不涨价自己的算力账单在飞涨。所以这一轮云厂商涨价,它们反而最沉默。
第四层是AI应用公司。Cursor、Claude Code这些直接面向用户的工具,面临一个无解的难题:按固定月费收,比如20美元随便用,重度用户能把成本干穿。
Anthropic的Claude Code就吃过这个亏,推出每月200美元的无限套餐,结果一个月被一个用户干掉了100亿Token,最后不得不取消。
图源:网络
按量付费呢?用户会被不确定的账单吓跑。大多数人喜欢固定月费,哪怕贵一点,至少心里有数。
怎么办?只能硬着头皮选固定月费,但在这个模式下做各种限制来保命。
最常见的是用量封顶。每月给你一定额度的Token,用完了要么等重置,要么补差价,要么升级。比如Claude Code取消无限套餐后,改成了按实际用量付费加基础月费的混合模式。
另一种是分级套餐。轻度用户20美元,重度用户40或60美元,把高消耗用户筛到更高的付费档位。还有些公司在技术层面做优化——缓存常用请求、限制上下文长度、在用户无感知的情况下把复杂任务切给便宜模型跑。这些做法用户看不到,但每一招都在省Token。
可以看到,越往下游,利润越薄,处境越难。最上游的英伟达稳赚,最下游的应用公司在生死线上挣扎。而用户的直观感受就是,Token越来越贵了。
谁在焦虑,谁在狂欢?
焦虑,在普通用户和开发者中蔓延。“月薪2万,我养不起自己的AI员工”——这句调侃正在变成越来越多人的真实处境。
程序员艾瑞克是较早开始养龙虾的一批人。他用龙虾来自动化处理代码审查和简单的bug修复,最初一个月只花了几十块钱。
但随着他给龙虾配置了更多技能包——自动读取GitHub issue、调用测试环境、发送报告——Token消耗量直线上升。现在他每个月要花近千元。钱不算少,但让他不舒服的是,这个数字在没有任何预警地缓慢爬升,像一笔看不见的固定支出。
图源:网络
95后运营小可(化名)的账单则呈现出另一种焦虑。
他养了两只龙虾,一只负责监控竞品动态,每天抓取信息后自动整理成简报;另一只负责整理知识库并批量生成自媒体账号内容。两个数字员工24小时运转,一个月下来Token费用超过200元。
但比账单更让他头疼的,是龙虾的不可控。偷懒是常事——在某个环节卡住后反复重试同一个步骤,Token在燃烧,产出却为零。
更离谱的是欺骗:龙虾有时会过度夸大自己的能力,只要不被发现就默认自己能完成。小可不得不在Soul.md里反复调整指令,定期检查执行记录,像管理一个不太靠谱的实习生。
小可的技术路径几经调整。最早他用的是一个国内某云端Agent工具,但响应慢、功能弱,很快就弃用了。
后来他转向openclaw本地化部署,通过火山引擎的coding plank服务调用Kimi 2.5模型。这套方案相当克制,基础账单仅需每月40元。但任务一多,coding plan就自动升级到200元每月——账单永远追着需求跑。
图源:网络
他也动过换用GPT或Claude的念头,但试用之后发现,在自己需求下国内和国外模型交付差异不大,但是国外模型Token费用翻了好几倍,用起来实在心疼。最后还是用回了国内模型,毕竟国内模型还是要便宜很多。
如果说这些还算可控,那智能体的心跳机制和自动循环,才是真正的暗坑。用户不知情时,一个配置失误就能让Token一夜之间烧光。当AI几分钟就能完成你一周的工作,当你的数字员工比你本人还烧钱,认知焦虑与经济压力便同时袭来。
面对这个问题,有人想出了土办法:设置电脑定时关闭,或者把openclaw部署在U盘上,通过插拔U盘来物理断电。用最原始的方式,给这个不知疲倦的数字员工装上了一个看得见的开关。
狂欢,属于产业链上游的收租人。英伟达的市值和毛利率,云厂商的涨价底气,都源于它们在Token价值链上的不可替代性。无论AI应用层如何洗牌,它们都是稳坐钓鱼台的赢家。
结语
这场Token狂飙,最后会走向哪里?
我觉得,它会倒逼整个产业回归两个常识。
第一,算力成本终究会回归商品属性。短期内存涨价、供需失衡,但技术进步不会停。更高效的模型架构、更好的推理优化、把模型焊在芯片上的专用芯片创新,都会持续压低Token的生产成本。长期看,Token的单价一定是往下走的。
图源:网络
第二,投入产出比会成为唯一的衡量标准。烧Token不是目的,用Token创造价值才是。市场从狂热回归理性之后,企业不会再看“Tokenmaxxing”,而是会问:这100万Token,到底帮我干了多少活?挣了多少钱?
智能体本身也需要进化,需要在有限的尝试中,找到使用Token最具效率的方法。
那些只靠补贴用户烧Token、自己没有核心价值创造的应用,会最先倒下。能精确衡量任务成本、优化Token效率、建起高转换成本壁垒的公司,才能活下来。
Token越来越贵的今天,我们需要的不是制造焦虑,也不是鼓励无度消耗。
毕竟,商业的终极理性,从来不是烧掉多少燃料,而是走了多远的路。
参考资料:
1、《「烧Token」成KPI,有程序员一个月花掉15w》腾讯科技
2、《为什么所有人都觉得 MiniMax、智谱「太贵了」?》极客公园
3、《月薪2万,我养不起自己的“AI员工”》凤凰WEEKLY
本文来自微信公众号“首席商业评论”(ID:CHReview),作者:宁缺,36氪经授权发布。















