公司养不起AI，员工却戒不掉了

硬核看板·2026年06月25日 09:10

我不想思考，我只想再吸一口。

最近，国内社交媒体上传言腾讯在砍员工的AI额度，把"全员统一额度"改成了"按任务动态分配"。媒体消息中，调整后员工的月度token额度多数在1000-5000元不等，部门之间差别很大。

消息传出来的一瞬间，社交媒体上都在讨论这件事，说现在大厂给员工用AI就好像毒贩一样，先给员工无限token随便用，然后限制额度，等员工已经离不开AI、回不去了，最后逼他自己掏钱买token，进入“自费上班”模式。这套路和“毒贩先免费引诱、再制造戒断、最后让你自费吸毒”简直是一个流程。

今年年初的时候，国外旅游平台Priceline的IT财务高级总监克里斯·里德也跟媒体记者形容，公司这一年的AI账单好像得了“可卡因流行病”，工程师一旦用上AI编程工具，token用量就停不下来，账单跟吸了毒一样往上窜。

现在，得病的轮到员工了。AI的厉害，大家都见过了；AI账单的厉害，你可能还没见过。

先免费，

强行让你上瘾

故事刚开始的时候，各个大厂还把AI捧上了天，这么先进的工具，你不用的都不行。

今年2月，昆仑万维2026年2月的内部信白纸黑字写着，技术序列全员强制用Codex或Claude Code，开发效率提至少50%，达不到的末位淘汰5%到20%。58同城董事长姚劲波的原话是“token用得越多越好，58同城不计成本”。阿里有的事业群，干脆把核心考核指标从日活用户数直接换成了token消耗量。

直接了当：不用AI就“滚蛋”吧。

硅谷这边虽然没这么“字字可辨”，但高管也亲自下场了。电商平台Shopify的CEO把内部备忘录直接发到社交媒体，第一句话就是“反射性地使用AI，现在是Shopify的基本要求”，还规定团队想加人、要资源，先得证明“这活AI干不了”。

比他更狠的是加密货币交易所Coinbase的CEO，他买下企业授权，群里下令周末前所有人必须用起来，周六早上亲自开电话会点名，几个没照做的，有正当理由的放过，没理由的当场开除。

最魔幻的是不少公司搞起了token排行榜。Meta一个员工自己搭了个榜，追踪八万多名同事的消耗，三十天烧掉超过60万亿token，给烧得最多的人发“token传奇”的称号。结果谁都想得到、当时却没人拦：员工为了榜上好看，故意让AI跑没用的任务、查自己早就知道答案的问题、让Agent空转。

这事后来还专门有个词，叫tokenmaxxing。意思是不管如何，先把token的消耗拉满，往死里刷。

从北京到加州，各家科技大厂用尽各种办法把员工喂上AI，而对员工来说这一切几乎免费。钱，是公司和它们背后的投资人在出。这诱惑谁能拒绝啊？

一个Agent，

凭啥能烧掉这么多钱

事情的发展并不如这些高管预期的那样，token的高额消耗，换回来的回报好像很有限。

问题的关键在于2025到2026这一拨工具，集体从“聊天”升级成了“Agent”，这些工具突然变得非常能烧钱。

普通聊天是一问一答，你问一句它答一句，烧的token就这么多。Agent完全是另一回事，它不答一句，是替你把整件事干完。打个比方，聊天像你问同事“这bug怎么改”，他口头给你个思路；Agent则像你派了个实习生去把bug真改好，自己读代码、想方案、动手改、跑测试、没过、再改、再跑，来回十几个回合。

这个“来回”上，是token消耗的致命点。对于大模型来说，它没记忆，或者说，它的“记忆”就是重新想一遍，每一步把前面发生过的所有事从头读一遍。实习生干到第十回合，Agent就得把“原始任务+前九回合读过的代码+试过的方案+报过的错”全打包，重新塞给大模型一次。而每一次“重读一遍”都按token收费。

于是token消耗像滚雪球一样，越来越大。云成本平台Vantage实测过，一次50轮的Agent编程会话，头十轮每轮输入大概5000token，写代码的中段涨到2万，到后面跑测试、改bug时每轮三万五上下，整场下来光输入就烧掉约100万token。

更猛的是多Agent，一个主管Agent指挥一群打工Agent同时开干。AI公司Anthropic在自己那篇多Agent系统的博客里给过一组数，Agent烧的token大约是普通聊天的4倍，多Agent系统大约是15倍。

所以当公司一边喊“随便用、多用AI”，一边正好赶上工具全面Agent化，token消耗完全不是慢慢涨，是指数爆炸。

在聚合了各家大模型调用的平台OpenRouter上，一年里token总处理量涨了大约15倍，开发者人数却只多了3倍出头。总量涨得比人头快得多，多出来的全是人均用量翻着番堆上来的。光是每次喂给模型的提示词，两年就涨到了原来的4倍。

单价越便宜，

大家用得越凶

有人亏钱，就有人赚钱，毕竟钱不可能凭空消失。那么多token烧掉，换成真金白银，最后到底进了谁的兜里？

最上游是英伟达，赚的是暴利，数据中心业务2026财年毛利率71%，卖100块的GPU成本大约只要25到29块（一块H100的单卡造价是分析师估算，英伟达从不公布）。

中间这层却在亏本，Cursor 2025年中毛利率负30%，一年向Anthropic付的算力成本比自己的收入还高，卖一块亏三毛；再往源头，根据网传的泄漏的审计文件，OpenAI 2025年收入130.7亿美元，运营亏损高达209亿，每赚一块要亏一块六。

这些中游大厂为什么敢亏本喂养？因为他们赌的就是先把用户圈进来形成依赖，以后再变现。这套打法，跟当年网约车、外卖的补贴大战一模一样。

不过这场补贴战里，模型公司一边亏本喂你，token的单价也还在飞快往下掉。

很多人引用英伟达CEO黄仁勋，说token成本正在以每年一个数量级、也就是每年十倍的速度往下降。

根据风投机构a16z测算，同等性能的模型成本每年降约10倍，一个GPT-3级别的模型，价格三年里从每百万token 60美元降到0.06美元，降了1000倍。

那问题就来了。单价在猛降，为什么大家的账单反而在猛涨？

这就是一个一百多年前就被发现的现象，杰文斯悖论。1865年经济学家杰文斯发现，蒸汽机烧煤的效率提高后，英国的煤炭消耗量不降反升，因为用煤变便宜了，更多行业都开始烧煤。

放到AI上一模一样。2025年内，完成一项基准AI任务的成本从4500美元降到11.64美元，降了99.7%；可同期OpenAI的推理总支出，反而从20亿涨到70亿，涨了3.5倍。

单价越便宜，大家用得越凶，总账单反而越大。这正好解释了“自费上班”为什么会发生，当AI便宜到、好用到变成一种戒不掉的日常必需品，该花的钱一分没少，只是从“公司请客”慢慢变成了“自己买单”。

那AI公司，

到底是不是毒贩

看到这儿你可能觉得AI势不可挡，大家争先恐后是对的。

但很多公司一边裁员甩锅AI、一边逼留下的人充token，可AI到底值不值，他们自己都算不清。

管理咨询公司麦肯锡在2025年的调查里发现，88%的企业在用AI，但真正看到5%以上利润提升的，只有约6%。更意外的是AI评测机构METR的一项随机对照试验，16名经验丰富的开源开发者用上AI之后，完成任务实际慢了19%，可他们自己以为快了20%。“经验丰富”这个限定很重要，样本是资深开发者在复杂大型代码库上干活，不代表AI对新手或简单任务也没用。