公司养不起AI,员工却戒不掉了

硬核看板·2026年06月25日 09:10
我不想思考,我只想再吸一口。

最近,国内社交媒体上传言腾讯在砍员工的AI额度,把"全员统一额度"改成了"按任务动态分配"。媒体消息中,调整后员工的月度token额度多数在1000-5000元不等,部门之间差别很大。

消息传出来的一瞬间,社交媒体上都在讨论这件事,说现在大厂给员工用AI就好像毒贩一样,先给员工无限token随便用,然后限制额度,等员工已经离不开AI、回不去了,最后逼他自己掏钱买token,进入“自费上班”模式。这套路和“毒贩先免费引诱、再制造戒断、最后让你自费吸毒”简直是一个流程。

今年年初的时候,国外旅游平台Priceline的IT财务高级总监克里斯·里德也跟媒体记者形容,公司这一年的AI账单好像得了“可卡因流行病”,工程师一旦用上AI编程工具,token用量就停不下来,账单跟吸了毒一样往上窜。

现在,得病的轮到员工了。AI的厉害,大家都见过了;AI账单的厉害,你可能还没见过。

先免费,

强行让你上瘾

故事刚开始的时候,各个大厂还把AI捧上了天,这么先进的工具,你不用的都不行。

今年2月,昆仑万维2026年2月的内部信白纸黑字写着,技术序列全员强制用Codex或Claude Code,开发效率提至少50%,达不到的末位淘汰5%到20%。58同城董事长姚劲波的原话是“token用得越多越好,58同城不计成本”。阿里有的事业群,干脆把核心考核指标从日活用户数直接换成了token消耗量。

直接了当:不用AI就“滚蛋”吧。

硅谷这边虽然没这么“字字可辨”,但高管也亲自下场了。电商平台Shopify的CEO把内部备忘录直接发到社交媒体,第一句话就是“反射性地使用AI,现在是Shopify的基本要求”,还规定团队想加人、要资源,先得证明“这活AI干不了”。

比他更狠的是加密货币交易所Coinbase的CEO,他买下企业授权,群里下令周末前所有人必须用起来,周六早上亲自开电话会点名,几个没照做的,有正当理由的放过,没理由的当场开除。

最魔幻的是不少公司搞起了token排行榜。Meta一个员工自己搭了个榜,追踪八万多名同事的消耗,三十天烧掉超过60万亿token,给烧得最多的人发“token传奇”的称号。结果谁都想得到、当时却没人拦:员工为了榜上好看,故意让AI跑没用的任务、查自己早就知道答案的问题、让Agent空转。

这事后来还专门有个词,叫tokenmaxxing。意思是不管如何,先把token的消耗拉满,往死里刷。

从北京到加州,各家科技大厂用尽各种办法把员工喂上AI,而对员工来说这一切几乎免费。钱,是公司和它们背后的投资人在出。这诱惑谁能拒绝啊?

一个Agent,

凭啥能烧掉这么多钱

事情的发展并不如这些高管预期的那样,token的高额消耗,换回来的回报好像很有限。

问题的关键在于2025到2026这一拨工具,集体从“聊天”升级成了“Agent”,这些工具突然变得非常能烧钱。

普通聊天是一问一答,你问一句它答一句,烧的token就这么多。Agent完全是另一回事,它不答一句,是替你把整件事干完。打个比方,聊天像你问同事“这bug怎么改”,他口头给你个思路;Agent则像你派了个实习生去把bug真改好,自己读代码、想方案、动手改、跑测试、没过、再改、再跑,来回十几个回合。

这个“来回”上,是token消耗的致命点。对于大模型来说,它没记忆,或者说,它的“记忆”就是重新想一遍,每一步把前面发生过的所有事从头读一遍。实习生干到第十回合,Agent就得把“原始任务+前九回合读过的代码+试过的方案+报过的错”全打包,重新塞给大模型一次。而每一次“重读一遍”都按token收费。

于是token消耗像滚雪球一样,越来越大。云成本平台Vantage实测过,一次50轮的Agent编程会话,头十轮每轮输入大概5000token,写代码的中段涨到2万,到后面跑测试、改bug时每轮三万五上下,整场下来光输入就烧掉约100万token。

更猛的是多Agent,一个主管Agent指挥一群打工Agent同时开干。AI公司Anthropic在自己那篇多Agent系统的博客里给过一组数,Agent烧的token大约是普通聊天的4倍,多Agent系统大约是15倍。

所以当公司一边喊“随便用、多用AI”,一边正好赶上工具全面Agent化,token消耗完全不是慢慢涨,是指数爆炸。

在聚合了各家大模型调用的平台OpenRouter上,一年里token总处理量涨了大约15倍,开发者人数却只多了3倍出头。总量涨得比人头快得多,多出来的全是人均用量翻着番堆上来的。光是每次喂给模型的提示词,两年就涨到了原来的4倍。

单价越便宜,

大家用得越凶

有人亏钱,就有人赚钱,毕竟钱不可能凭空消失。那么多token烧掉,换成真金白银,最后到底进了谁的兜里?

最上游是英伟达,赚的是暴利,数据中心业务2026财年毛利率71%,卖100块的GPU成本大约只要25到29块(一块H100的单卡造价是分析师估算,英伟达从不公布)。

中间这层却在亏本,Cursor 2025年中毛利率负30%,一年向Anthropic付的算力成本比自己的收入还高,卖一块亏三毛;再往源头,根据网传的泄漏的审计文件,OpenAI 2025年收入130.7亿美元,运营亏损高达209亿,每赚一块要亏一块六。

这些中游大厂为什么敢亏本喂养?因为他们赌的就是先把用户圈进来形成依赖,以后再变现。这套打法,跟当年网约车、外卖的补贴大战一模一样。

不过这场补贴战里,模型公司一边亏本喂你,token的单价也还在飞快往下掉。

很多人引用英伟达CEO黄仁勋,说token成本正在以每年一个数量级、也就是每年十倍的速度往下降。

根据风投机构a16z测算,同等性能的模型成本每年降约10倍,一个GPT-3级别的模型,价格三年里从每百万token 60美元降到0.06美元,降了1000倍。

那问题就来了。单价在猛降,为什么大家的账单反而在猛涨?

这就是一个一百多年前就被发现的现象,杰文斯悖论。1865年经济学家杰文斯发现,蒸汽机烧煤的效率提高后,英国的煤炭消耗量不降反升,因为用煤变便宜了,更多行业都开始烧煤。

放到AI上一模一样。2025年内,完成一项基准AI任务的成本从4500美元降到11.64美元,降了99.7%;可同期OpenAI的推理总支出,反而从20亿涨到70亿,涨了3.5倍。

单价越便宜,大家用得越凶,总账单反而越大。这正好解释了“自费上班”为什么会发生,当AI便宜到、好用到变成一种戒不掉的日常必需品,该花的钱一分没少,只是从“公司请客”慢慢变成了“自己买单”。

那AI公司,

到底是不是毒贩

看到这儿你可能觉得AI势不可挡,大家争先恐后是对的。

但很多公司一边裁员甩锅AI、一边逼留下的人充token,可AI到底值不值,他们自己都算不清。

管理咨询公司麦肯锡在2025年的调查里发现,88%的企业在用AI,但真正看到5%以上利润提升的,只有约6%。更意外的是AI评测机构METR的一项随机对照试验,16名经验丰富的开源开发者用上AI之后,完成任务实际慢了19%,可他们自己以为快了20%。“经验丰富”这个限定很重要,样本是资深开发者在复杂大型代码库上干活,不代表AI对新手或简单任务也没用。

管理学刊物《哈佛商业评论》的研究者达文波特称:很多公司是按AI的“潜力”在裁人,根本不是按“实绩”。人裁了、活还在、留下的人更累,只能更依赖AI,反过来又把token账单推得更高。

这也是我们目前对AI最直观的感受。不用AI没工作,用了AI干更多。AI根本没解放员工,反而把大家带入了更深的牢笼之中。

所以,科技公司真的是毒贩逻辑吗?

诚实说,像的地方确实很像,先用免费补贴把人圈进来,等你形成依赖再涨价限额,戒断成本高到回不去,最后让你自己掏钱,连上市公司财务高管都亲口用了“可卡因”这个词。

但根本上来说,毒品不干活,AI是真干活,用token最多的工程师效率确实更高。

这下更地狱了。

毒贩越卖越贵,AI的单价却在猛跌,账单变大是因为太好用、用量爆炸,是杰文斯悖论不是敲诈;加限额也不全是恶意,模型公司是真在亏钱。

面对这个段子,或许一笑了之就好,作为时代的一个个体,改变不了世界什么。但当一个东西既让你离不开、又持续烧钱、回报还算不清的时候,无论是一家公司,还是一个打工的人,到底该怎么办?

我不想思考,我只想再吸一口。

本文来自微信公众号“硬核看板”(ID:yinghekb),作者:李沣,36氪经授权发布。

+1
5

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000
特邀作者

专注分享干货、爆款案例拆解、行业大咖经验。

下一篇

美东时间24日周三举行的英伟达年度股东大会上,CEO黄仁勋描绘了一幅雄心勃勃的AI基础设施扩张蓝图。

2小时前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业