AI 写代码太烧钱了:Copilot、Claude 一起涨价,不如把程序员请回来?

极客邦科技InfoQ·2026年04月29日 10:01
程序员们,先别忙着焦虑 AI 会抢走你的饭碗。

程序员们,先别忙着焦虑 AI 会抢走你的饭碗。现在更该焦虑的,可能是你们的 CTO 和 CFO 了:因为让 AI 写代码,实在太烧钱了。

Copilot 和 Claude Code,几乎在同一时间,给行业踩了一脚刹车。

4月28日,GitHub 宣布从 2026 年 6 月 1 日起,GitHub Copilot 将告别“无限畅饮”模式,将 Copilot 从“按请求计费”转为“按使用量计费”。

几乎同一时间,Anthropic 限制了 Claude Code 中 Opus 模型的访问,每月 20 美元的 Pro 用户想继续用?请额外付费。

这就引出了一个绕不开的问题:用 AI 写代码花的钱,哪天会比直接雇一个程序员还贵?如今这个转折点,已经不远了。

从“自助餐”到“按粒收费”

先看看 GitHub Copilot 涨价的程度。

GitHub Copilot 原来的模式是按“请求次数”计费,你问一句“怎么写快排”和让 AI 替你跑一个小时的自主编码会话,消耗的额度是一样的。因此,需要大量“思考”的复杂提示往往会使 GitHub 的成本超过其获得的订阅费收入。GitHub 产品团队首席产品官 Mario Rodriguez 在今天的博客中坦言:“GitHub 已经吸收了太多推理成本,当前模式不可持续。”

这种压力,其实已经开始体现在更早的动作里。GitHub 上周已经释放出一个信号:为了止住持续扩大的亏损,公司暂停了 Copilot、Pro、Pro+ 以及 Student 套餐的新用户注册。

在这样的背景下,计费逻辑开始彻底重写。从 6 月 1 日起,新模式下一切以 token 为单位。GitHub 推出了自己的虚拟计费单位, “GitHub AI Credits”,每个 Credit 价值 0.01 美元。Copilot 用户在使用过程中会消耗输入 token、输出 token 以及缓存 token,这些都会根据所使用的模型分别计价,最终统一折算为 AI Credits。

订阅价格表面上没变:Copilot Pro 仍是每月 10 美元,每月 1000 Credits。Pro+ 是 39 美元,每月 3900 Credits。用完之后,要么设置超额预算继续付费,要么等下个月额度重置。

真正麻烦的是,token 账单很难提前算清。一次请求会“想”多久、调用多少工具、读多少上下文、生成多少内容,用户事前并不知道。GitHub 也意识到这一点,只能先给一点“模糊的可见性”。Rodriguez 透露,公司将在 5 月初推出“费用预览”功能,让用户和管理员在 6 月 1 日正式切换前,能够看到预估成本。

对于按年订阅的用户,可以选择提前取消并按比例退款,或者在订阅到期后降级为 Copilot Free——这些年费套餐将不再支持续订。而且那些坚持用完年费订阅的用户 ,将会明显感受到高端模型价格的上涨。 例如,Anthropic 的 Opus 4.7,在原有按请求计费模式下的倍率为 7.5 倍,未来将提升至 27 倍;OpenAI 的 GPT-5.4,也将从 1 倍上涨到 6 倍。

所以 GitHub 的调整,相当于承认了:之前是在亏本让开发者“薅羊毛”,现在要把高阶模型真正的推理成本转嫁回去。

Anthropic 也一样。 本月初,数百万 OpenClaw 用户发现这款爆火的 AI 代理工具 被 Anthropic 严重限制了。现在 Claude Code 也一并改了规则:每月 20 美元的 Pro 用户想继续用 Opus 模型?得额外付费。负责人 Boris Cherny 也曾直言:“订阅模式本就不是为这种使用强度设计的。”翻译成人话:OpenClaw 这些工具 7×24 小时跑 Agent,我们扛不住了。

轮到用户填这个“无底洞”了

过去几年,AI 公司一直用接近“自助餐”的方式扩张:低价,甚至免费,让更多人先用起来,把规模做大。

在这个阶段,主流做法是按人头收费,本质上是一种“平均成本”的模式。也就是说,不管一个人每天跑几个 agent,还是一周只问两次问题,平台都按同一档订阅费来收。高频用户多出来的成本,会被低频用户摊掉,也会被平台自己吸收。订阅制本质上是在用“平均成本”覆盖这种极不均衡的使用。

可一旦 agent 普及,这个模型就会迅速失效。所以 Copilot 和 Claude Code 现在做的,其实是把过去被平均掉、被平台吸收掉的成本,重新按 token 拆回到每一次真实使用上。

某种程度上,这并不新鲜。 它像是 2010 年代科技繁荣的重演:当年风险投资推动网约车、电商、外卖、即时配送,用补贴换增长。一旦公司站稳脚跟,就开始提价、拓展收入、为投资人兑现回报——当然,也有不少没撑住直接崩盘的。

但 AI 烧钱的速度,比近几十年任何一个行业都快。 AI 公司在全球砸下数据中心,投入数万亿美元,承诺更强的模型、更低的成本、以及“人人可用的 AI”。可现实是,哪怕只是止住亏损都很难,更别说实现投资人期待的回报了。

有外媒在分析这一轮 AI 资本热潮时,援引了 Gartner 的一组数据。分析师 Will Sommer 估算,2024 到 2029 年,全球 AI 数据中心的资本投入将达到 6.3 万亿美元——差不多是美国一年 GDP 的四分之一。为了避免资产减值,厂商需要大约 25% 的投资回报率(像亚马逊、微软那种水平)。如果回报低于 7%,就是“对所有投资者的灾难”。

要达到那根最低 7% 的红线,大型 AI 公司到 2029 年需要累计赚出接近 7 万亿美元的 AI 收入,相当于平均每年 2 万亿美元。如果想实现“历史性回报”,这个数字要提高到 8.2 万亿美元。

那这些钱要从哪来?只能靠卖 token。

Token 是 AI 理解和处理数据的最小单位,可以是文字、图片或声音。通常来说,一个 token 大约对应英文中的 3 到 4 个字符,一篇 1500 字的文章大约 2050 个 token。问题是,要赚到每年 2 万亿美元,需要处理的 token 数量大到荒谬。作为对比,谷歌曾透露它每月处理约 1.3 千万亿(quadrillion,也就是 1 后面 15 个零)个 token。把所有厂商加一起,每年大概处理 100 到 200 千万亿个 token。

但 Gartner 算了一下:要实现年入 2 万亿美元,算上每个 token 大约 10% 的利润率,token 的消耗量需要在未来几年增长 5 万到 10 万倍——也就是从现在的每年百万亿级,跳到每年 1 后面 21 个零 那个级别(sextillion,简单说,比现在多五位数)。

问题是,现在的公司根本没有能力处理这么多 token。它们正在拼命建设数据中心,但算力依然紧张。即便有能力处理,它们也面临另一个问题:这些 token 很可能是亏钱的。

Sommer 估算,如果只计算基础设施和电力成本,“每个 token 的利润看起来还算合理”。但随着模型越来越复杂、token 消耗越来越大,这个利润空间正在迅速收窄,甚至消失。而一旦把间接成本算进去——例如扩建算力以及不断训练下一代模型的“天文级”开销——这些利润几乎被完全吞噬。

“当你把下一代模型所需的基础设施成本也算进去,这个模式就越来越站不住脚。”Sommer 预测,市场整合几乎不可避免,每个区域最终可能只剩不超过两家大模型厂商。

所以,慷慨的免费额度时代,也该结束了。对那些免费用户很多的 AI 实验室来说,问题从来不是“要不要变现”,而是“什么时候开始、下手多重”。它们希望 token 用量继续增长,但成本要么自己扛,要么转嫁给用户。这也是为什么如今 GitHub Copilot 和 Anthropic 必须放弃订阅制的原因。

浪费不可避免,成本逼近临界点

AI 公司不得不把成本转嫁给用户,但问题是,很多 token 本来就是被“白烧”掉的:一部分来自技术机制,一部分来自员工内卷。

在 AI 发展的早期,大部分算力成本都花在模型训练上,而推理相对便宜。但随着模型能力提升、系统功能不断叠加,推理阶段的资源消耗已经显著上升。尤其是 AI agent——那些希望能够替用户完成复杂、多步骤任务、而不需要持续人工干预的工具——相比几年前的基础聊天模型,会消耗成倍增长的 token。

你输入一句话,Agent 就在后台工作中消耗大量 token:推演不同路径、启动子 agent 去完成子任务,或者对每一步结果进行验证。这些你根本看不见,但每一笔都算在账单上。更麻烦的是,Agent 一定会产生“无效 token”:走错路退回来、反复检查却不改东西、甚至停下来“给自己写首诗”。整个行业都在努力减少这种浪费,但短时间内没戏。

那这些 token 到底烧在哪了?

首先是最基础的输入 token 和输出 token。输出往往比输入贵 2 到 6 倍——因为生成是串行的,输入可以并行。这个价差不是随便定的,是物理层面的差异,即生成比读取更难。

真正烧钱的是推理 token。当你使用带“深度思考”的模型时,它不会直接给答案,而是先“思考”,生成成千上万 token。一个简单数学问题,最终答案可能只有 200 个 token,甚至只输出一个“42”,但模型内部可能生成了上千甚至几千个推理 token。你的账单是“推理 token + 输出 token”的总和。推理 token 已经成为一个新的市场分层,高级推理,就是更高价格。

还有一类正在拖垮很多 Agent 系统的,是工具调用 token 和系统 token。给模型接入工具时,你必须把工具的 JSON schema 一起发过去。10 个工具,加上完整描述,每次调用就多出 3000~4000 个 token,而且无论是否真用到,成本都会发生。更致命的是 Agent 的循环调用:思考→调工具→读结果→再思考……可能跑 6 到 15 轮。一个 50 token 的用户问题,最终可能消耗超过 10 万 token。不建模的话,最终账单会亲自“教育你”。

除此之外,还有视觉 token(一张截图比发一整页文字还贵)、音频视频 token(一小时会议录音 18 万 token)、结构性 token(这是“看不见的脚手架”:序列开始 / 结束标记、区分 system/user/assistant 的角色 token、batch 处理时的 padding token、以及各种模式触发 token)。

技术上的浪费已经够头疼了,更糟糕的是,一些企业还在主动放大这种浪费。

tokenmaxxing 这个概念最早在硅谷流行起来,但传播速度很快。员工拼命消耗更多 token,以此证明自己“深度拥抱 AI”。Visa 自豪地宣布,它的 token 使用量从 2 月的 1 万亿翻到了 3 月的 2 万亿。摩根大通和迪士尼内部甚至设有仪表盘,专门追踪员工用了多少 AI 代币。谁消耗得多,谁就显得更“前沿”。

今年 4 月,Meta 内部出现了一个叫 Claudeonomics 的排行榜,追踪全公司 8.5 万人的 AI token 消耗,只展示前 250 名。为了冲榜,有人让 Agent 跑几个小时,有人一次性跑几十个用例,还有人直接写无限循环脚本——让 AI 不断调用自己,一晚上刷出几十亿 token。30 天内,全公司烧掉了 60 万亿 token,按公开定价估算相当于 9 亿美元。排名最高的个人,一个月账单接近 200 万美元。

这些数字放在一起,会逼出一个更直接的问题:人和 AI,到底哪个更贵?

过去大家默认 AI 便宜,是因为真实成本被补贴和平均掉了。Copilot 每月十几美元、Claude Code 每月几十美元,看起来当然比一个工程师便宜。现在 token 开始逐笔计价,这个账就变了。假设一个工程师年综合成本是 25 万美元,折到每月大约 2 万美元。如果一个 AI 工具每月花 1000 美元,但能稳定替代 5% 以上的工程产出,那就是划算的;如果一个团队每月 token 账单烧到几万、几十万美元,却只换来一些重复尝试和无效产出,那 AI 反而比人贵。

所以真正的问题不是“AI 要不要用”,而是“AI 账单什么时候会超过一个程序员的工资”。

在今年 2 月的一期播客里,硅谷知名天使投资人、All-In Podcast 联合主持人 Jason Calacanis(曾早期投资 Uber、Robinhood 等公司)提出这个问题:token 成本什么时候会超过员工工资?他说,“这个临界点,不是未来,是马上就会发生。”

那些重度使用 AI、长时间跑 agent 的开发者,其实早已到了这个点。

同场的 Chamath Palihapitiya 也提到,他的公司已经开始给开发者设定 token 预算。按他的说法,单个 agent 通过 Claude API 跑起来,一天就可能花掉 300 美元,一年就是 10 万美元。团队必须至少提升 2 倍生产力,才能覆盖“工资 + AI 账单”的总成本。

否则,AI 不是降本工具,而是新的成本黑洞。

参考链接:

https://github.blog/news-insights/company-news/github-copilot-is-moving-to-usage-based-billing/

https://docs.github.com/en/copilot/reference/copilot-billing/models-and-pricing#model-multipliers-for-annual-copilot-pro-and-copilot-pro-subscribers

https://x.com/i/trending/2048906922825519314

https://www.theverge.com/ai-artificial-intelligence/917380/ai-monetization-anthropic-openai-token-economics-revenue

https://www.youtube.com/watch?v=JK6QnFKv080

https://www.youtube.com/watch?v=CnaegIpkenA

本文来自微信公众号“InfoQ”(ID:infoqchina),作者:Tina,36氪经授权发布。

+1
46

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

喜临门老板欠债,给全公司戴上ST帽子

1小时前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业