GPT-5 翻车:OpenAI「回滚」大戏与AI扩张隐形边界

山自·2025年08月13日 18:56
现在,OpenAI 用一次「模型回滚」告诉世界:Scaling Law 的狂飙时代结束,精耕细作时代开始。

8 月7日,GPT-5 带着四款型号(regular / mini / nano / pro)高调上线;8 月12日,Sam Altman 在 X 上宣布:GPT-4o 重新成为所有付费用户的默认模型。

从「下架」到「复活」,只用了 5 天。上一次 OpenAI 如此仓促地回滚,还要追溯到 2023 年 11 月 ChatGPT「宕机门」。不同的是,那一次是技术故障,这一次是产品策略的「自我修正」。

VentureBeat 拿到的后台日志显示,GPT-5 发布首周暴露了三大硬伤:

  • 路由失控:autoswitcher 把 37% 的 Pro 用户请求错误地分配到了 nano,导致长文本直接「失忆」。
  • 性能漂移:在代码补全场景,GPT-5 的通过率比 GPT-4o 低 8.7%,Stack Overflow 热帖骂声一片。
  • 情感撕裂:Reddit r/ChatGPT 一天内 1.2 万条帖子控诉「新版没有灵魂」。

于是,OpenAI 用一次「默认模型回退」紧急止血。Altman 的承诺听起来像安抚:「如果未来再次移除 GPT-4o,我们会提前充分通知。

但翻译成行业黑话就是——GPT-5 还没准备好全盘接管生产环境

用户「模型依恋症」:AI 产品的第一次「饭圈化」

你可能很难想象,大模型也能有「白月光」。

  • 独立开发者 Alex 在推特上贴出自己的 VSCode 插件,说 GPT-4o 的代码风格「像一位默契的老搭档」。
  • 一位日本插画师把 GPT-4o 的回复打印成册,取名《4o 诗集》。
  • 甚至有用户在 Change.org 发起请愿,要求永久保留 GPT-4o 的「性格参数」。

这不是段子,而是 OpenAI 产品团队最近才意识到的「模型人格黏性」。当 LLM 成为百万级创作者的日常生产工具,它的「语气」就是生产力本身。

Altman 在内部 Slack 里写道:「我们低估了用户对『人格一致性』的敏感度。」

因此,下一版 GPT-5 将上线「温度旋钮」:

  • Warm:更亲切,接近 GPT-4o;
  • Neutral:当前默认;
  • Balanced:介于两者之间,且允许用户微调 0–100 的连续值。

这是 AI 产品第一次出现「皮肤系统」——不是换颜色,而是换灵魂。

隐藏关卡:推理模式的「电费账单」

GPT-5「Thinking」模式有多贵?

  • 上下文 196k token,单轮成本 ≈ GPT-4o 的 3.6 倍;
  • 每周 3000 条限额,折算美元约 60 美元/周;
  • 如果限额用完,自动降级到 Thinking-mini,精度再打 8 折。

这还只是 C 端。企业 API 的价格表更刺激:

电费、显卡、碳排,三座大山让「无限上下文」成了奢侈品。据 Bit.ly/4mwGngO 沙龙流出的闭门数据:

  • 微软 Azure 为 GPT-5 预留的 20 万 H100 集群,峰值功耗 120 MW,相当于旧金山 8% 的居民用电。
  • 推理延迟每降低 10ms,就要额外消耗 5% 电力。

OpenAI 基础设施 VP 在一次非公开会议承认:「推理成本的上涨速度超过了摩尔定律的衰减速度。」

效率 vs. 扩张:Scaling Law 的「三相点」

过去五年,AI 行业信奉「参数越大,性能越强」。现在,我们第一次触碰到「扩张-效率-可持续」的三相临界点:

  • 参数扩张:GPT-5 4T 参数,训练一次 3.2 亿美元;
  • 推理效率:稀疏化、MoE、4-bit 量化只能抵消 60% 的成本增幅;
  • 可持续:美国电网新增负荷里,AI 训练已占 4%,环保组织开始起诉数据中心。

于是,行业出现了三条新路径:

  1. 模型瘦身:Mistral-Medium-122B 在 MMLU 上逼近 GPT-4,训练只用 1.5 亿美元;
  2. 硬件定制:谷歌 TPU v6、亚马逊 Trainium2,把「算力/瓦时」提升 2.3 倍;
  3. 能量套利:把数据中心搬到挪威水电、沙特光伏,电费降 40%。

一句话:「大」不再是唯一卖点,「省」才是下一轮融资的故事核心。

OpenAI 的「多线程」未来:一次发布会,三种商业模式

把这次 GPT-5 翻车与回滚,放在 OpenAI 的商业大图景里看,其实是三条收入曲线的「同步测试」:

这次事件让三条曲线的优先级重新排序:

  • C 端:先保体验,再谈升级——回滚 4o 是订阅收入的安全垫;
  • API 端:先保利润,再谈规模——Thinking 模式的高定价是 ROI 保险;
  • 硬件端:先保能效,再谈扩张——与英伟达、AMD 的联合优化项目已经启动。

当 AI 进入「精耕细作」时代

GPT-5 的翻车,像极了 2016 年 iPhone 7 取消耳机孔:

  • 用户骂声一片,但 AirPods 打开了新的千亿市场;
  • 现在,OpenAI 用一次「模型回滚」告诉世界:Scaling Law 的狂飙时代结束,

精耕细作时代开始。

接下来的 12 个月,我们会看到:

  • 更多「尺寸更小、推理更快、能耗更低」的模型;
  • 更多「可调人格、可调成本、可调安全」的旋钮;
  • 更多「把电费算进产品定价」的 SaaS 新套餐。

AI 不再是「大力出奇迹」的黑箱,而是「斤斤计较」的工程生意。这一次,连 Altman 也承认:

我们的敌人不是竞争对手,而是物理定律。

本文来自微信公众号“山自”,作者:Rayking629,36氪经授权发布。

+1
3

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

胖东来已为珠宝产品申请多项知识产权;加密货币交易平台Bullish将IPO募资11.1亿美元;近百台智元机器人进厂“上岗”

1小时前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业