AI 精神病的巅峰:Claude Mythos 和 OpenAI Spud 还没上线,就有人度假都睡不着了

AI前线·2026年04月15日 18:23
感觉我们又一次集体失智了,而这一切说到底,还是因为它们营销做得太成功了。

“感觉我们又一次集体失智了,而这一切说到底,还是因为它们营销做得太成功了。”开发者 DesignCourse 发出感叹。

这两天,荒诞、也让人上头的一幕出现了:一个还没公开发布的模型,和另一个同样还没正式上线的模型,已经先在舆论场里狠狠干上了。那就是 Anthropic 神神秘秘放出来的 Claude Mythos 和 OpenAI 被不断传成“真正对标 Mythos”的 Spud。

它们都还没有真正面向大众开放,但在“太强”“太危险”“只能限量给少数公司使用”的背景下,大众情绪已经被极度拉高。

“狼来了”,OpenAI 也来了 

上周,Anthropic 把 Mythos 只开放给少数几家公司使用,理由是这个模型太强了,也太危险了。当年 OpenAI 就玩过这套打法,一定程度上,奥特曼才是“太危险,不能向公众开放”玩法的鼻祖。

但面对 Anthropic 这波非常成功的“营销”,OpenAI 迅速跟进:OpenAI 正在敲定一款具备先进网络安全能力的模型,计划只向一小部分公司开放。而今天凌晨,OpenAI 先推出了一款“更适用于防御性网络安全工作的专用模型” GPT-5.4-Cyber 来打头阵,并表示未来几个月随着更强模型陆续发布,将继续采取“模型能力增强一步,网络防御同步扩展一步”的策略,来指导后续产品测试与部署。

没错,OpenAI 现在也开始把面向网络安全的能力分层开放。GPT-5.4-Cyber 是基于 GPT-5.4 微调的版本,对合法网络安全工作的拒绝边界更低、能力限制更少,能够支持更高级的防御工作流。OpenAI 特别提到,该模型新增了二进制逆向工程能力,安全研究人员即便拿不到源代码,也可以对编译后的软件进行恶意代码风险、漏洞和安全鲁棒性分析。

由于 GPT-5.4-Cyber 的能力更加宽松,OpenAI 暂时只会以有限、渐进的方式对外开放,首批对象是经过审核的安全厂商、组织和研究人员。公司也强调,这类更宽松、网络安全能力更强的模型,在访问上可能会附带额外限制,尤其是在零数据留存(Zero-Data Retention,ZDR)等“低可见性”使用场景中更是如此。对于那些通过第三方平台调用模型的开发者和组织,OpenAI 的直接可见性更低,因此相关限制也会更加谨慎。

OpenAI 还紧跟 Anthropic 的“安全”故事节奏,称最近上线以来,Codex Security 已推动修复超过 3000 个严重和高危漏洞,同时也帮助整个生态修复了更多低严重等级问题。与此同时,自己在扩大对防御者的资源投入,包括启动 1000 万美元网络安全资助计划、通过 Codex for Open Source 为超过 1000 个开源项目提供免费安全扫描,以及持续改进 Codex Security。

不少网友对这种套路已经烦透了。网友 tiron 表示,“‘可信访问’模式只不过是一种将红队演练货币化,却不给用户实际控制权的手段罢了。”

“那种‘这个模型太危险了,所以只能让少数公司使用’的说法,说实话,我觉得大概率站不住脚,而且基本可以肯定被夸大了很多。这两年里,我至少一直同时在用 AI 推进两三个项目。直到今天,仍然还有几个项目是连 Claude Opus 4.6 都做不下来的。它就是还不够强,而我自己也不是一个足够厉害的程序员,没法亲手把这些东西完全补上。”DesignCourse 说道。

他声称,连他很认可的 AI 博主,也被这种氛围带着走了。比如 Matthew Burman,他一直都是真正在用 AI 做项目的人,但 他也因为 Mythos 的消息焦虑到度假都放松不下来,觉得这次不一样,甚至开始担心未来来得太快。

这种状态被外媒描述为“AI 精神病”,即人在过度接触和沉浸 AI 信息后,对其能力产生夸大甚至失真的认知,出现过度兴奋、焦虑或不现实预期的状态。这并非公认的临床术语,只是被用作描述长时间与聊天机器人对话后出现的某种心理健康危机的万能术语。

不过,还有人比较冷静,表示要观望,等验证看实际情况。

当然,还有网友表示,“这感觉像是一个重要的转变。重点不仅在于网络安全方面的微调,更在于访问权限本身现在被视为安全模型的一部分。”持有这类观点的人不在少数。可见,“安全”被单拎出来售卖,已经被很多人接受了。安全正在被单独包装成一门生意,而这两个“领头羊”完成了市场教育的大部分工作。接下来,其他模型厂商或许也要跟进了。

Spud 未发,但有人说“它与 Mythos 不相上下”

这场论战里,OpenAI 真正被寄予厚望、拿来和 Mythos 对打的,其实并不是 GPT-5.4-Cyber,而是另一款尚未正式发布的模型:Spud。

还有网友发贴称,“OpenAI 的 Spud 已经投入实际应用(而且它与 Mythos 不相上下) Brad Gerstner 在 All-In Podcast 节目中证实,OpenAI 备受期待的‘Spud’模型(预计是 GPT-5.5)已经在闭门测试中,早期评价非常惊人。”

无论实际情况如何, Mythos 确实让市场对 Spud 的期待被进一步推高了。

实际上,OpenAI 联创 Greg Brockman 此前曾 在播客中透露过 Spud 相关的信息。

他在节目中表示,Greg 反复强调,这件事不该被理解成“一次发布”。因为任何一个发布出来的版本,本质上都已经是后续更强版本的早期形态,OpenAI 真正在构建的是一个持续加速的“进化引擎”,Spud 只是其中一步。

Greg 介绍了 OpenAI 的模型开发是:先做预训练,产出一个新的基础模型,它是后续一切能力提升的基础。过去 18 个月,他的主要精力都花在了这上面,包括 GPU 基础设施、训练框架,支持这些大规模训练顺利进行;接下来是强化学习阶段,让模型把它对世界的理解应用起来;再往后是后训练:也就是“最后一公里”,让模型在行为和可用性上真正变得好用。

而 Spud 是一个新的基础模型,是一次新的预训练成果,也是过去大约两年研究积累开始落地的结果。Spud 会能解决更难的问题,它会变得更细腻、更能理解指令,也更能理解上下文。

对于发布后的可能的一些负面评价,他也打了预防针。他认为,每一代模型发布时都会出现类似情况:一部分人会立刻觉得这是质的飞跃;但也有很多场景,本来就不是由“智能不足”构成的瓶颈,所以用户未必会第一时间觉得差异特别大。不过,随着使用时间拉长,这种变化最终一定会被感受到,因为真正发生改变的是人们对这个系统“信任程度”。

值得关注的是,就在 Mythos 和 Spud 的讨论还没落地时,关于 GPT-6 的小道消息也开始满天飞。

此前做过 OpenAI“草莓计划”爆料的 iruletheworldmo 月初就发贴称:

GPT-6 定于 4 月 14 日发布。

最近 Altman 团队简直像筛子一样,到处都在漏消息。以下是一些 OpenAI 员工私下在说的话:

预训练已于 3 月 17 日完成,后训练(post-training)和红队测试(red-teaming)也已经做完了。这东西已经准备好了。

基准测试离谱得夸张。在编程、推理和智能体任务上,性能比 GPT-5.4 高出 40% 以上。从底层开始就是原生多模态。文本、音频、图像、视频,全都统一在一个架构里。

OpenAI 已经砍掉了 Sora,把所有 GPU 都转去供这个模型使用。那笔价值十亿美元的 Disney 合作也黄了。这事的优先级就是这么高。

产品组织已经正式更名为“AGI Deployment”。兄弟们,真到 AGI 的时刻了。Brockman 说,AGI 已经完成了 70% 到 80%。在内部,他们认为 GPT-6 会补上剩下的大部分差距。

上下文窗口达到 200 万 token,是 GPT-5.4 的两倍。定价是每百万 token 输入 2.50 美元、输出 12 美元。几乎只比 GPT-5.4 略高一点。也就是说,它会有点像 Mythos 那种级别的智能,但价格你还负担得起。

安全团队已经被划归到首席营收官(CRO)下面。Altman 已经完全退出安全监督工作,转而专注数据中心建设。

从 2025 年 12 月开始,OpenAI 内部就一直处在“红色警报”状态。这就是他们给出的回应。它将驱动新的桌面“超级应用”:把 ChatGPT、Codex 和 Atlas 浏览器合并成一个统一的智能体。

土豆已经煮熟了。

Spud 就是 AGI。

话语很吸引人,而翘首以待的大家现在还没有等到这个重磅模型。然后有博主出来称,目前 GPT-6 模型还在“后训练 + 安全审查”阶段,最快也要 5 月,大概率 5–6 月亮相,OpenAI 暂时没给具体日期。

所以,你熬夜等 GPT-6 了吗?

熟悉的“放风”套路再上演 

另一边,相同的“放风”套路再次上演,昨天就有人开始爆料 Anthropic 的新模型消息了。

就在刚刚,iruletheworldmo 非常兴奋地说,“周四是个大日子,太棒了,很诱人。看起来有人把消息泄露给了 Sam Altman,说 Opus 4.7 要来了,发布时间已经改到周四。而且正如我昨天爆料的,Opus 确实要来了。不再发那些模棱两可的消息了。Spud 和 Opus 4.7 都会在周四发布。如果不是这样,我以后就不再提任何发布时间了。在周四之前我会彻底闭麦。到时候见,朋友们。”

今天外媒 The Information 也发文表示,Anthropic 正准备推出其下一代旗舰模型 Claude Opus 4.7,并同步发布一款 AI 驱动的设计工具,最快可能本周面世。

知情人士透露,Claude Opus 4.7 将作为 Anthropic 新一代旗舰模型之一,但其性能并非该司当前最先进的水平,内部真正的前沿模型为 Claude Mythos。而 Anthropic 即将问世的设计工具将挑战演示文稿制作工具 Gamma 和谷歌的 AI 设计工具 Google Stitch。报道称,Anthropic 的设计工具旨在通过自然语言提示,帮助用户生成演示文稿、网站、落地页乃至完整产品原型,覆盖从技术人员到普通用户的广泛群体。

“这是 Anthropic 的一套营销打法:先放风泄露 Mythos 的相关信息,再公布它的基准测试成绩,然后一边强调’这个模型太强大了,我们对此非常担心’,一边通过‘暂时无法向公众发布’的说法疯狂制造话题和期待,最后再突然上线,并配上一个极高的定价。”有网友吐槽。

而这套“先大规模泄露,再制造倒计时,再把期待推到极限”的做法,现在也被国内模型厂商学过去了。

参考链接:

https://openai.com/index/scaling-trusted-access-for-cyber-defense/

https://www.youtube.com/watch?v=Lcd93W1VkQ4

本文来自微信公众号“AI前线”,整理:褚杏娟 ,36氪经授权发布。

+1
13

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

分析师疲于应对特朗普言论与中东局势

1小时前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业