小作文、安全牌，OpenAI被动反击Anthropic

36氪的朋友们·2026年04月15日 11:06

前浪反击后浪。

OpenAI和Anthropic的针锋相对，全面覆盖了产品、资本和商业层面。

近日，Anthropic宣布推出专门用于挖掘漏洞的AI模型Claude Mythos，引发了行业“恐慌”。

4月14日，OpenAI发内部备忘录在舆论场上发起反击，直指Anthropic靠“贩卖恐惧”拉拢客户，并炮轰其营收虚报高达80亿美元。

紧接着，OpenAI又于15日发布了专门针对网络安全微调的全新模型变体GPT-5.4-Cyber，还直接放宽了此前严苛的“拒绝访问”边界。

01 AI接棒网络安全

OpenAI这次发布的GPT-5.4-Cyber，本质上是其最新旗舰模型的一个特殊变体。它最核心的改变在于，它不再像通用模型那样“谨小慎微”。

以前，当你试图让模型分析一段具有攻击特征的代码时，安全防护机制可能会因为过于敏感而直接拒绝请求。而这个全新的GPT-5.4-Cyber，通过降低合法网络安全工作的拒绝边界，让防御者能够真正深入到那些敏感的灰色地带。

更让业界关注的是，这个新模型具备了二进制逆向工程能力。这意味着安全专业人员不再需要依赖源代码，就能直接对编译后的软件进行“解剖”。

这种能力的同步提升，意味着网络防御正在从过去的人工审计，转向一种由智能体驱动的持续防御模式。这种转变并非突发奇想，而是OpenAI筹划已久的策略，他们希望防御能力能与模型本身的进化速度保持完全同步。

光有强大的工具还不够，谁能用、怎么用，才是解决网络风险的关键。

OpenAI在发布新模型的同时，还大幅扩展了其“网络可信访问计划”（TAC）。这个在2026年2月刚启动的项目，现在的目标是延伸至数千名经过验证的独立防御者，以及数百个保护关键软件的专业团队。

OpenAI的防御逻辑是：与其由一家公司关起门来决定谁有资格保卫网络，不如建立一套客观、自动化的验证体系，赋能给更多的合法防御者。

现在，无论是个人用户还是企业团队，都有了清晰的准入路径。个人可以在特定的页面验证身份，而企业则能通过官方代表申请权限。

这种做法其实是在解决一个长久以来的矛盾——如何防止强大的技术被恶意利用，同时又不至于让繁琐的安全检查成为防御者的绊脚石。

通过引入不同的访问层级，OpenAI正在尝试一种更精细化的管理：普通用户使用带有严密防护的通用模型，而经过严格审查的安全供应商和研究人员，则可以挑战GPT-5.4-Cyber这种更高权限、也更宽松的“特种工具”。

把视野拉长到过去一周，你会发现OpenAI的这次动作有着极强的针对性。

4月7日，Anthropic刚刚展示了他们的“玻璃翼计划” （Project Glasswing）。据称，该公司的Mythos模型已经在操作系统和网页浏览器中发现了数千个主要漏洞。

这种压迫感不仅让同行紧张，甚至让金融监管机构也坐不住了。美国财政部长斯科特·贝森特（Scott Bessent）和美联储主席杰罗姆·鲍威尔（Jerome Powell）甚至专门召集了华尔街领袖，讨论这种新型AI模型可能给金融基础设施带来的冲击。

面对对手这种“先声夺人”的态势，OpenAI采取了另一种叙事方式。他们没有过多地渲染AI可能带来的灾难，而是更强调现有防护措施的有效性。

在4月15日的声明中，他们明确表示，目前的防护栏足以降低风险，并支持当前模型的大规模部署。这种语气上的微妙差异，反映了两家巨头对AI安全哲学的不同理解。Anthropic倾向于通过受控的私密发布来隔绝风险，而OpenAI则更主张通过普及化访问和迭代部署，在实战中学习和改进。

除了新出的Cyber模型，OpenAI也已经在防御生态上投入了真金白银。

比如斥资1000万美元支持网络安全资助计划，以及近期向Linux基金会提供的支持（Anthropic其实也给了）。最实在的成果可能要数半年前启动私测的软件安全智能体Codex Security。根据官方披露的数据，这个系统已经在整个数字生态中帮助修复了超过3000个关键和高危漏洞。

这种防御逻辑的转变影响深远。

过去，软件安全主要靠定期的漏洞审计和一张静态的风险清单。但现在，通过将先进的编程模型集成到开发者的工作流中，安全检查变成了实时的、切实的反馈。这种“在构建中修补”的模式，正在从根本上改变软件开发的底层逻辑。

在这一系列的发布背后，OpenAI还留下了一个预判。

他们认为，从长远来看，未来模型需要更广泛的防御能力，而这种能力很快就会超越当今最好的专用模型，现在的GPT-5.4-Cyber或许只是一个过渡。

随着模型规模的进一步扩大，如何管理那些具备“双用途”特性的高风险能力，将成为整个行业必须面对的挑战。

目前，OpenAI仍在对GPT-5.4-Cyber进行有限的迭代部署。对于那些通过第三方平台访问模型的开发者，他们甚至还保留了诸如“零数据保留” （ZDR）等限制措施，以确保在缺乏直接可见性的情况下依然能维持安全边界。

总体来看，两大AI巨头引爆的网络安全竞赛，释放了一个共同的信号：在未来的数字世界里，最强的盾，必然也是由最聪明的脑来打造。用我们自己的话说，叫作“用魔法打败魔法”。

特约编译金鹿对本文亦有贡献

本文来自微信公众号“腾讯科技”，作者：苏扬，编辑：徐青阳，36氪经授权发布。

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。