小作文、安全牌,OpenAI被动反击Anthropic

36氪的朋友们·2026年04月15日 11:06
前浪反击后浪。

OpenAI和Anthropic的针锋相对,全面覆盖了产品、资本和商业层面。

近日,Anthropic宣布推出专门用于挖掘漏洞的AI模型Claude Mythos,引发了行业“恐慌”。

4月14日,OpenAI发内部备忘录在舆论场上发起反击,直指Anthropic靠“贩卖恐惧”拉拢客户,并炮轰其营收虚报高达80亿美元。

紧接着,OpenAI又于15日发布了专门针对网络安全微调的全新模型变体GPT-5.4-Cyber,还直接放宽了此前严苛的“拒绝访问”边界。

01

AI接棒网络安全

OpenAI这次发布的GPT-5.4-Cyber,本质上是其最新旗舰模型的一个特殊变体。它最核心的改变在于,它不再像通用模型那样“谨小慎微”。

以前,当你试图让模型分析一段具有攻击特征的代码时,安全防护机制可能会因为过于敏感而直接拒绝请求。而这个全新的GPT-5.4-Cyber,通过降低合法网络安全工作的拒绝边界,让防御者能够真正深入到那些敏感的灰色地带。

更让业界关注的是,这个新模型具备了二进制逆向工程能力。这意味着安全专业人员不再需要依赖源代码,就能直接对编译后的软件进行“解剖”。

这种能力的同步提升,意味着网络防御正在从过去的人工审计,转向一种由智能体驱动的持续防御模式。这种转变并非突发奇想,而是OpenAI筹划已久的策略,他们希望防御能力能与模型本身的进化速度保持完全同步。

02

采用用户分级制接入

光有强大的工具还不够,谁能用、怎么用,才是解决网络风险的关键。

OpenAI在发布新模型的同时,还大幅扩展了其“网络可信访问计划”(TAC)。这个在2026年2月刚启动的项目,现在的目标是延伸至数千名经过验证的独立防御者,以及数百个保护关键软件的专业团队。

OpenAI的防御逻辑是:与其由一家公司关起门来决定谁有资格保卫网络,不如建立一套客观、自动化的验证体系,赋能给更多的合法防御者。

现在,无论是个人用户还是企业团队,都有了清晰的准入路径。个人可以在特定的页面验证身份,而企业则能通过官方代表申请权限。

这种做法其实是在解决一个长久以来的矛盾——如何防止强大的技术被恶意利用,同时又不至于让繁琐的安全检查成为防御者的绊脚石。

通过引入不同的访问层级,OpenAI正在尝试一种更精细化的管理:普通用户使用带有严密防护的通用模型,而经过严格审查的安全供应商和研究人员,则可以挑战GPT-5.4-Cyber这种更高权限、也更宽松的“特种工具”。

03

当奥特曼遇上“玻璃翼计划”

把视野拉长到过去一周,你会发现OpenAI的这次动作有着极强的针对性。

4月7日,Anthropic刚刚展示了他们的“玻璃翼计划” (Project Glasswing)。据称,该公司的Mythos模型已经在操作系统和网页浏览器中发现了数千个主要漏洞。

这种压迫感不仅让同行紧张,甚至让金融监管机构也坐不住了。美国财政部长斯科特·贝森特(Scott Bessent)和美联储主席杰罗姆·鲍威尔 (Jerome Powell) 甚至专门召集了华尔街领袖,讨论这种新型AI模型可能给金融基础设施带来的冲击。

面对对手这种“先声夺人”的态势,OpenAI采取了另一种叙事方式。他们没有过多地渲染AI可能带来的灾难,而是更强调现有防护措施的有效性。

在4月15日的声明中,他们明确表示,目前的防护栏足以降低风险,并支持当前模型的大规模部署。这种语气上的微妙差异,反映了两家巨头对AI安全哲学的不同理解。Anthropic倾向于通过受控的私密发布来隔绝风险,而OpenAI则更主张通过普及化访问和迭代部署,在实战中学习和改进。

除了新出的Cyber模型,OpenAI也已经在防御生态上投入了真金白银。

比如斥资1000万美元支持网络安全资助计划,以及近期向Linux基金会提供的支持(Anthropic其实也给了)。最实在的成果可能要数半年前启动私测的软件安全智能体Codex Security。根据官方披露的数据,这个系统已经在整个数字生态中帮助修复了超过3000个关键和高危漏洞。

这种防御逻辑的转变影响深远。

过去,软件安全主要靠定期的漏洞审计和一张静态的风险清单。但现在,通过将先进的编程模型集成到开发者的工作流中,安全检查变成了实时的、切实的反馈。这种“在构建中修补”的模式,正在从根本上改变软件开发的底层逻辑。

04

当防御模型超越通用模型之后

在这一系列的发布背后,OpenAI还留下了一个预判。

他们认为,从长远来看,未来模型需要更广泛的防御能力,而这种能力很快就会超越当今最好的专用模型,现在的GPT-5.4-Cyber或许只是一个过渡。

随着模型规模的进一步扩大,如何管理那些具备“双用途”特性的高风险能力,将成为整个行业必须面对的挑战。

目前,OpenAI仍在对GPT-5.4-Cyber进行有限的迭代部署。对于那些通过第三方平台访问模型的开发者,他们甚至还保留了诸如“零数据保留” (ZDR)等限制措施,以确保在缺乏直接可见性的情况下依然能维持安全边界。

总体来看,两大AI巨头引爆的网络安全竞赛,释放了一个共同的信号:在未来的数字世界里,最强的盾,必然也是由最聪明的脑来打造。用我们自己的话说,叫作“用魔法打败魔法”。

特约编译金鹿对本文亦有贡献

本文来自微信公众号“腾讯科技”,作者:苏扬,编辑:徐青阳,36氪经授权发布。

+1
6

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

互联网养虾真实现状

1小时前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业