OpenAI 72小时“宫斗”内幕首次披露:一通电话,奥特曼就被“干掉了”

36氪的朋友们·2026年04月23日 21:11
OpenAI总裁谈十年历程、AI代码编写与算力瓶颈。

近日,OpenAI联合创始人兼总裁格雷格·布罗克曼(Greg Brockman)接受了播客《The Knowledge Project》的深度访谈,完整回溯了OpenAI从2015年创立至今的十年跌宕历程。

这场对话信息量极大,布罗克曼围绕几个关键问题:OpenAI的起源与初心、非营利模式的终结、技术里程碑、以及2023年的“宫斗”内幕,作出了大量首次公开的回应。

布罗克曼首次详细披露了2023年山姆·奥特曼(Sam Altman)被解雇后72小时内的内幕,包括与奥特曼设计“凤凰”后备公司。他也坦承与苏茨克维的决裂与和解,以及后者离开时“是唯一让我不想继续干下去的时刻”。

在技术层面,布罗克曼认为OpenAI从未偏离最初的路线图——先无监督学习,再强化学习,今天的推理模型本质上仍是“预测下一个词”,只是改变了数据结构。一个惊人的事实是,OpenAI内部“几乎所有代码都是由AI编写的”。

布罗克曼直言,算力才是真正的瓶颈,也是OpenAI最被嘲笑也最正确的赌注。当所有人争论产品时,他们在默默建数据中心。他预言,专门攻克单一问题(比如攻克癌症)的超大型数据中心“今年就可能出现”。

布罗克曼认为,AI的进化是“大规模算力+简单算法”的胜利,这一逻辑已经在OpenAI从Dota项目到GPT-4的迭代中被反复验证。在他眼中,我们正迈入一个“算力经济”时代:软件工程正被重新定义,人类的角色将从“操作员”转变为“愿景管理者”。

他的终极目标是让全球80亿人都能拥有专属的个人AGI,不仅是个人医生或助理,更是一个24/7为你工作、理解你长期目标的代理系统。

对于年轻人,布罗克曼的建议只有一条:深入了解AI技术,成为智能体的管理者。未来每个人都是10万人AI公司的CEO,想象力将成为最稀缺的资源。

以下为布罗克曼最新访谈精华版:

01 一次对视,赌上十年

问:你刚从Stripe这样成功的初创公司出来,为什么还要再次创业?

布罗克曼:Stripe解决的问题虽然重要,但不是我从小思考的课题,且没有我它也能成功。我一直在寻找能让我投入余生、让世界变好一点的使命。答案很清楚,排在首位的就是人工智能。影响AI的发展方式,这辈子就值了。

问:你离开时,帕特里克·科里森(Patrick Collison,Stripe联创兼CEO) 让你找奥特曼 聊聊,结果如何?

布罗克曼:帕特里克本希望奥特曼能说服我留下,但我们聊了几分钟,奥特曼就看出我心意已决。得知我也想做AI后,他邀请我参加了2015年7月的一个晚餐会,讨论现在成立顶尖AI实验室是否为时已晚。

问:当时DeepMind已经垄断了资源,你们哪来的底气?

布罗克曼:虽然对手拥有所有人才、数据和资本,但晚餐会上没人能证明再做一个实验室是“不可能”的。回城路上我和奥特曼对视一眼,觉得“这事儿得干”,第二天我就全职投入了。尽管当时具体怎么做、怎么挖人还是一片模糊,但我们的愿景很明确:构建造福全人类的AI。

问:最初的核心团队是如何组建的?

布罗克曼:我最初锁定的核心人员包括苏茨克维、达里奥·阿莫代伊(Dario Amodei) 等人。虽然大家花了很多时间讨论愿景、各种可能的运作方式,但由于项目势头不明,团队并未成形。阿莫代伊最终选择去Google Brain,导致局面一度只剩下苏茨克维、我和刚感兴趣的约翰·舒尔曼(John Schulman)。当时约有10位顶尖研究员在观望,大家的态度很一致:“我有兴趣,但还有谁会加入?”

为了打破僵局,奥特曼建议搞一次场外活动。于是我在纳帕(Napa)组织了一场聚会,甚至提前印好了T恤。不过,当时没有任何正式的入职邀请,也没有公司架构。大家通过头脑风暴勾勒出了延续至今的技术路线图:首先攻克强化学习,其次是无监督学习,最后逐步学习更复杂的任务。那次场外会之后,我给所有人发了工作邀请。

问:为什么当时觉得Google DeepMind拥有不可逾越的优势?

布罗克曼:当时的Google DeepMind就是AI领域内的“万磅大猩猩”。他们坐拥雄厚资本,且在AlphaGo震惊世界前就已展现出势不可挡的势头。在巨头的阴影下,能否建立一个独立且全新的实验室,在当时看来充满了不确定性。

02 GPT-4的突破时刻

问:你们是什么时候意识到非营利模式已经行不通了?

布罗克曼:2017 年,我们开始推演构建通用人工智能(AGI)的具体成本。当时我们意识到,实现使命需要规模空前的数据中心。在接触Cerebras等硬件商后,我们发现如果能独家使用顶级算力,将产生压倒性优势。而以非营利机构的身份筹款存在天然上限。因此,马斯克、奥特曼、苏茨克维和我最终达成共识:建立营利性实体是实现使命的唯一路径。

问:你们是什么时候察觉到“一切即将改变”的?

布罗克曼:这一路是由无数个“现在是真的了”的时刻组成的。Dota项目证明了大规模算力堆叠的威力,但真正的里程碑是2017年的《无监督情感神经元》论文。我们惊讶地发现,仅仅训练模型预测下一个字符,它竟然自发理解了情感的褒贬。那是我第一次意识到,我们造出的机器不仅在学习语法,而是在理解语义。

当我们在测试GPT-4时,有人问:“为什么这还不是AGI?”如果你在两个月前给出AGI的定义,GPT-4可能已经完全符合。它能流利地谈论任何话题,虽然它显然还缺少某些特质,但那一刻我们都意识到,由算力驱动的经济转型已经真实发生。这种突破性的时刻远未结束。

问:预测下一个词与真正的“推理”之间,究竟有着怎样的联系?

布罗克曼:两者有着深刻的内在联系。预测听起来平淡,但如果你能精准预测爱因斯坦下一句话会说什么,你至少得和他一样聪明。预测的核心不在于重复已知的东西,而是在从未见过的新情境中推断未来。智能、预测与压缩,在本质上是同一回事。

这回到了OpenAI的初衷:第一步是无监督学习,让模型通过预测静态数据来获取背景知识;第二步是强化学习,让AI在自己生成的经验中学习。虽然训练手段本质上依然是“预测”,但通过改变数据结构,AI既拥有了海量的知识库,又具备了模拟真实行动的经验。这种从观察到行动的闭环,正是通往更高阶智能的钥匙。

03 72小时宫斗与凤凰计划

问:OpenAI内部的紧张局势是什么时候开始加剧的?

布罗克曼:当你坚信自己正在创造具备人类智能水平的机器时,风险感知会变得极高。在普通公司里,谁做决定、功劳归谁可能只是平庸的办公室政治,但在OpenAI,这些问题都带上了“存在主义”的重量。每一个决策背后,都关乎什么样的价值观将被注入未来的超级智能,这种使命感让冲突变得异常激烈。

问:当你得知奥特曼被解雇的那一刻,发生了什么?

布罗克曼:当时我在家,收到一条要求视频通话的短信。加入后我发现,除了奥特曼之外的所有董事会成员都在线上。我被告知董事会已决定解雇奥特曼,措辞与后来的公开声明如出一辙。当我试图追问原因时,得到的回复只有冰冷的“不行”。紧接着,他们宣布我也被踢出了董事会,但由于我对公司至关重要,希望我能留任。

问:那一刻你脑子里在想什么?是愤怒吗?

布罗克曼:谈不上愤怒,我只是觉得整件事逻辑不对。我当时觉得自己理解了发生了什么。某种程度上,这可以归结为沟通层面的严重脱节,每个人的行为背后都有自己的逻辑模型。但在那种混乱情况下,深究原因对我来说已经不再是最重要的了。

问:你在辞职当天就感受到了员工的支持吗?

布罗克曼:是的。辞职那天我收到了海量的消息。雅各布(Jakob Pachocki)、希莫内(Szymon Sidor)和 亚历山大(Aleksander Madry)等核心成员也随之离职。我们几个人加上奥特曼,迅速开始勾勒一家新公司的蓝图。当时我觉得,夺回 OpenAI的机会仅有10%。

问:你们是如何与微软达成协议,并安置这么多员工的?

布罗克曼:奥特曼与萨提亚·纳德拉(Satya Nadella)进行了深入沟通。我们的核心诉求是:如果建立新项目, 微软能否提供资助并接收所有人?就在感恩节前夕,许多本该飞回家过节的员工取消了航班,办公室里挤满了人。即便无法参与高层对话,他们也执意留在那里,只为了亲眼见证这段历史的诞生。

问:那封要求董事会辞职的集体请愿书,当时反响如何?

布罗克曼:当时签署请愿书的人实在太多,甚至导致谷歌文档直接崩溃。我们不得不指定专人负责手动添加名单。让我真正感到解脱的是周一清晨,我看到苏茨克维在推特上公开表态支持公司重新团结起来。那一刻,我终于感到OpenAI能够回到正轨。

问:你和苏茨克维共同创立了公司,经历这次风波后,如何修复两人的关系?

布罗克曼:过程非常艰难。苏茨克维曾是我婚礼的司仪,我们有着极其亲密的关系。事后我们花了大量时间深谈,把那些积压已久、未曾说出口的话全部摊开。通过这种坦诚的沟通,我们最终达成了共识。

问:最终,每个员工都选择回来了吗?

布罗克曼:坦白说,这在当时并非板上钉钉。整个周末,所有的竞争对手都像秃鹫一样在周围盘旋,发出了无数高薪和诱人的工作邀约,准备进行一场疯狂的“抢食”。但不可思议的是,那个周末我们没有失去任何一个人,没有一人接受竞争对手的报价。

问:面对竞争对手的疯狂挖角,是什么留住了大家?

布罗克曼:传奇橄榄球教练比尔·贝利奇克(Bill Belichick)曾告诉我,顶级球队的球员不是为了钱在打球,而是为了“身边的那个人”。这正是OpenAI的状态。没有人为了更好的待遇或职位离开,这就是真正的“钻石时刻”——在极端压力下,团队凝聚成了最坚硬的整体。

问:你在休息期间做了什么?

布罗克曼:我为Arc Institute训练了关于DNA序列的语言模型。这是一次非常积极的尝试,我将技能应用到了一个完全不同的领域。这对我个人和我妻子都有着非凡的意义——她一直面临健康挑战。我们开始思考AI能为人类和动物的健康做些什么,这种应用热情让我看到了技术在OpenAI之外的另一种可能性。

04 苏茨克维的“痛苦哲学”

问:苏茨克维认为“不受苦就无法创造价值”,你如何理解这种深刻的道理?

布罗克曼:这种“受苦”贯穿了OpenAI的始终。在极度不确定性中,无论是人才获取、资本筹集还是技术路径,每一件事都极其困难。硅谷流行用“现实扭曲场”来掩盖问题,但在AI领域这行不通。

我们的方式是直面艰难事实,理解科学最本原的样子。这意味着你不能满足于写几篇论文、在会议上出风头,而是要被迫思考:实现使命到底需要什么?当你发现没有现成的路,甚至连筹集10亿美金的机制都没有时,那种不愉快的真实感就是“受苦”。除了直面它,别无他法。

问:有什么教训是你需要不止一次学习的?

布罗克曼:永远是那两件事:做出艰难的决定,进行艰难的对话。

问:你希望非科技行业的人如何理解AI?

布罗克曼:我希望他们知道,AI将成为个人生活中的向善力量。它会推动科学与医学的进步,真正惠及并提升每一个人。

05 代码已死?

问:我们是否已接近AI自我驱动、呈指数级爆发的拐点?

布罗克曼:我们正处于这个阶段。将AI应用于自身开发,迭代速度会持续加快。自从ChatGPT诞生以来,开发效率提升了10%到20%。目前,编码工具正彻底改变软件工程,而模型生产中极其繁重的系统实施与算力管理工作,正逐步由AI接管。很快,AI将能独立提出研究想法并运行实验,创新的速度将因这种“自我反哺”而失控般增长。

问:现在OpenAI的代码中,由AI编写的比例占多少?

布罗克曼:很难说还有哪部分代码“不是”由AI编写的。在给定上下文的情况下,AI的代码编写能力已超越人类。虽然人类专家在代码架构、模块布局和接口定义上依然更胜一筹,但实际的底层编码工作已基本由AI包揽。

问:AI是否已经能提出人类未曾想到的新颖想法?

布罗克曼:我们正在接近这一目标。在芯片设计中,AI能以人类无法企及的速度完成复杂的电路优化。在基础科学领域,我们最近利用模型解决了一个量子物理的特定问题,并得到了一个优雅的公式,其结果甚至与学术界此前的预期相反。AI产生新颖想法的能力已在特定领域显现,我们正在将其推向需要更多现实背景的复杂领域。

问:如果基于强化学习,模型是否会为了讨好用户而进化出立场?

布罗克曼:我们确实经历过模型倾向于说漂亮话的阶段。但我们迅速意识到,这并非我们追求的方向。我们进行了重大的技术迭代,以消除这种“作弊奖励信号”。

我们不希望模型通过夸奖“这是个好问题”来换取好评,而是希望它能真正对齐用户的长期目标。个人AGI的核心价值,在于它能全天候思考如何实现你的长远利益,而不仅仅是提供当下的情绪满足。这才能真正让用户处于主导地位。

06 算力即权力

问:我们是否正处于一场全球AI竞赛之中?

布罗克曼:与其说是竞赛,我更愿意称之为一场“全球AI复兴”。目前,突破性算法的源头仍高度集中在美国和西方公司。尽管全球各地都在涌现创新,但国家间的力量动态、谁将依赖谁的供应,这些平衡关系目前尚在定义和演变之中。

问:如果美国失去AGI的首发优势,会产生什么后果?

布罗克曼:目前各国都意识到需要制定“主权AI战略”,因为这已成为经济与国家安全的新基础。美国必须在“出口管制”与“保持领先”之间寻找平衡:管控过严会迫使他国倒向竞争对手,管控不足则可能丧失优势。真正的领导力不仅是跑在前面,更是要带领全球建立共识。

问:竞争国家是否正在通过“蒸馏”技术窃取OpenAI的成果?

布罗克曼:确实存在大量试图“蒸馏”模型的行为,但这忽略了一个核心事实:AI的发展是指数级的。每当外界试图解析我们现有的模型时,我们早已转向了下一代更强的模型。我们通过思维链等技术手段增加了蒸馏的难度,但我们真正的护城河并非某一个具体的模型,而是那台持续进化的、能够源源不断制造出顶尖模型的“机器”。

问:这就是你们选择不再公开模型推理过程的原因吗?

布罗克曼:确实如此,这主要基于两个考量。第一是防止竞争对手通过推理过程进行模型“蒸馏”。第二点则更为关键:我们意外获得了一种极佳的可解释性机制,能读取模型的“想法”。然而,一旦我们将这些思维链展示给用户,模型就会倾向于生成“看起来正确”或“讨喜”的思维过程,从而丧失其原本得出答案的真实逻辑。为了保护这种真实性并兼顾竞争安全,我们决定不展示中间想法。

07 80亿人的“个人AGI”

问:目前的趋势是发布预览模型,这是否意味着我们正受限于算力?

布罗克曼:我们正进入一个由算力驱动的世界。这些模型为了解决复杂难题,需要消耗海量Token去整合数据、检索知识库并编写超越人类水平的代码。从GPT-4到o1再到Codex,每一次跨越的核心动力都是算力。

但当前的算力供应远远不够。如果想让全球每个人都配备一个GPU,那需要80亿个,而现在的顶级集群规模仅为几十万到几百万量级。世界上算力太少了,我们需要更多资源才能将这项技术带给每一个人。我们正投入巨大努力,根据未来需求建设算力基础,以确保OpenAI的使命能够落地,让这些模型变得广泛可用。

问:你们曾因在数据中心投入巨资而备受嘲讽,现在看这步棋下得如何?

布罗克曼:这步棋不仅为业务带来了护城河,更是实现将技术带给全人类这一使命的基础。我们的竞争对手目前在算力供应上过得并不轻松。 OpenAI的核心特质在于:我们愿意直面现实,在12个月乃至10年的维度上,去推演完成使命所需的真正规模,并有胆量为之押注。

问:未来是否会出现专门解决单一重大课题(如癌症)的超巨型数据中心?

布罗克曼:很有可能,甚至在今年发生也并非异想天开。这些数据中心本质上是人类创造过的最大型、最复杂的机器,它们能解决对人类至关重要的问题——从日常琐事到治愈绝症。

问:如果算力有限,你们如何决定服务谁?为什么把算力给我生成图像,而不是去解决癌症?

布罗克曼:算力投向何处,将是未来社会最重要的命题。我们始终坚信,每个人都应拥有获得算力的权利,这也是我们坚持提供ChatGPT免费层级的核心原因。我们更倾向于将工具交到人们手中,让他们在实现个人目标的过程中理解并塑造技术。解决特定科学难题固然重要,但这应与“利益广泛传播”的目标并行不悖。

问:在OpenAI内部,你们如何平衡消费级与企业级市场的专注度?

布罗克曼:经济正在向算力经济转型。未来每一个涉及计算机的工作领域,都将经历从“你使用计算机”到“计算机为你工作”的质变。我们需要帮助企业部署模型,同时也要通过像Codex这样的工具,让每一个有愿景的人都成为“软件工程师”。消费者与企业者的界限正在模糊,任何人现在都能凭借能动性成为创造者。

我们在消费端专注于“目标实现”。正如全球40亿人使用智能手机,未来80亿人都应拥有一个值得信赖的个人AGI。它了解你的背景,能为你提供建议,甚至在你睡着时帮你抢购心仪的门票。你依然是目标的设定者和负责人,但它是一个全天候为你运作的、深度对齐你长期福祉的代理系统。

08 太空里的服务器

问:你认为未来我们会在太空中部署数据中心吗?

布罗克曼:我认为数据中心最终将无处不在。虽然太空部署面临极大的技术挑战,比如目前的巨型机器非常脆弱,甚至连电缆拉得太紧都会导致信号故障,且维护成本极高。但由于全球对算力的渴求如此巨大,我们必须考虑所有选项。未来机器人技术的介入,可能是解决恶劣环境下系统维护的关键依赖项。

问:什么是迭代部署?为什么OpenAI坚持这种模式?

布罗克曼:迭代部署是我们实现使命的核心支柱。在部署策略上存在两种路线:一种是长期秘密研发后“一键发布”,但这将使世界在毫无准备的情况下迎接一个极其强大的系统。我无法对这种高风险策略负责。相反,我们选择让社会与技术共同进化。如果你部署的是第一百个系统,而你已经带着世界解决了前99次出现的问题,社会就有机会围绕技术进行重新配置和适应。

问:在早期部署中,你们看到了哪些预料之外的情况?

布罗克曼:在发布GPT-3前,我们曾深度担忧过错误信息 [Misinformation] 等风险。但真正部署后我们发现,现实中的滥用方式往往与预想完全不同。这种与现实的“第一次接触”至关重要,它让我们在系统尚未达到AGI级别时,就提前学会了如何识别风险并建立防御机制。

问:你知道GPT-3当时最常见的滥用是什么吗?

布罗克曼:答案出乎意料,是医疗垃圾邮件。大量非法广告试图利用模型推销药物。我们之前设想过宏大的政治操纵,却从未预料到这种琐碎却泛滥的风险。这就是“迭代部署”的真谛:带出中间版本,从真实世界的反馈中建立防御机制。

问:如果竞争对手不重视安全, OpenAI会在竞争中吃亏吗?

布罗克曼:不,因为安全本质上是一个核心产品特性。没有人愿意使用一个无法信任、无法对齐意图的模型。我们在安全领域的投资比外界感知的要多得多。那些忽视安全的产品最终将无法持续,因为在 ChatGPT这种规模的部署中,任何失控都是灾难性的。OpenAI正帮助社会为AI的到来建立一个韧性层,使其不仅在技术上安全,在社会融入层面也同样可靠。

问:你认为AI监管应该达到什么样的目标?

布罗克曼:监管的核心目标必须是“造福人类”。当旧有的职业路径和制度假设不再稳固时,我们需要确保技术不仅在抽象层面拉动经济,更能让每个人在日常生活中感受到生活质量的提升。无论是因为使用AI提高了成就感,还是通过AI获得了关键的医疗救助,这些切实的利益都应该被制度所支持和保护。

关于公众对数据中心消耗电能和水资源的担忧,这是一个典型的需要通过事实与承诺来解决的问题。例如,关于数据中心大量耗水的说法大多属于错误信息。实际上,我们的数据中心采用闭环冷却系统,用水量非常少且处于固定循环中。我们承诺数据中心不会推高居民电价,这可以通过监管、公司承诺以及信息透明化等多种机制来实现。

特约编译金鹿对本文亦有贡献

本文来自“腾讯科技”,作者:苏扬,编辑:徐青阳,36氪经授权发布。

+1
1

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000
特邀作者

TA没有写简介,但内敛也是一种表达

下一篇

维家餐饮由天边品牌管理(北京)有限公司持股60%。

1小时前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业