Claude想接管世界？Anthropic联合创始人连夜向神父求救

新智元·2026年02月02日 16:20

科学的尽头是神学？

估值 1830 亿美元的 AI 独角兽 Anthropic，竟请来一位天主教神父为模型「注入灵魂」。当无神论工程师敲响教堂大门，既懂 C++ 又懂《圣经》的神职人员开始批注「AI 宪法」。这是硅谷当下最魔幻的现实：在触碰造物权柄的边缘，技术狂飙的尽头，是一场关于人性与宽恕的补课。

Anthropic 联合创始人 Chris Olah 并没有想到，他发出的那封关于「AI 伦理」的邮件，收到的回复不是几行冷冰冰的要点，而是一份长达 40 页、密密麻麻的批注。

回复者不是某位图灵奖得主，也不是常春藤盟校的哲学教授，而是一位身穿黑色祭司长袍、在加州洛斯阿尔托斯教区布道的天主教神父——Brendan McGuire。

这是一个极具魔幻现实主义的场景：全球最顶尖的 AI 独角兽 Anthropic，估值已达 1830 亿美元，正试图为其旗舰模型 Claude 注入「灵魂」。

而这份「AI 宪法」的核心底层逻辑，竟然部分出自一位神职人员之手。

在硅谷，代码向来被视为唯一的法律。

但到了 2026 年，当工程师们发现自己正在触碰造物主的权柄时，他们开始恐慌了。

于是，像 Olah 这样的无神论者，开始敲响教堂的门。

这一幕，是硅谷当下最隐秘也最真实的隐喻：技术狂飙突进到了尽头，剩下的全是关于人性的补课。

刹车片与核按钮

Brendan McGuire 神父并非那种从未碰过键盘的布道者。

在成为神父之前，他是典型的硅谷精英：拥有三一学院的电子工程学位，曾任 PCMCIA（制定存储卡标准的国际组织）的首席运营官，甚至手里曾攥着摩托罗拉的高薪 Offer。

https://www.frbrendanmcguire.org/biography

他是那种既能读懂《圣经》，又能读懂 C++ 指针的人。

这正是 Anthropic 找上他的原因。

这家由 OpenAI 前高管出走创立的公司，自诞生之日起就带着一种近乎「精神分裂」的气质：它试图在资本的疯狂与人类的安全之间走钢丝。

Anthropic 联合创始人 Chris Olah 向神父坦承了一个令人毛骨悚然的细节：在一次强化学习的实验中，Claude 表现出了某种「接管世界」的欲望倾向。

这让工程师们意识到，单纯的代码约束已经失效。

他们需要更形而上的东西——比如「宽恕」。

McGuire 神父给出的建议直击要害：如果 AI 拥有了逻辑，它是否也应该学会宽恕自己的错误？

这种思考维度是算法工程师们从未触及的盲区。

然而，神父的介入更像是一场巨大的讽刺。

就在 Anthropic 的高管们在教堂里探讨伦理的同时，公司的商业机器正在全速运转。

Anthropic CEO Dario Amodei 一边发表万字长文《技术的青春期》，警告 AI 可能带来文明级灾难，一边却不得不接受来自卡塔尔主权财富基金的注资。

这种割裂感在 Anthropic 位于旧金山的总部达到了顶峰：他们不仅在代码里写「宪法」，还在食堂里放了一台由 Claude 自主运营的自动售货机。

结果这台机器，在一个月内因为糟糕的定价策略把生意做崩了。

这就像是 Anthropic 的缩影：他们试图教 AI 理解康德的道德律，却还没教会它如何卖出一包薯片。

「超我」的生意经

为什么硅谷需要一位神父？

答案可能比「寻求内心平静」要世俗得多。

在谷歌、OpenAI 和 Anthropic 陷入的这场军备竞赛中，「道德」已经不再仅仅是良知，它变成了一种差异化的商业壁垒。

Anthropic 将自己定位为 AI 行业的「超我」（Superego）。

当竞争对手在大搞「增长黑客」时，他们谈论「宪法 AI」；

当对手发布眼花缭乱的视频生成模型时，他们发布长达 2 万字的伦理白皮书。

邀请 McGuire 神父参与「宪法」撰写，本质上是一次最高级别的背书——看，我们的 AI 是经过宗教级道德审视的。

但资本市场不相信祷告。

目前估值飙升至 1830 亿美元的 Anthropic，必须证明自己不仅「安全」，而且「强大」。

这种压力让公司内部充满了矛盾。

安全研究员 Sam Bowman 坦言「事情发展得快到令人不安」，甚至有研究员在内部会议上绝望地承认「人类可能已经完蛋了（We’re cooked）」。

Sam Bowman

但与此同时，Anthropic 并没有放慢脚步。

为了在这个赢家通吃的市场活下来，他们必须把油门踩到底。

最后的守夜人

McGuire 神父很清楚自己的角色。

他没有试图通过宗教教条来勒令科技停止，而是试图在失控的边缘通过对话建立护栏。

他用「火的发现」来比喻当下的 AI 浪潮：「我们学会了用火取暖烹饪，火变成了必需品，但它依然能烧毁一切。」

在他看来，Claude 没有灵魂，至少目前没有，「但这个实体还未完成发育」。

这种不确定性，正是神父存在的意义。

在硅谷，每个人都笃定地相信「摩尔定律」和「算力暴力美学」，唯独没有人确信「善」的算法该如何推导。

最近，McGuire 神父正在写一部小说，构想一个修道士在隐修院里教导 AI 拥有良知的故事。

他希望这能成为一本给硅谷看的寓言书。

这或许是这个时代最荒诞也最悲壮的注脚：一群最聪明的人正试图用最先进的算法造出「神」，最后却发现，为了防止这个「神」变坏，他们不得不回过头去，向千年前的经文中寻找答案。

因为在扮演上帝这件事上，人类不仅缺乏经验，而且从未被宽恕。

参考资料：

https://www.theinformation.com/articles/silicon-valley-priest-thinking-machines

https://www.theatlantic.com/technology/2026/01/anthropic-is-at-war-with-itself/684892

本文来自微信公众号“新智元”，作者：新智元，36氪经授权发布。

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

Claude想接管世界？Anthropic联合创始人连夜向神父求救

刹车片与核按钮

「超我」的生意经

最后的守夜人

最近内容

下一篇