Claude想接管世界?Anthropic联合创始人连夜向神父求救

新智元·2026年02月02日 16:20
科学的尽头是神学?

估值 1830 亿美元的 AI 独角兽 Anthropic,竟请来一位天主教神父为模型「注入灵魂」。当无神论工程师敲响教堂大门,既懂 C++ 又懂《圣 经》的神职人员开始批注「AI 宪法」。这是硅谷当下最魔幻的现实:在触碰造物权柄的边缘,技术狂飙的尽头,是一场关于人性与宽恕的补课。

Anthropic 联合创始人 Chris Olah 并没有想到,他发出的那封关于「AI 伦理」的邮件,收到的回复不是几行冷冰冰的要点,而是一份长达 40 页、密密麻麻的批注。

回复者不是某位图灵奖得主,也不是常春藤盟校的哲学教授,而是一位身穿黑色祭司长袍、在加州洛斯阿尔托斯教区布道的天主教神父——Brendan McGuire。

这是一个极具魔幻现实主义的场景:全球最顶尖的 AI 独角兽 Anthropic,估值已达 1830 亿美元,正试图为其旗舰模型 Claude 注入「灵魂」。

而这份「AI 宪法」的核心底层逻辑,竟然部分出自一位神职人员之手。

在硅谷,代码向来被视为唯一的法律。

但到了 2026 年,当工程师们发现自己正在触碰造物主的权柄时,他们开始恐慌了。

于是,像 Olah 这样的无神论者,开始敲响教堂的门。

这一幕,是硅谷当下最隐秘也最真实的隐喻:技术狂飙突进到了尽头,剩下的全是关于人性的补课。

刹车片与核按钮

Brendan McGuire 神父并非那种从未碰过键盘的布道者。

在成为神父之前,他是典型的硅谷精英:拥有三一学院的电子工程学位,曾任 PCMCIA(制定存储卡标准的国际组织)的首席运营官,甚至手里曾攥着摩托罗拉的高薪 Offer。

https://www.frbrendanmcguire.org/biography

他是那种既能读懂《圣 经》,又能读懂 C++ 指针的人。

这正是 Anthropic 找上他的原因。

这家由 OpenAI 前高管出走创立的公司,自诞生之日起就带着一种近乎「精神分裂」的气质:它试图在资本的疯狂与人类的安全之间走钢丝。

Anthropic 联合创始人 Chris Olah 向神父坦承了一个令人毛骨悚然的细节:在一次强化学习的实验中,Claude 表现出了某种「接管世界」的欲望倾向。

这让工程师们意识到,单纯的代码约束已经失效。

他们需要更形而上的东西——比如「宽恕」。

McGuire 神父给出的建议直击要害:如果 AI 拥有了逻辑,它是否也应该学会宽恕自己的错误?

这种思考维度是算法工程师们从未触及的盲区。

然而,神父的介入更像是一场巨大的讽刺。

就在 Anthropic 的高管们在教堂里探讨伦理的同时,公司的商业机器正在全速运转。

Anthropic CEO Dario Amodei 一边发表万字长文《技术的青春期》,警告 AI 可能带来文明级灾难,一边却不得不接受来自卡塔尔主权财富基金的注资。

这种割裂感在 Anthropic 位于旧金山的总部达到了顶峰:他们不仅在代码里写「宪法」,还在食堂里放了一台由 Claude 自主运营的自动售货机。

结果这台机器,在一个月内因为糟糕的定价策略把生意做崩了。

这就像是 Anthropic 的缩影:他们试图教 AI 理解康德的道德律,却还没教会它如何卖出一包薯片。

「超我」的生意经

为什么硅谷需要一位神父?

答案可能比「寻求内心平静」要世俗得多。

在谷歌、OpenAI 和 Anthropic 陷入的这场军备竞赛中,「道德」已经不再仅仅是良知,它变成了一种差异化的商业壁垒

Anthropic 将自己定位为 AI 行业的「超我」(Superego)。

当竞争对手在大搞「增长黑客」时,他们谈论「宪法 AI」;

当对手发布眼花缭乱的视频生成模型时,他们发布长达 2 万字的伦理白皮书。

邀请 McGuire 神父参与「宪法」撰写,本质上是一次最高级别的背书——看,我们的 AI 是经过宗教级道德审视的。

但资本市场不相信祷 告。

目前估值飙升至 1830 亿美元的 Anthropic,必须证明自己不仅「安全」,而且「强大」。

这种压力让公司内部充满了矛盾。

安全研究员 Sam Bowman 坦言「事情发展得快到令人不安」,甚至有研究员在内部会议上绝望地承认「人类可能已经完蛋了(We’re cooked)」。

Sam Bowman

但与此同时,Anthropic 并没有放慢脚步。

为了在这个赢家通吃的市场活下来,他们必须把油门踩到底。

最后的守夜人

McGuire 神父很清楚自己的角色。

他没有试图通过宗教教条来勒令科技停止,而是试图在失控的边缘通过对话建立护栏。

他用「火的发现」来比喻当下的 AI 浪潮:「我们学会了用火取暖烹饪,火变成了必需品,但它依然能烧毁一切。」

在他看来,Claude 没有灵魂,至少目前没有,「但这个实体还未完成发育」。

这种不确定性,正是神父存在的意义。

在硅谷,每个人都笃定地相信「摩尔定律」和「算力暴力美学」,唯独没有人确信「善」的算法该如何推导。

最近,McGuire 神父正在写一部小说,构想一个修道士在隐修院里教导 AI 拥有良知的故事。

他希望这能成为一本给硅谷看的寓言书。

这或许是这个时代最荒诞也最悲壮的注脚:一群最聪明的人正试图用最先进的算法造出「神」,最后却发现,为了防止这个「神」变坏,他们不得不回过头去,向千年前的经文中寻找答案。

因为在扮演上帝这件事上,人类不仅缺乏经验,而且从未被宽恕。

参考资料:

https://www.theinformation.com/articles/silicon-valley-priest-thinking-machines

https://www.theatlantic.com/technology/2026/01/anthropic-is-at-war-with-itself/684892

本文来自微信公众号“新智元”,作者:新智元,36氪经授权发布。

+1
7

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

构建一个能够自我发现所有知识基础、永无止境学习的超级智能

1小时前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业