DeepMind强化学习掌门人David Silver离职创业，Alpha系列AI缔造者，哈萨比斯左膀右臂

量子位·2026年02月02日 16:19

构建一个能够自我发现所有知识基础、永无止境学习的超级智能

强化学习大神David Silver，离开DeepMind了。

这位在DeepMind待了整整15年的元老级研究员已经出走，创办自己的AI公司Ineffable Intelligence。

根据注册文件显示，这家公司早在2025年11月就已悄然成立，Silver本人于2026年1月16日被正式任命为公司董事。

在正式离职DeepMind前的几个月里，他也一直处于休假状态。

Ineffable Intelligence总部设在伦敦，目前正在积极招募AI研究人才并寻求风险投资。

Google DeepMind的发言人证实了Silver的离职，并对其在职期间的贡献表示感谢。

除了在谷歌 DeepMind 的工作之外，Silver还是伦敦大学学院的教授，他将继续保持这一职务。

15年老兵，DeepMind的“Alpha系列”缔造者

作为强化学习团队的负责人，Silver主导或深度参与了DeepMind几乎所有里程碑式的项目。

他于2010年公司成立之初便加入，彼时DeepMind还只是一个小团队，Silver和Demis Hassabis在剑桥读大学时是老朋友，他们还一同创办过游戏公司Elixir Studios。

2016年，他领导开发的AlphaGo击败围棋世界冠军李世石，成为AI发展史上的标志性事件。

随后的AlphaZero更进一步，在不依赖任何人类棋谱的情况下，仅通过自我对弈就在围棋、国际象棋和日本将棋三个领域达到了超越人类的水平。

MuZero更加激进，能够在不被告知游戏规则的情况下掌握多种不同类型的游戏。

在即时战略游戏领域，AlphaStar成功击败了《星际争霸II》的顶尖职业玩家。

近期他还参与开发了能够解答国际数学奥林匹克竞赛题目的AlphaProof，同时也是Google首个Gemini系列AI模型研究论文的作者之一。

凭借这些成就，Silver获得了2019年度ACM计算奖和2017年度英国皇家工程院银质奖章等多项荣誉。

Silver是DeepMind员工中发表论文最多的人之一，谷歌学术统计其论文被引用超过28万次，h-index高达104。

Silver为什么要出来单干？

据知情人士透露，他的动机是希望回归“解决AI领域最难题所带来的敬畏与奇迹”，并将超级智能视为当前最大的未解挑战。

构建一个能够自我发现所有知识基础、永无止境学习的超级智能。

在去年四月的一期播客节目中，Silver表示当前主流的大语言模型虽然强大，但其能力受限于人类已有的知识，毕竟LLM本质上是从人类产出的文本中学习的。

他倡导AI进入一个全新的“经验时代”（Age of Experience），即AI系统通过强化学习从经验中自我学习，从而发现人类未知的新事物。

这一理念的经典例证，就是2016年AlphaGo与李世石比赛中著名的第37手棋，当时所有人类专家都认为这一步是失误，但事后证明它是AlphaGo获胜的关键。

Silver认为，要实现真正的超级智能，AI必须摆脱对人类知识和直觉的依赖，从第一性原理出发进行学习。

参考链接：

[1]https://fortune.com/2026/01/30/google-deepmind-ai-researcher-david-silver-leaves-to-found-ai-startup-ineffable-intelligence/

[2]https://find-and-update.company-information.service.gov.uk/company/16865241

本文来自微信公众号“量子位”，作者：关注前沿科技，36氪经授权发布。

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。