DeepMind强化学习掌门人David Silver离职创业,Alpha系列AI缔造者,哈萨比斯左膀右臂
强化学习大神David Silver,离开DeepMind了。
这位在DeepMind待了整整15年的元老级研究员已经出走,创办自己的AI公司Ineffable Intelligence。
根据注册文件显示,这家公司早在2025年11月就已悄然成立,Silver本人于2026年1月16日被正式任命为公司董事。
在正式离职DeepMind前的几个月里,他也一直处于休假状态。
Ineffable Intelligence总部设在伦敦,目前正在积极招募AI研究人才并寻求风险投资。
Google DeepMind的发言人证实了Silver的离职,并对其在职期间的贡献表示感谢。
除了在谷歌 DeepMind 的工作之外,Silver还是伦敦大学学院的教授,他将继续保持这一职务。
15年老兵,DeepMind的“Alpha系列”缔造者
作为强化学习团队的负责人,Silver主导或深度参与了DeepMind几乎所有里程碑式的项目。
他于2010年公司成立之初便加入,彼时DeepMind还只是一个小团队,Silver和Demis Hassabis在剑桥读大学时是老朋友,他们还一同创办过游戏公司Elixir Studios。
2016年,他领导开发的AlphaGo击败围棋世界冠军李世石,成为AI发展史上的标志性事件。
随后的AlphaZero更进一步,在不依赖任何人类棋谱的情况下,仅通过自我对弈就在围棋、国际象棋和日本将棋三个领域达到了超越人类的水平。
MuZero更加激进,能够在不被告知游戏规则的情况下掌握多种不同类型的游戏。
在即时战略游戏领域,AlphaStar成功击败了《星际争霸II》的顶尖职业玩家。
近期他还参与开发了能够解答国际数学奥林匹克竞赛题目的AlphaProof,同时也是Google首个Gemini系列AI模型研究论文的作者之一。
凭借这些成就,Silver获得了2019年度ACM计算奖和2017年度英国皇家工程院银质奖章等多项荣誉。
Silver是DeepMind员工中发表论文最多的人之一,谷歌学术统计其论文被引用超过28万次,h-index高达104。
要做“能永无止境学习”的超级智能
Silver为什么要出来单干?
据知情人士透露,他的动机是希望回归“解决AI领域最难题所带来的敬畏与奇迹”,并将超级智能视为当前最大的未解挑战。
构建一个能够自我发现所有知识基础、永无止境学习的超级智能。
在去年四月的一期播客节目中,Silver表示当前主流的大语言模型虽然强大,但其能力受限于人类已有的知识,毕竟LLM本质上是从人类产出的文本中学习的。
他倡导AI进入一个全新的“经验时代”(Age of Experience),即AI系统通过强化学习从经验中自我学习,从而发现人类未知的新事物。
这一理念的经典例证,就是2016年AlphaGo与李世石比赛中著名的第37手棋,当时所有人类专家都认为这一步是失误,但事后证明它是AlphaGo获胜的关键。
Silver认为,要实现真正的超级智能,AI必须摆脱对人类知识和直觉的依赖,从第一性原理出发进行学习。
参考链接:
[1]https://fortune.com/2026/01/30/google-deepmind-ai-researcher-david-silver-leaves-to-found-ai-startup-ineffable-intelligence/
[2]https://find-and-update.company-information.service.gov.uk/company/16865241
本文来自微信公众号“量子位”,作者:关注前沿科技,36氪经授权发布。















