“我不想一辈子只做PyTorch！”创始人8年封神后宣布卸任，AI 圈进入接班时刻

极客邦科技InfoQ·2025年11月07日 14:47

11 月 6 日，PyTorch 创始人 Soumith Chintala 宣布将卸任框架负责人，并离开他就职 11 年的 Meta。

11 月 6 日，PyTorch 创始人 Soumith Chintala 宣布将卸任框架负责人，并离开他就职 11 年的 Meta。这标志着全球最受欢迎的开源深度学习框架之一，进入新的领导阶段。

Chintala 在个人 Twitter 上发布声明，回顾了 PyTorch 的增长历程。他强调，PyTorch 已成为全球 AI 研发的核心支柱，不仅支撑了百亿亿级算力的 AI 训练任务（Exascale），还广泛应用于基础模型研发，为几乎所有主流 AI 公司所采用，在人工智能领域有 90% 以上的应用率。

他确认将于 11 月 17 日卸任，并表示：“我不想一辈子都做 PyTorch。我不想像 Guido 或 Linus 那样，被一件事情绑定数十年。”

仅 8 年就升到副总裁

作为 PyTorch 的联合创始人，Soumith Chintala 长期在 Meta 负责 AI 基础设施、PyTorch 与生成式 AI 的工程工作。根据相关资料来看，他应该属于 FAIR 部门。

值得一提的是，Alexandr Wang 加入 Meta 担任首席 AI 官后，有消息指出 FAIR 自由不再，LeCun 也许也在考虑辞职。上个月底，Meta AI 进行了大裁员，将在其“超级智能实验室”（Superintelligence Lab）内裁减大约 600 个岗位，该实验室目前共有数千名员工。裁员涉及到了 FAIR 研究部门、与产品相关的 AI 团队，以及 AI 基础设施团队。FAIR 研究科学家主管田渊栋也在裁员名单之中。

Alexandr Wang 希望裁员将决策所需的沟通变少，并让“每个人都会承担更多责任，拥有更大的发挥空间和影响力。”

没想到，在 Meta 内部不断变化和动荡之中，Chintala 也选择了离职。

他在 FAIR 这些年里，参与并推动了多项开创性进展：与 Emily Denton、Rob Fergus、Leon Bottou、Martin Arjovsky、Alec Radford 等合作推进 GAN 研究；与 Gabriel Synnaeve 共建《星际争霸》智能体；与 Howard Mansell 搭建首个 FAIR 计算集群；与 Adam Lerer、Piotr Dollar 推进目标检测项目；最终牵头孕育并落地了深度学习框架 PyTorch。

在离职信，他还特别感谢了 Yann LeCun 和 Rob Fergus，“是他们打造了我无比敬仰的早期 FAIR。”

他在 Meta 总共待了十一年，但从软件工程师一路升至副总裁只用了 8 年时间。这一快速晋升也与 PyTorch 的崛起密切相关。

在声明中，他写道：

在 Meta 的十一年——几乎涵盖了我的整个职业生涯。我结识了许多一生的朋友。近八年领导 PyTorch，把它从零做起，带到在 AI 领域 90%+ 的采用率。做出离开的决定，是我此生最艰难的事之一，但我带着满满的感激与满足离开。

PyTorch 现在已经能够支撑百亿亿级算力的训练；它为正在重塑智能边界的基础模型提供动力，几乎所有主流 AI 公司都在生产环境中使用它；从 MIT 的课堂到印度乡村的教室，人们都在学习它。我曾梦想让更多人触手可及的那些工具？现在已经做到了。我想要降低的门槛？几乎已经消失了。

Chintala 本人也承认职业升迁路径得益于 AI 这波热潮。

在 2023 年的一则 Blind 帖子中，有网友发帖提问：“Soumith Chintala 是不是传说中的 Rockstar 级工程师？”帖中提到，他仅用了 8 年就从 SWE 晋升为 Meta 副总裁，还是 PyTorch 的关键开发者，并感叹“他的职业路径让我深受鼓舞。”

有人把这个帖子转给了 Soumith 本人，他说看到这个帖子还是比较尴尬的，但也进行了回复：

“我的职级提升基本是‘天时地利人和、技能匹配’的结果。我做 AI/ML 研究、工程，也有产品思维，沟通能力还不错，情商也还行。自 2013 年前后进入这个行业、并具备这组交叉能力的人，基本都比较成功（比如贾扬清、Andrej Karpathy 等）。

我从来不是房间里工程或研究能力最强的那个人。

如果没有 AI 行业这波热潮，我大概停在 E7 / M2，或者再努力一点到 E8 / D1 吧。”

Pytorch 的开源成功之路

PyTorch 是目前最受欢迎的深度学习框架之一，初始版本于 2016 年 9 月由 Soumith Chintala、Adam Paszke、Sam Gross 等人创建，并于 2017 年在 GitHub 上开源。

PyTorch 起源于一个更早的项目——Torch。早在 2012 年，Soumith Chintala 就已经活跃在 Torch 的开源社区。Torch 是基于 Lua 语言的科学计算库，由 Ronan Collobert 等人在 2005—2009 年间开发而成。当时，它由于灵活高效的设计而被 DeepMind、Twitter、Facebook AI Research（FAIR）等顶尖研究机构广泛使用。

但随着深度学习和科学计算的快速演进，研究者们需要更易用、更现代化的工具。2015 年，Chintala 联合 Torch 社区核心成员决定打造一个“基于 Python 的 Torch 2.0”——这就是 PyTorch 的起点。

“人们已经普遍将 Python 作为主要科学计算语言，因此我们重新用 Python 设计了一个 Torch 的新版本，最终成就了 PyTorch。”

Meta 为其投入了大量资源，是其最大的贡献者之一。但因为起源于 Torch 社区，因此 PyTorch 的开源故事也是一段关于社区力量的佳话：2016 年，Chintala 通过 Torch 的技术博客认识了大学生 Adam Paszke。当时 Adam Paszke 发表了一两篇博文，详细介绍 Torch 的内部结构，成功的引起了 Chintala 的关注。恰好，Adam 在波兰找实习机会但并未成功，于是 Chintala 就邀请他到 Meta 实习并参与 PyTorch 的早期工作。与此同时，包括 Luca Antiga（来自 NVIDIA）、Sam Gross、Piotr Dollar 等人才也陆续加入，组成了一个来自不同公司的在线团队。

“我们可能彼此从未见过面，但在反复共事中，已成为了线上好友。PyTorch 的 DNA 就是这种社区赋权。”

早期团队“敢想敢打”，但在资金与规模上十分捉襟见肘。比如，PyTorch-Distributed 的首个版本，便是 Adam Paszke 与三位同学作为本科课程项目完成的。当时外界对 PyTorch 的最大质疑是“像玩具，不适合生产”。在着手编译器方向的同时，团队抓住了与贾扬清主导的 Caffe2 合并的机会，以换取更大的团队与更稳定、可持续的资金支持——这是由 Soumith 拍板的关键决策。

合并同时引入了“提交必须由 Facebook 工程师完成”的条款。这一取舍在短期内确实增加了与开源社区的摩擦，但换来了工程质量、资金供给与组织执行力的确定性。Soumith 也坦言，这是“明知有副作用、但在当时现实约束下不得不做的选择”。

随后近两年，团队一方面调整编译器栈以满足生产要求，另一方面推进 PyTorch 与 Caffe2 的组织整合——这更像一场“社会工程”而非纯技术问题。这也耗费了大量时间：从 2018 年一直持续到 2020 年。

也正是在这段时间，XLA、TVM 等编译路线迅速壮大，赛道竞争骤然加剧。但这次整合以及“工程化补课”，为后续的跨平台支持与大规模落地打下了坚实基础。

Google 于 2015 年发布的 TensorFlow 也是一个强劲的对手，但相较之下，PyTorch 以更开放的治理、更迅捷的社区响应和易用的动态图模型获得研究者青睐，逐步形成“开发者口碑优势”。在 PyTorch 的前两三年，团队关注的核心不是市场份额或论文引用量，而是用户反馈。

Chintala 每天手动阅读 500 多条来自论坛与 Twitter 的讨论，并尽可能一一回复。团队还建立了与高价值用户（如研究前沿团队、大型科技公司）的反馈机制，确保产品始终朝着真实需求前进。

“我们用下载量、引用量来校验方向，但从不拿它们来‘驱动’团队去开发某个功能。我们走的是一条用户共创、开放迭代的路。”

在一次采访中，当被问及如果从头重写 PyTorch 会怎么选择时，Chintala 表示，会用更多 Python 和 Triton 替代 C++ 内核，并针对硬件优化与符号整数做更激进的设计。尽管如此，他也认为 PyTorch 的底层架构和开放生态是其当时最好的选择。

如今，PyTorch 已成为学术和工业领域的事实标准框架，被从 MIT 到印度乡村课堂广泛使用，也成为 Meta、微软、OpenAI 等 AI 巨头基础设施的一部分。

“我们目前观察到的一个流行趋势是，很多用户甚至并不知道他们在使用 PyTorch，他们只知道自己正在使用被打包的 Mac 应用或者通过 Hugging Face 等提供的稳定扩展功能。”

告别 PyTorch，从零开始

对于 Chintala 的离职，X 平台上一片唏嘘，Andrej Karpathy 也给出了评价：

“干得漂亮，Soumith！在我经历过的所有深度学习框架更迭中（几乎每次都要把代码重写一遍：Matlab → Caffe → NumPy → Torch → PyTorch），迁往 PyTorch 的体验是最愉快的，而且它也成为我用得最久的一次。PyTorch 在由目标与约束构成的‘20 维设计空间’里，恰好踩中了时代的‘最佳组合’。祝你在最让你兴奋的领域，开启新的黄金时代！”

LeCun 也送出了他的祝福。