吴恩达年终总结:2025是AI工业时代的黎明
2025 年已经走到了尾声。
关注 AI 圈的读者们都知道,今年是各路 AI 巨头神仙打架的一年,是人才大战架构重组极其频繁的一年,是大模型军备竞赛出奇白热化的一年,也是 AI 基础设施建设如火如荼的一年……
在这精彩绝伦的一年的结尾,我们的老朋友:斯坦福大学计算机科学客座教授,前百度 AI 负责人,前谷歌大脑负责人吴恩达老师,发表了今年的保留节目:一封信,和一篇 2025 的人工智能领域年度总结。
年末寄语:三把金钥匙
元旦假期将至,学生们美妙的寒假以及春节假期也近在眼前。「永远不要停止学习」是假期前的老生常谈,尤其是希望在蓬勃进化的,高度竞争的人工智能领域内谋求发展机会的人。应当做什么,怎么做,吴恩达在今年的信中给出了他的见地。
以下是公开信全文:
亲爱的朋友们:
又一年,AI 以惊人的速度向前推进,为所有人 —— 包括刚进入这个领域的新手 —— 创造了前所未有的软件开发机会。事实上,许多公司现在最大的困扰之一,就是找不到足够多真正懂 AI 的工程师。
每年冬季假期,我都会留出一段时间来学习和动手构建项目,希望你们也能如此。这不仅能帮助我打磨已有技能、掌握新知识,也能实实在在地推动你的技术职业发展。
要真正具备构建 AI 系统的能力,我建议你做到三点:
系统地学习 AI 课程
持续动手构建 AI 系统
(可选)阅读研究论文
下面我解释为什么这三点都如此重要。
我常听到一些开发者建议别人:「别学了,直接上手做就行。」这是非常糟糕的建议!除非你已经身处一个经验丰富的 AI 开发者社群中,否则在没有理解 AI 基础的情况下贸然动手,很容易导致你重复发明轮子,或者更糟糕的是,把轮子重新发明得一团糟。
举个例子,在面试中,我见过不少候选人:自己重新发明了一套标准的 RAG 文档切分策略;重复实现了已经成熟的 Agentic AI 评估方法;写出了结构混乱、难以维护的 LLM 上下文管理代码。如果他们提前上过几门相关课程,就会更清楚哪些「积木」已经存在于行业中。他们当然仍然可以选择从零实现这些模块,甚至发明出比现有方案更好的方法,但至少能避免浪费数周时间走弯路。
因此,结构化学习至关重要。
而且说实话,我个人觉得上课非常有趣。与其看 Netflix,我更愿意随时打开一门优秀 AI 讲师的课程来学习。
同时,仅仅上课是不够的。有许多重要的经验,只有通过亲手实践才能真正学到。学习飞机是如何运作的理论,对于成为一名飞行员当然非常重要,但从来没有人只靠上课就学会开飞机。在某个时刻,真正坐进驾驶舱是不可或缺的!好消息是:随着高度智能化(highly agentic)的编程助手出现,动手构建的门槛已经比以往任何时候都低。而当你开始学习 AI 的各种构建模块时,它们常常会激发你对「还能做些什么」的新想法。如果我一时找不到项目灵感,我通常会去上几门课,或者读一些研究论文。这样坚持一段时间后,我总会冒出一大堆新的项目想法。而且,说实话,我觉得「做东西」本身真的很有趣,也希望你能体会到这种乐趣!
最后,并不是每个人都必须这样做,但我发现如今就业市场上最强的一批候选人,几乎都会偶尔阅读研究论文。虽然在我看来,论文比课程难啃得多,但它们包含了大量尚未被翻译成更易理解形式的前沿知识。我会把读论文的优先级排在课程和实践之后,但如果你有机会提升阅读论文的能力,我仍然强烈建议你这样做。(你也可以看看我以前讲过的一段关于如何读论文的视频。)上课和动手构建对我来说很有趣,读论文则更像是一种「磨练」,但从论文中偶尔闪现的洞见,真的令人愉悦。
祝你度过一个美好的寒假,新年快乐。除了学习和创造,也希望你能多花时间陪伴亲人 —— 那同样非常重要!
Love,
Andrew
年终总结:AI工业时代的黎明
2025年着实是精彩绝伦的一年。
作为每年的保留节目,吴恩达的年终总结都能带我们回顾全年最重要的人工智能事件和发展趋势。
2022年,是AI 的璀璨之年,生成文本、图像、视频、音乐和代码的系统即将到来,引发了关于创造力的未来问题的讨论。
2023年,是创新与焦虑的一年,生成式 AI 浪潮席卷了各行各业,其不断扩大的能力引发了智能机器可能会使人类过时的担忧。
2024年,是暴风雪般进步的一年,人工智能取得了突破性进展。智能代理系统提升了推理、使用工具和控制桌面应用程序的能力。小型模型迅速普及,其中许多比其前辈更强大且价格更低廉。
2025年,或将被铭记为AI 工业时代的黎明。让我们跟随吴恩达的视角,探索2025年最具代表性的AI大事。
文章链接:https://www.deeplearning.ai/the-batch/issue-333/
思考型模型解决更大的问题
去年年末,OpenAI 推出了首个推理模型 o1,将一种具备代理能力的推理工作流内嵌其中。今年 1 月,DeepSeek-R1 向世界展示了如何构建这种能力。结果是:数学与编程性能立刻提升,问题回答更准确,机器人能力更强,AI 智能体取得快速进展。
在 2025 年初,模型只有在被明确提示时才会执行推理策略。如今,大多数新的大语言模型都会默认这样做,从而在广泛任务上显著提升了性能。
最早的一批推理模型通过 RL 训练,专门用于正确求解数学问题、准确回答科学问题,生成能通过单元测试的代码。例如,o1-preview 在 AIME 2024 上比其非推理前身 GPT-4o 高出 43 个百分点,在 GPQA Diamond上高出 22 个百分点;在 Codeforces 编程题中,其表现位于人类竞技选手的 第 62 百分位,而 GPT-4o 仅为 第 11 百分位。
当推理模型学会使用诸如计算器、搜索引擎或 bash 终端等工具时,表现会进一步提升。例如,在一项涵盖 100 个领域、考察多模态理解与技术专长的高难度测试中,带工具的 OpenAI o4-mini 达到 17.7% 的准确率,比不使用工具时高出 3 个多百分点。
机器人动作模型也通过 RL 学会推理。例如,通过奖励 ThinkAct 达成目标位置,使其在机器人任务上的表现相较于不具备思考能力的模型(如 OpenVLA)提升了约 8%。
推理模型还帮助智能体应对复杂问题。例如,AlphaEvolve 使用 Google Gemini 反复生成、评估并修改代码,最终为现实世界问题产出了更快的算法。其中一个成果是,它提出了一个用于解释微生物耐药性的长期未解问题的假说;人类科学家几乎在同一时间独立提出并验证了相同假说。
推理能力显著提升了 LLM 的性能,但更优输出也伴随着成本。Gemini 3 Flash 在开启推理时运行 Artificial Analysis 的 Intelligence Index 基准共消耗 1.6 亿 tokens(得分 71),而关闭推理仅消耗 740 万 tokens(得分明显更低,为 55)。此外,生成推理 tokens 会延迟输出,这也给 LLM 推理服务商带来了更大的性能压力。不过,研究人员正在努力提高效率。Claude Opus 4.5 与 GPT-5.1 在高推理设置下取得了相同的 Intelligence Index 分数,但前者消耗 4800 万 tokens,后者则消耗 8100 万 tokens。
巨额薪酬吸引顶尖 AI 人才
领先的 AI 公司展开了一场激烈的人才争夺战,用堪比职业体育明星级别的薪酬,从竞争对手那里挖走顶尖人才。
7 月,Meta 发起大规模招聘,为新成立的 Meta Superintelligence Labs 组建团队,向来自 OpenAI、Google、Anthropic 等顶级 AI 公司的研究人员开出高达数亿美元的待遇。作为回应,Meta 的竞争对手反过来从 Meta 及彼此之间挖走关键员工,使 AI 人才的市场价值被推至前所未有的高度。
据《华尔街日报》报道,在成功招募 Alexandr Wang 及其核心团队成员之后,Meta 首席执行官 Mark Zuckerberg 列出了一份「心愿清单」。
为了说服人们跳槽,Zuckerberg 甚至亲自登门拜访,有时还会带上自制的汤。这项努力成功招募了包括 OpenAI 的 Jason Wei 和 Hyung Won Chung 在内的人才,两人均为推理模型的核心研究者。
《华尔街日报》称,曾与 OpenAI 前 CTO Mira Murati 共同创立 Thinking Machines Lab 的 Andrew Tulloch,最初拒绝了 Meta 提出的方案,其中包括价值 15 亿美元 的奖金。几个月后,他改变主意,加入了 Meta。
Meta 还聘请了曾主管 Apple AI 模型的 Ruoming Pang。据彭博社报道,其薪酬方案在数年内累计高达数亿美元。Meta 的报价超过了 Apple 除 CEO 之外最高层管理者的薪酬,而 Apple 选择不予匹配。
在这场人员流动中,Microsoft AI CEO Mustafa Suleyman 从 Google 带走了 20 多名研究人员和工程师,其中包括工程副总裁 Amar Subramanya。
Elon Musk 的 xAI 从 Meta 挖走了十多名 AI 研究人员和工程师。Musk 抨击竞争对手的报价「疯狂」,并强调自己公司「极端以能力为导向」的文化,以及股权更具增长潜力。
随着 2026 年的到来,AI 招聘格局已发生巨大变化。据《华尔街日报》报道,为了抵御猎头挖角,OpenAI 提供了比竞争对手更高比例的股票型薪酬,加快了新员工期权的归属进度,并发放高达 150 万美元 的留任奖金。
尽管 2025 年出现了关于 AI 泡沫的讨论,但对于计划投入数百亿美元建设 AI 数据中心的公司来说,高薪是完全理性的选择:如果你愿意在硬件上花这么多钱,为什么不拿出其中一小部分用于支付人才薪酬呢?
数据中心建设狂潮席卷全球
头部 AI 公司纷纷宣布了庞大的建设计划,预计在未来几年内将豪掷数万亿美元,并消耗数吉瓦(GW)的电力。
仅今年一年,AI 行业的资本支出就突破了 3000 亿美元,其中大部分用于建设处理 AI 任务的新数据中心。这还仅仅是「前菜」,各大公司正在规划堪称宏伟的蓝图——建设规模堪比小镇、能耗相当于中型城市的设施。据麦肯锡预测,为了建设足够的算力以满足预期的推理和训练需求,这场竞赛的成本到 2030 年可能高达 5.2 万亿美元。
OpenAI: 1 月,OpenAI 启动了与甲骨文(Oracle)、软银(SoftBank)及阿联酋投资公司 MGX 合作的 5000 亿美元「星际之门」(Stargate)项目。公司最终宣布计划在全球建设 20 吉瓦的数据中心产能,并预测需求量将是该数字的 5 倍。OpenAI CEO 萨姆·奥特曼表示,希望最终能实现每周增加 1 吉瓦的产能。
Meta: 2025 年在基础设施项目上投入约 720 亿美元,高管表示该数字在 2026 年还将大幅上升。其 Hyperion 项目包括在路易斯安那州农村地区建设一个价值 270 亿美元、容量为 5 吉瓦的数据中心。
微软: 2025 年全球数据中心项目支出达 800 亿美元,其中包括位于威斯康星州和亚特兰大的设施,它们将通过专用光纤网络连接,作为一个巨大的超级计算机运行。公司还承诺将其在欧洲的云和 AI 产能扩展至 200 个数据中心。
亚马逊: 预计 2025 年基础设施支出将达 1250 亿美元,2026 年还将投入更多。其耗资 110 亿美元的「雷尼尔计划」(Project Rainier)是位于印第安纳州的一个 2.2 吉瓦数据中心,将运行 50 万块 Amazon Trainium 2 芯片。此外,亚马逊计划在 2025 年至 2029 年间斥资约 140 亿美元扩建澳大利亚的数据中心,并在德国投资约 210 亿美元。
Alphabet(谷歌母公司): 预计 2025 年基础设施支出高达 930 亿美元,高于此前预测的 750 亿美元。公司宣布了一项 400 亿美元的计划,到 2027 年在得克萨斯州增加 3 个数据中心。此外,还承诺在印度投入 150 亿美元,在德国宣布了约 60 亿美元的投资,并在澳大利亚、马来西亚和乌拉圭推出了新建或扩建项目。
尽管存在对 AI 泡沫的担忧,但基础设施建设热潮正在为原本不温不火的经济带来实实在在的增长。哈佛大学经济学家 Jason Furman 指出,2025 年上半年美国GDP的增长几乎全部来自数据中心和 AI 领域的投资。在此阶段,有证据支持这样一种观点:2025 年拉开了新工业时代的序幕。
智能体让代码编写更高效
编程已成为智能体工作流中具有最直接商业价值的应用场景。Claude Code、Google Gemini CLI、OpenAI Codex 以及其他应用,将「编程智能体」变成了 AI 巨头之间竞争最激烈的战场之一。为了留在牌桌上,规模较小的竞争对手也纷纷开发了自己的智能体模型。
当 2024 年首个开创性的智能体代码生成器 Devin 问世时,它将 SWE-Bench 编程挑战基准测试的最高水平(SOTA)从 1.96% 提升到了 13.86%。到了 2025 年,使用最新大语言模型的编程智能体已能常态化地完成超过 80% 的同类任务。
2024 年底,推理模型的出现立即提升了编程能力并降低了成本,因为推理能力使智能体能够规划任务,并将具体执行交给成本更低的模型去完成。到 2025 年底,Gemini 3 Pro、Claude Opus 4.5 和 GPT-5.2 已成为编程和智能体工作流领域的顶尖模型。
Z.ai 的 GLM-4.5 和月之暗面的 Kimi K2 成为开放权重模型中的热门选择,使自动编程类初创公司得以大幅削减成本。7 月发布的 Qwen3-Coder 提供了一个庞大的 4800 亿参数模型,该模型在超过 5 万亿 Token 的代码数据上进行了训练,性能几近匹敌 Claude Sonnet 4。
Anthropic 围绕 Claude 构建了一套智能体框架,打造出了 Claude Code 应用。该应用在 2 月一经推出便大受欢迎,确立了智能体编程系统应有的标准。OpenAI 随即做出回应,推出了基于其 GPT-5 系列编程专用版构建的 Codex 应用。
模型制造商与集成开发环境(IDE)开发者之间展开了一场拉锯战。这导致 Anysphere (Cursor) 和 Cognition AI (Windsurf) 等热门 IDE 提供商开始构建自己的模型。反之,Google 也构建了自己的 IDE——Antigravity,并于 11 月首次亮相。
智能体系统不断推高 SWE-Bench 这一热门编程基准测试的上限,促使研究人员寻找替代的方式来评估其性能。这些努力催生了 SWE-Bench Verified、SWE-Bench Pro、LiveBench、Terminal-Bench、𝜏-Bench 和 CodeClash 等新基准。
2025 年初,大多数观察家还认为智能体仅擅长生成常规代码、文档和单元测试,而在处理更高阶的战略性问题上,资深人类工程师和产品经理的表现依然更胜一筹。但到了年底,许多公司报告称已开始自动化资深级别的任务。Microsoft、Google、Amazon 和 Anthropic 均表示,他们自身越来越多的代码正由 AI 生成。
更多细节,请参阅年度总结原文。
结语:去亲手构建未来
回望 2025,我们似乎见证了一场关于「规模」的游戏。
在这一年,AI 终于脱离了单纯的算法竞赛,演变成一场涉及人才、算力、基建和能源的工业革命。从超大规模数据中心到能耗巨大的算力集群,科技巨头们正以前所未有的资源投入,加速实现通往 AGI 的技术跨越。
这种宏大的叙事往往让人感到渺小,甚至焦虑。当 AI 的进化速度以「天」为单位,当顶尖人才的薪酬变成天文数字,普通开发者和从业者的位置在哪里?吴恩达给出了答案。
虽然2025 是 AI 变得最「重」的一年,但它也是 AI 开发变得最「轻」的一年。推理模型的成熟和编程智能体的进化,极大地拉低了创造的门槛。正如吴恩达所言,现在是软件开发前所未有的黄金时代。巨头们负责铺设电网和铁路(基础设施),而每一位开发者、学生、研究者,则拥有了在这些轨道上建造飞船的权利。
最好的预测未来的方式,就是去亲手构建它。
祝你在即将到来的 2026 年,保持好奇,永远不要停止学习。
新年快乐!
本文来自微信公众号“机器之心”,编辑:冷猫、+0 ,36氪经授权发布。















