DeepMind重磅报告《AI in 2030》:5年后AI成本飙升,数据不再是瓶颈
划重点:
- 到2030年,AI训练成本预计达数千亿美元,算力需求为GPT-4的数千倍,电力消耗达吉瓦级别。
- 尽管面临性能天花板、数据枯竭、电力供应、成本压力、算法效率与计算分配六大挑战,当前趋势表明AI扩展仍将延续。
- 在软件工程、数学、分子生物学、天气预报四大领域,AI有望实现自然语言生成代码、辅助数学证明、预测蛋白质交互、提升气象精度等突破,预计提升科研生产力10-20%。
到2030年,人工智能(AI)会变成什么样?非营利性人工智能研究机构Epoch AI在谷歌DeepMind委托下,发布了长达119页、名为《AI in 2030》的研究报告,专门回答了这个问题。
报告指出,如果当前AI的扩展趋势持续到2030年,全球对AI的投资将达数千亿美元,所需电力则要以吉瓦为单位计算。不过,这些投入有望在科研等高价值领域带来显著的生产力提升。
算力消耗超GPT-4数千倍!训练成本将达数千亿美元
Epoch AI在报告中详细分析了AI规模化发展所需的核心要素:计算资源、资金投入、数据储备、硬件设施及能源消耗,并展望了由此催生的新一代AI能力,尤其在科学研发领域,这也是领先人工智能开发者的重点关注方向。
Epoch AI认为,尽管AI扩张需依赖前所未有的基础设施支撑,但其规模化进程很可能持续到2030年,并为科学乃至更多领域带来颠覆性变革。
依据当前发展轨迹,到2030年,顶尖AI模型需耗资数千亿美元、消耗吉瓦级别的电力。尽管挑战巨大,但报告认为这些障碍是可以克服的。只要AI能通过提升生产力带来相应的经济回报,如此规模的投资便具备合理性。若AI实验室的收入增速保持现有水平,其产出效益也足以支撑千亿美元级的投入。
图:用于购买AI集群硬件的前期投入正以每年1.9倍的速度增长,价值数十亿美元的超大规模集群已经在建设中
预计到2030年,AI将能够依据自然语言指令生成复杂的科学软件、辅助数学家完成直觉猜想证明,甚至准确解答生物学实验中的开放性问题。
这些推断均建立在现有AI基准测试持续进步的基础上,相关任务有望在2030年前被攻克。Epoch AI预测,AI能力将在多个科学领域引发根本性变革,不过全面部署并充分发挥其效能,或许要等到2030年之后。
根据当前趋势推测,用于训练前沿AI的算力集群成本将在2030年突破1000亿美元。这些集群可支持高达10^29 FLOP的计算规模,相当于将2020年全球最大的AI集群不间断运行3000年以上。在此基础上训练的AI模型,其算力消耗将达到GPT-4的数千倍,所需电力也将进入吉瓦级别。
图:自2010年以来,知名AI模型的训练计算量每年约增长4到5倍,前沿模型也呈现类似趋势
六大关键发现:投资者会被劝退吗?
尽管AI的规模化发展面临诸多挑战,但Epoch AI认为,当前趋势延续至2030年仍是极有可能出现的情景。该报告系统评估了六大潜在瓶颈,并逐一作出如下分析:
一、模型性能可能触及天花板?
AI系统确实存在因规模扩大而性能停滞的可能性。然而,从近期多项基准测试突破及商业收入大幅增长来看,尚未观察到明确的“撞墙”证据。模型仍在随着参数增加和训练扩大而持续提升。
二、训练数据会不会枯竭?
人类生成的文本数据预计可支撑模型训练至2027年左右。更值得关注的是,合成数据生成技术正日趋成熟,尤其是在推理模型出现后,合成数据的有效性已得到验证。数据瓶颈虽无法完全排除,但已不构成根本性限制。
图:用于语言模型的训练数据量每年增长约2.7倍
图:人类生成的公开文本存量非常庞大,但按照当前趋势,如果对模型进行过度训练,前沿AI的训练运行可能在2030年前就耗尽数据
三、电力供应能否跟上?
若AI规模持续扩张,2030年顶尖AI模型训练所需的电力或将达到吉瓦级别。尽管挑战巨大,但仍可通过太阳能+储能、离网燃气发电等方案实现电力快速部署。同时,前沿人工智能训练已经开始在地理上分散到多个数据中心,这将有助于缓解局部用电压力。预计2028年前电力不会成为主要瓶颈,之后也有望解决。
四、高昂成本会劝退投资者吗?
千亿美元级的训练投入看似惊人,但如果AI企业的收入继续保持当前增速,将完全有能力覆盖这类投资。一旦AI真正实现生产力变革,哪怕仅渗透部分工作环节,其带来的经济价值可能达到万亿美元规模,足以支撑持续投入。
图:大型AI开发商每年已能实现数十亿美元的收入,且过去几年收入年增长约为2到3倍。若将这一趋势持续至2030年,预计收入将达到数千亿美元
五、算法效率提升会降低算力需求吗?
尽管算法优化一直在进行,但其改进已被纳入当前算力增长曲线中。没有迹象表明算法突破将陡然加速;更何况,效率提升往往反而激发对更大算力的需求,而非替代。
六、计算资源是否会向推理倾斜?
当前,AI公司确实有可能将更多计算资源分配给模型推理环节,例如用于支持各类推理模型和产品服务的实际运行。然而就现状而言,模型训练与推理所占用的算力规模仍处于相对均衡的状态。
图:大型AI开发者在计算资源上的支出与能耗分配表明,训练计算与推理计算的规模大致相当。此外,总体已部署的AI计算能力约每年增长2.3倍,这与前沿AI训练集群的增长趋势相似。
从发展逻辑上看,训练与推理理应协同扩展、同步增长——因为更先进的模型往往需要通过大规模训练才能获得,而这些模型也恰恰能够支撑起更高价值、更低成本的推理任务。因此,推理占比或许会上升,但不太可能挤压训练所需的资源。
Epoch AI因此强调,如果技术演进与投资节奏按现有路径继续,AI能力也有望实现相应跨越,尤其是在科学研发等关键领域。
AI将成为科研领域“神助攻”,生产力或提升两成
Epoch AI在报告中指出,多家领先的AI企业已将科学研发视为重点发力方向,并通过具体案例分析了AI如何实质性提升科研生产力。
研究显示,AI将在科研领域实现显著突破,特别是在软件工程、数学等适合纯计算机训练的学科。根据现有基准的进展推测,到2030年,AI将能够根据自然语言描述生成复杂的科学软件、协助数学家完成形式化证明,甚至准确解答涉及生物学实验的复杂问题。
Epoch AI预测,未来多数科学领域将出现类似如今程序员所用编码助手般的AI助手。尽管科学AI助手需更注重对海量异构文献的梳理与整合,而不像当前编程AI主要局限于单个项目内工作,但它们仍将具备三大核心相似功能:根据上下文智能推荐选项、快速检索相关信息,以及独立完成小型封闭任务。
以软件工程为例,Epoch AI预计AI可为科研任务带来10–20%的生产力提升。即便数学、理论生物学等领域的自动化难度更高,但相关基准测试已显示出持续进步的迹象,预计未来几年还将不断突破。尽管AI全面落地并发挥深远影响可能需时较长、甚至超出2030年,但Epoch AI坚信,多个科学领域都将迎来AI带来的根本性变革。
从代码生成到蛋白质预测,AI重塑四大领域研发边界
Epoch AI 在报告中重点分析了四个典型领域——软件工程、数学、分子生物学和天气预报,以此具体说明AI能力的进展。尽管这些基准测试尚不能完全代表各领域的全部复杂性,但它们清晰展现了AI技术的进步轨迹,并揭示出哪些任务可能很快实现自动化。
以下分析均基于当前领先模型的公开成绩:
▍软件工程
AI已通过编程助手和智能问答工具显著改变软件工程实践。预计到2030年,AI将能自主修复漏洞、实现功能需求,甚至解决定义明确但极具挑战性的科学编程问题。
那么,现有进展揭示了2030年人工智能在软件工程领域怎样的发展图景?Epoch AI综合了三方面的证据:当前AI在软件工程中的实际应用、基准测试的发展状况,以及领域专家所归纳的待解问题和研究方向。
整体来看,这些证据表明,AI必将深刻改变软件工程的面貌,且其影响已经显现。不过,AI是否真正具备在真实环境下端到端独立完成复杂任务的能力,目前仍存在较大疑问。尽管基准测试结果显示,我们正迅速接近这一目标,但专家们对此仍持不同意见。
图:SWE-Bench-Verified:一项基于真实GitHub问题及对应单元测试的代码修复基准,评估模型解决实际编程问题的能力 RE-Bench:模拟工程师居家任务的研究工程基准,通常需人类耗时约八小时完成
▍数学
AI正逐渐成为数学家的研究助手,帮助充实证明思路或形式化直觉猜想。已有案例显示AI为数学工作者提供了切实帮助。不过,数学界对当前AI数学基准的实际相关性,以及AI何时能独立(而非辅助)产出数学成果,仍存在显著分歧。
图:AIME:美国数学奥林匹克竞赛资格赛,题型为答案需为整数的高中数学试题。 USAMO:美国数学奥林匹克竞赛,题型为需构造证明过程的高中数学试题。 FrontierMath:涵盖专家级难度的数学挑战性问题的基准,答案形式为数字或简单表达式,易于自动验证。
▍分子生物学
像PoseBusters这样的蛋白质-配体相互作用基准,预计在未来几年内将被攻克;而任意蛋白质-蛋白质相互作用的可靠预测则需更长时间,目前仍不确定。
同时,面向生物学研究的AI文献助手即将出现,现有的实验协议问答基准预计在2030年前得到解决。这些基准虽不能代表分子生物学的所有挑战,但为我们洞察AI在该领域的发展提供了一个清晰的窗口。
图:PoseBusters-v2:评估蛋白质与配体在三维空间中对接能力的基准。分析仅采用“盲测”结果,即不预先提供蛋白质结合位点信息。ProtocolQA:一个围绕生物学湿实验室操作规程的问答基准,本评估未提供多项选择提示。 蛋白质-蛋白质相互作用:该方向已取得重大进展,但对任意蛋白质对的预测目前仍存在较高假阳性率,其发展高度依赖于未来基准测试的细节设计。
▍天气预报
AI天气预报方法已在数小时到数周的预测尺度上超越传统方法。此外,AI方法运行成本更低,且有望借助更多数据持续改进。未来的挑战在于提升对极端天气等罕见事件的预测能力,并将更精准的预报转化为实际的社会经济效益。
结论:AI将成全球经济核心驱动力
一个贯穿报告的主题是,技术能力与社会应用之间可能存在显著延迟。以制药和软件工程为例:软件迭代周期短,无需湿实验(在实验室里直接操作生物样本以验证或探索生物学现象)和临床试验 ,通常不涉及人身安全关键系统 ,容易验证正确性 ,且训练数据丰富 。
因此,Epoch AI预计,到2030年,几乎不会有上市药物主要依赖当前乃至2030年的AI工具研发出来,但AI对药物早期发现阶段的影响将非常显著。相比之下,软件工程的面貌将发生翻天覆地的变化,并将催生出用于科学研发乃至更广泛领域的丰富软件生态 。
到2030年,人工智能有望发展成为支撑整个经济体系的核心技术,深度融入人类与计算设备、移动终端交互的每一个场景。倘若这一趋势成为现实,那么从当前起五年内,各国政策制定者、行业领袖与研究机构必须将人工智能置于战略优先位置 ,积极应对其带来的机遇与挑战。
本文来自“腾讯科技”,作者:金鹿,36氪经授权发布。