Science最新发布:AI Coding正在拉大你的技能、收入差距
一项发表在 Science上的最新研究表明,当前爆火的氛围编码(Vibe Coding)可能会扩大人与人之间的技能与收入差距。
论文链接:https://www.science.org/doi/10.1126/science.adz9311
来自乌得勒支大学的研究团队通过机器学习方法,系统地分析了 160097 名开发者在 GitHub 上提交的超过 3000 万份 Python 代码,首次大规模地揭示了AI Coding 的渗透实况。
数据显示,截至 2024 年底,美国已有约 29% 的 Python 函数由 AI 辅助或直接生成,且这个比例在 GitHub Copilot、ChatGPT 等 AI 工具发布后呈现爆发式增长。然而,AI 的普及并不均衡,德国、法国紧随其后,采用率约为 23%-24%,印度快速追赶至 20%,而其他国家的采用率明显滞后。
值得注意的是,尽管 AI 显著提升了资深开发者的生产力与创新能力,却未能让广泛使用 AI 的早期职业开发者获得实质效率提升。这意味着,AI 可能正在重塑软件开发领域的技能与职业阶梯。
全球AI编程采纳差异明显
过去,理解生成式 AI(genAI)在实际工作中的使用情况,主要依靠开发者自述问卷调查或短期受控实验。然而,这些方法存在明显局限:受访者可能因社会期许而低报使用频率,实验则难以捕捉长期、真实工作场景下的动态变化。因此,要客观、大规模地衡量 AI 对生产力的真实影响,需要一种能够直接观察行为痕迹的新方法。
为此,研究团队创新性地训练了一个神经分类器。该分类器通过 GraphCodeBert 模型深入理解代码的数据流和结构,并在一套精心构建的训练集上学习。该训练集既包含纯人类编写的代码,也包含由不同大语言模型(LLM)接力生成的合成代码,从而能有效区分二者的细微差异。
图|将用 Python 编程语言编写的函数中的代码分类为人工生成或 AI 生成。
研究发现,截至 2024 年底,美国已有约 29% 的 Python 函数被标记为 AI 生成或辅助完成。这一比例并非匀速上升,在 GitHub Copilot 预览版推出、ChatGPT 公开上线,以及 GPT-4 等大模型发布这几个关键节点后,AI 生成代码的占比都出现了陡峭的跃升。
图|美国 GitHub 用户创建或大幅修改的 Python 函数占比。垂直线表示 95% 置信区间,该图表揭示了人工智能关键事件时间点与使用情况突变的对应关系。
这说明,关键生成式 AI 工具的发布,会直接引发 AI 生成代码数量的显著增长。这印证了技术可用性的提升能够迅速激发开发者的实际应用,并切实反映在代码产出之中。
然而,尽管生成式 AI 在全球快速扩散,各国对其的采纳速度却呈现出显著差异:
美国保持着明显的早期领先优势。然而,其相对优势正在收窄,欧洲的德国和法国以 23%-24% 的采用率紧随其后,显示出成熟技术生态的快速响应能力。
印度的表现尤为突出,其采用率已快速攀升至 20%,展现出强大的追赶势头,可能正在重塑全球软件开发领域的人力资源格局。
相比之下,其他国家的采用率在 2024 年底仍相对落后。这种差异可能由多种因素导致,包括本地化替代工具的生态差异、访问全球主流模型的限制,以及技术文化与应用场景的不同。
尽管美国开发者在该领域保持着明显且持续的领先优势,但其他主要国家正在快速追赶。
谁是AI Coding的真正获益者?
研究证实,生成式 AI 确实提升了整个行业的输出效率。据模型估计,当 AI 生成代码的比例从 0 提升至29%(即 2024 年底的美国采用率)时,开发者每季度的代码提交量平均增加了 3.6%。
图|基于用户-季度面板回归,结合用户和季度固定效应,估计生成式 AI 对用户活动的影响。
然而,深入个体层面分析便会发现,AI 带来的红利并未被平等分享,呈现出显著分化。
对于经验丰富的资深开发者而言,AI远不止是提高写代码速度的工具,更能显著放大其核心能力。
在资深开发者群体中,将 AI 使用率提升至 29%,会带来高达 6.2% 的代码提交量增长,其效果远超行业平均水平。更重要的是,AI 帮助他们更轻松地使用不熟悉的软件库和新技术组合,这意味着他们能更快地进入新领域、尝试新方案。因此,AI 不仅让他们做得更快,更让他们做得更广,实质性地扩展了创新的边界。
图|相比于有经验的开发者,缺乏经验的开发者获得的生产力提升更少。
与直觉相反,尽管初级开发者对 AI 的采用率更高(37%),但研究却发现,他们并未因此获得可统计的显著生产力提升。
图|按用户 GitHub 使用年限划分的生成式 AI 使用强度(2024 年,美国)。
由此显现一个值得深思的问题:为何使用程度最高的人群,实际获益反而最少?
研究指出,这可能源于工作性质与使用方式的差异:
资深更开发者善于在广泛的任务中利用生成式 AI,并能高效审查和调试 AI 生成的复杂代码。而对于新手,他们可能更多地将 AI用于处理相对基础、模板化的任务,或者因经验不足而难以有效利用和优化 AI 的产出。
尽管早期职业开发者使用 AI 的频率更高,但他们未能像资深开发者那样获得生产力或探索新领域的收益。这表明,AI 可能直接替代了新手部分基础编码工作,却没有相应地增强新手解释复杂代码或进行系统性创新的能力,导致他们难以利用 AI 完成任务。
结果是,AI 显著拉大了资深开发者与初级开发者之间的效率与创新差距。这不单是当前的产出差异,更预示着未来职业路径的分化:
熟练驾驭 AI 的资深开发者可能加速迈向更高价值的工作,而依赖 AI 却未能提升核心竞争力的新手,则可能面临更激烈的同质化竞争。
本文来自微信公众号“学术头条”(ID:SciTouTiao),作者:王跃然,36氪经授权发布。















