默认拿个人代码喂AI,GitHub新规引开发者吐槽:这叫“强行授权”

CSDN·2026年03月26日 18:58
GitHub 表示:“真实世界数据 = 更智能的模型”

3 月 25 日,GitHub 官方发布一则公告,宣布从 2026 年 4 月 24 日起,调整 GitHub Copilot 用户交互数据的使用规则,即会默认使用用户的数据去训练以及改进自家的 AI 模型。

谁会受影响?

当然,这次政策更新并非针对所有用户,而是明确区分了版本类型。

受影响的,主要是个人用户使用的 Copilot Free(免费版)、Pro(专业版)和 Pro+(高级专业版)。这类用户在日常编程过程中与 Copilot 的交互数据,包括输入、输出、代码片段、相关上下文,都将成为 GitHub 后续 AI 训练的重要素材。

而 Copilot Business(商业版)和 Copilot Enterprise(企业版)用户,则不会受到此次政策更新的影响。

不过如果用户不想参与,也可以在隐私设置里一键退出。

此外 GitHub 还提出了“历史选择保留”原则:倘若用户此前已经关闭了“允许 GitHub 收集数据用于产品改进”的选项,这一设置依然有效,数据不会被用作训练,除非用户主动重新开启。

话虽如此,这一政策一出,再次让开发者社区对 AI 代码助手的数据使用边界展开讨论。

数据会收集哪些内容?官方划清界限

很多开发者最关心的是:什么数据会被拿去训练 AI?倘若日常没注意到这项政策,自己的数据岂不都是 AI 模型的“食材”了?

针对这一疑惑,GitHub 也在公告中列了个清单,主要包括:

用户接受或修改后的 Copilot 输出结果

发送给 Copilot 的输入信息,包括展示给模型的代码片段;

Cursor 附近的代码上下文、注释和文档;

文件名、存储库和开发导航模式;

与 Copilot 各功能的交互记录,比如聊天互动、建议;

用户对建议的反馈(点赞/点踩)。

其不会使用:

来自 Copilot Business、Copilot Enterprise 或企业自有仓库的交互数据;

在 Copilot 设置中选择退出模型训练的用户交互数据;

处于“静止状态”的 issues、讨论区或私有仓库内容。这里特意使用“静止状态”,因为当你主动使用 Copilot 时,私有仓库中的代码确实会被处理。这部分交互数据是运行服务所必需的,除非您选择退出,否则可能会被用于模型训练。

此外,GitHub 还声称:这一政策使用的数据可能会在 GitHub 关联公司内部共享,这些关联公司包括微软等集团内企业,但不会与第三方 AI 模型提供商或独立服务商共享。

为什么要这样做?真实数据让 AI 更懂程序员

GitHub 解释,这次调整的目的很直白:通过真实开发者的使用数据,让 Copilot 的模型更“懂编程”,提供更贴近实际的代码建议。

最初,Copilot 训练主要依靠公开可用代码和人工样本。

去年开始,GitHub 尝试用微软内部员工的 Copilot 交互数据训练模型,结果显示,代码建议采纳率明显提升。事实证明,真实开发场景中的交互数据能让模型更精准地理解开发者的工作流,不仅提供更实用的补全,还能提前识别潜在漏洞,降低生产环境风险。

换句话说,你每次使用 Copilot、每次点赞或吐槽,都在帮它变得更聪明。

反对声此起彼伏:倘若一名员工没关此选项,公司源代码会外流?

不过,从 GitHub 社区近期的讨论来看,这项计划并不算受欢迎。仅从 emoji 投票来看,用户给出了 97 个👎,而仅有 4 个🚀。

有开发者质疑道:

这里存在多个问题:

首先,我所在组织的用户并没有授权将公司源代码的版权许可授予他人,也无权允许将代码向第三方公开。

其次,将选择权设为“个人退出”,意味着只要我的某个员工没有关闭该选项,你们就可能获得我们公司全部源代码的访问权。

再者,新加入的用户或外部协作者如果没有主动退出,可能会在无意中让你们获得对公司源代码的事实性访问权限。

此外,这项政策也使我们无法满足 SOC 2 合规要求,因为我们将无法再明确知道究竟有哪些主体可以访问我们的源代码。

更进一步,你们还可以在未来随时修改政策,以某种方式让自己获得对我们源代码的事实性访问权。

这对信任是一次严重打击。我正在强烈建议公司逐步迁离 GitHub。Copilot 本身并没有特别大的价值,更不值得你们擅自把我们的代码和想法通过大模型“分享”给其他人。

热评第一的开发者表示,“真正做到‘自豪地去征求用户同意’的方式,应当是要求用户主动选择加入,而不是像现在这样声称,在未来某个时间才通知用户此功能会开启,从而让他们被动选择退出。”

也有人因此想要关闭自己的 GitHub 账号,并组队寻找 GitHub 的替代方案:

目前,GitHub 尚未公布具体的数据脱敏方式和训练周期,但从 4 月 24 日起,普通用户将正式迎来这一规则。对此,你有什么样的看法?

参考:

https://github.blog/news-insights/company-news/updates-to-github-copilot-interaction-data-usage-policy/

https://github.com/orgs/community/discussions/188488?sort=top

本文来自微信公众号“CSDN”,整理:屠敏,36氪经授权发布。

+1
10

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业