“合宪性”AI也躲不过侵权“原罪”——Anthropic被环球音乐起诉

互联网法律评论·2023年10月25日 07:53

如何解决人工智能版权侵权问题？

图片来源：环球音乐官网

2023年10月18日，环球音乐集团（Universal Music Group）和其他出版商起诉美国人工智能公司Anthropic，指控该公司滥用“无数”受版权保护的歌词来训练其聊天机器人Claude。

环球音乐集团是全球最大的音乐公司之一。该公司要求Anthropic对其损失作出7500万美元的赔偿。

起诉书称，Anthropic至少在 500 首歌曲的歌词上侵犯了出版商的权利。这些歌曲包括 Beach Boys 的《God Only Knows》、滚石乐队的《Gimme Shelter》以及 Mark Ronson 和 Bruno Mars 的《Uptown Funk》以及碧昂丝的《光环》。与环球音乐集团一起对 Anthropic 提起诉讼的还有 Concord Music Group、ABKCO、Worship Together Music、Capital CMG 等公司。

截至目前，这家仅2岁的人工智能公司Anthropic还未做出回应。

这是音乐行业针对人工智能开发商的第一起重大诉讼，也是Anthropic面临的第一起诉讼。该诉讼表明，人工智能公司训练大型语言模型的方式和数据来源依然是一个重大的合法雷区，是不容忽视的“原罪”，并不能被轻易规避。

一、Anthropic的“合宪性AI”——OpenAI最强劲的对手

Anthropic 成立于 2021 年，由 Daniela Amodei 和 Dario Amodei 兄妹创立，他们都曾在 OpenAI 工作。因OpenAI 从非盈利组织转变为营利性公司，兄妹二人离开后创立了这家公益性的“人工智能安全和研究公司”。这意味着它的创建是为了公共利益，而不是商业利益。

Anthropic目前已分别获得谷歌3亿美元、亚马逊40亿美元的投资。根据亚马逊在2023年8月的说法，这40 亿美元将换取 Anthropic 的部分所有权，并让 Anthropic 更多地使用这家电子商务巨头的云计算平台亚马逊网络服务。根据一份内部文件，Anthropic 计划在未来两年内筹集 50 亿美元并建立“Claude-Next”，其能力将是当前人工智能系统的 10 倍。目前该公司在Claude 1.3的基础上，已经发布了最新的版本Claude 2。

在Claude 2和GPT-4的对比测试——GRE考试中，两个大模型基本处于同一水平，GPT-4 总体上稍稍领先——GPT-4 更擅长定量问题解决，而 Claude 2 似乎更擅长写作。然而，真正让Claude 2与众不同的是其对大模型进行的微调技术，Anthropic称其为“合宪性人工智能”（Constitutional AI）。这种技术让模型对大量的问题做出反应，提示它减少这些反应的危害，然后对模型进行调整，使其产生的反应更像无害反应。本质上，不是人类用反馈对模型进行微调，而是模型自己做出微调。

也就是说，开发人员向Claude 2灌输一套编码的价值观，将“是否可以做某事的问题”与“是否应该做某事的问题”分开。Anthropic在一篇博文中称，Claude的宪法包含了《联合国人权宣言》中的想法及其他原则，比如“请选择对生命、自由和个人安全最支持和鼓励的响应”等指示。

卓越的性能以及“合宪性”的承诺，让Anthropic脱颖而出。2023年9月，《时代周刊》（TIME）发布的“人工智能领域最具影响力的100位人物”榜单，Anthropic的创始人位列第一，排在了OpenAI 首席执行官Sam Altman之前。

二、“合宪性人工智能”为何违法？

据称，为了训练Claude 2，Anthropic获取了大量的文本——大部分是从互联网上抓取的，一些来自许可数据集或由人工提供。但显然，歌词库不在许可的范围内。

原告律师称：Anthropic 对原告歌词版权的“系统性、广泛”的侵犯，需要被解决。“在构建和运营人工智能模型的过程中，Anthropic 非法复制和传播大量受版权保护的作品，包括出版商拥有或控制的无数音乐作品的歌词。”律师甚至使用Anthropic的“卖点”来讽刺它——Anthropic 声称符合宪法地训练其大模型，使其更加“有用、诚实和无害”，却在实践中“侵犯版权、不尊重艺术家的原创”，它剥夺了音乐作品创作者应有的报酬。

Anthropic并未对此做出正式回应。但类似案件中，人工智能公司可能会辩称，对其系统的训练是“合理使用”，人工智能系统只是扩大了人类知识过程，人们阅读现有信息并使用它来产生新想法。

人工智能引擎的训练方式以及在某些情况下输出内容，很可能存在复制部分或全部版权作品的行为，这就很有可能引发侵权诉讼。这些侵权指控与此前作家和演员对人工智能的指控类似，但歌词的相似度却更容易证明。因为歌曲相对文章和小说更短小，任何对歌曲的引用都有可能被法官视为重复使用作品的“实质性”部分，也就是说，合理使用豁免可能更难适用在歌词类的案件中。长期以来，音乐出版商在驳斥歌词的“合理使用”的索赔工作比其他知识产权案件更加成功。

在本案中，原告的目标是反击 Anthropic 可能提出的任何合理使用辩护。他们指出美国联邦最高法院最近在Andy Warhol Foundation for the Visual Arts v. Goldsmith一案中的裁决，该裁决强调“使用的商业性质”必须与作品是否经过充分改造进行权衡。原告律师马修•奥本海姆（Matthew Oppenheim）表示，“版权法明确规定，除非获得权利持有者的许可，否则实体不得复制、分发和展示他人受版权保护的作品来建立自己的业务。”

起诉书称，当Claude被要求写一首关于摇滚先驱Buddy Holly之死的歌曲时，它却提供了与Don McLean的《美国派》（American Pie）中几乎一摸一样的歌词。

图片：Claude 的输出与原歌词的对比图（摘自UMG v. Anthropic起诉书。起诉书中使用了大量篇幅列举这一类的“抄袭”示例。）

三、如何解决人工智能的“侵犯版权”问题？

1、版权所有者主动与人工智能公司合作

音乐行业一直在寻找方法来表彰和补偿以不同方式为一张专辑做出贡献的数十个创作者，而且一直热衷于拥抱新技术，例如音乐流媒体。音乐行业已经成为生成人工智能的早期合法试验平台，该行业也可能是最先走通AI赋能商业道路的行业之一。

随着环球音乐集团加大针对 Anthropic 的法律行动力度，这家音乐巨头提起诉讼的第二天就宣布与新加坡人工智能开发商Bandlab Technologies（Bandlab音乐平台的创建者）签署合作协议，声称将通过其易于使用的技术、工具和平台，致力于以“道德的方式”实现人工智能。

BandLab Technologies 首席执行官也表示：该公司及凯迪克音乐集团（Caldecott Music Group）网络坚定地尊重艺术家的权利以及人工智能在音乐创作中的无限潜力。

环球音乐集团还宣布有意与谷歌等公司合作解决生成式人工智能问题。

根据Market US 预测，在音乐市场领域，生成式人工智能的应用将逐年提高，2023年的市场规模将达到2.66亿美元。一些科技公司和音乐版权持有者正在探索人工智能如何创造原本不存在的内容，例如艺术家与已去世的音乐家进行合作。环球音乐集团向Anthropic提起版权诉讼，明显是为了接下来在AI领域进一步发展扫清障碍。

图片：音乐市场中的全球生成人工智能（资料来源：Market.US）

2、人工智能提供商的赔偿承诺

在 Acrolinx 最近对财富 500 强公司进行的一项调查中，近三分之一的公司表示，知识产权是他们对生成式人工智能的使用最关心的问题。人们开始质疑提供商为了创建这些工具而侵犯版权的程度，并且担心在使用这些工具输出中产生的侵权风险。

认识到用户日益关注的问题，生成式人工智能的提供商已开始为其在版权诉讼中处于不利的客户提供某些“赔偿”：

微软最近宣布 Copilot 版权承诺，对使用其Copilot 服务及其生成的输出所涉及的潜在法律风险承担责任。如果第三方针对 Copilot 的商业客户因使用和分发其输出而侵犯版权而提出索赔，微软承诺对索赔进行辩护并承担任何相应责任。
亚马逊最近推出用于运行和微调生成人工智能模型的平台Bedrock，该平台表示，它将赔偿客户免受指控该模型侵犯第三方知识产权的索赔。但亚马逊的赔偿政策仅适用于该公司内部的文本分析模型系列 Titan，以及亚马逊的代码生成服务CodeWhisperer。
IBM为其生成式 AI 模型 Slate 和 Granite 提供知识产权赔偿，这些模型可通过其Watsonx生成式 AI 服务获得。
谷歌支持的Cohere 的条款中也有一项条款，表明它将“捍卫、赔偿并确保客户免受第三方指控，指控 Cohere 的模型侵犯知识产权”。
Adobe声称为其生成人工智能艺术平台Firefly的用户提供“全额赔偿”保护，并声称其模型是在 Adobe 已拥有权利的库存图像上进行训练的。不过，用户必须是企业客户，并且须遵守 Adobe 与其他基于技术的 IP 索赔相同的责任上限。

上述多个著名生成式人工智能提供商正为用户提供“无风险”使用工具的信心和安慰，希望让用户更有信心使用他们的产品。

但并不是所有公司都认为“无风险承诺”是个好策略。Anthropic就没有明确做出与上述相似的承诺。OpenAI的政策明确表示，在大部分情况下，该公司不会参与针对其用户的版权诉讼，也不会为其辩护。

同时，也有专家提示：虽然向用户提供赔偿是一个令人鼓舞的迹象，但使用者应该非常小心，避免将其视为提供生成式人工智能工具的“无风险”标签。因为“提供赔偿”本身，并不能证明生成式人工智能工具使用的“合理性和正当性”。

四、警惕AI法律风险

环球音乐集团与Anthropic的这起诉讼提出了版权法和人工智能交叉点的关键问题，为知识产权法中具有里程碑意义的案件奠定了基础。《互联网法律评论》将密切关注这一案件的进展。

从这一案件中我们应当警惕并汲取教训：人工智能实验室之间、国家之间的竞争态势越发焦灼，人工智能公司或相关的开发人员很可能在商业压力之下，在AI使用的合法性和安全性问题上偷工减料。即便像Anthropic这样的公益公司，其对“安全与合乎宪法”的探索值得肯定，却也不值得完全的“信赖”。也许，并没有什么方法或技术可以一劳永逸地调整出令人满意的人工智能。

本文来自微信公众号“Internet Law Review”（ID:Internet-law-review），作者：互联网法律评论，36氪经授权发布。

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。