史上最大知识产权盗窃案:美国参议院关于人工智能与版权盗版听证会的要点

互联网法律评论·2025年09月01日 11:37
美参院听证会指控AI公司盗版训练模型属犯罪行为,促立法追责

2025年7月16日,美国参议院司法委员会犯罪与反恐小组委员会举行了一场题为“规模太大,无法起诉?:审查人工智能行业大规模盗版作品用于人工智能训练”的听证会。以下是听证会现场情况的回顾。

开场白

今天的听证会是关于美国历史上最大的知识产权盗窃案……这是一个没人愿意承认的事实。人工智能公司正在用被盗材料训练他们的模型。就是这样。这就是事实……我们谈论的是盗版。我们谈论的是盗窃。

- 主席乔什·霍利参议员(密苏里州共和党)

小组委员会主席、密苏里州共和党参议员霍利在听证会上以极其强硬的语气开场。他强调了人工智能公司盗版活动惊人的规模,并指出人工智能公司窃取了“数十亿页版权作品,足以填满22个相当于国会图书馆大小的图书馆……这并非无心之失——他们完全知道自己在做什么。” 随后,他重点指出,有证据表明,人工智能公司明知存在违法行为,却依然强行推进。霍利强调:“这不仅仅是激进的商业策略,而是犯罪行为。”

霍利主席还驳斥了人工智能公司的论点,即他们的行为对于发展人工智能是必要的,这样美国才能在与中国的人工智能竞赛中获胜。霍利主席表示:“每次他们都说‘我们不能让中国打败我们’之类的话,让我给你翻译一下……他们真正的意思是‘给我们一大堆现金,让我们偷走你们的一切,然后赚取数十亿美元。’这就是翻译。”

他在开场白的最后总结道,就像他开始演讲时一样,语气强硬:

底线是这样的。我们必须采取行动来保护这个国家的人民。我完全支持创新,但不能以非法为代价。我完全支持创新,但不能以摧毁这个国家普通民众的知识产权为代价。我们制定法律是有原因的——这些法律应该得到执行。大型科技公司不应该凌驾于法律之上。适可而止。是时候执法了。

排名成员、伊利诺伊州民主党参议员德宾在开幕致辞中强调了创意产业对美国经济超过1万亿美元的贡献,并强调了美国版权制度的重要性。德宾参议员对人工智能公司依赖盗版创意作品作为商业策略表示怀疑,他表示:“正如Anthropic首席执行官所说,Anthropic有很多地方可以购买,但他们更愿意通过盗版来避免所谓的‘法律/实践/商业障碍’——无论这究竟意味着什么……它[还]保留了已经下载作品的盗版副本——我不明白为什么。”

马克斯韦尔·普里特详述人工智能盗版规模

第一位发表开庭陈述的证人是马克斯韦尔•普里特 (Maxwell Pritt) ,他是多起针对人工智能公司正在进行的诉讼案(包括Kadrey 诉 Meta案)的原告律师。普里特的证词强调了人工智能公司对被盗版权作品在线存储库(其中一些已被联邦调查局和司法部起诉)的依赖程度之深,令人震惊,这些作品的在线存储库旨在获取竞争优势。

他指出,人工智能公司“免费获取了数千万甚至数百本书籍、学术出版物和文章,而不是从版权所有者那里购买或获得授权”。此外,Pritt 还解释说,Meta 公司从多个盗版电子存储库盗版了超过200TB的盗版版权作品,还复制并通过点对点共享的方式将超过40TB的内容分发给其他盗版者。Pritt 解释说,除了 Meta 公司盗版活动的深度之外,更令人震惊的是,这些做法竟然得到了高层管理人员的批准,并且仍然继续进行。

普里特还反驳了人工智能公司提出的论点,即他们的大规模侵权行为是合理的,或者美国需要为人工智能公司提供例外,以便美国赢得与中国的人工智能竞赛,他指出:

胡说。我们的科技公司雇佣了世界上最优秀、最聪明的人才,而且它们也是世界上最富有的公司。这些公司竟然能投资数千亿美元招聘人才、建设数据中心来支持其商业化的人工智能产品和模型,这简直难以置信。但他们却不能向版权所有者支付一分钱。

在回答霍利主席关于Meta参与盗版的替代方案——授权方案——的一系列问题时,普里特强调,卡德雷案的调查结果显示,Meta曾考虑投入数千万美元甚至数亿美元用于授权,但他们最终放弃了这一计划,转而复制盗版作品。霍利参议员表示,他难以置信,数亿美元竟然可以支付给创作者,而创作者却一分钱都没拿到。

听证会后期,霍利主席询问Meta是否试图隐瞒其使用盗版作品的行为。Pritt对此解释说,Kadrey诉讼中的调查结果显示,Meta在开始利用Anna's Archive获取盗版作品时,故意选择了第三方服务来获取服务器空间,这使得追踪Meta的种子下载活动变得困难。霍利主席进一步追问Meta对其活动中非法和犯罪行为的知情情况,并请Pritt就Meta知情的证据发表意见。Pritt表示:“包括最高法院在内的任何法院都从未裁定过等级盗版属于合理使用。相反,最高法院的判例法……认为合理使用以诚信和公平交易为前提。”

迈克尔·史密斯教授驳斥陈词滥调的反版权主张

卡内基梅隆大学教授迈克尔•史密斯在开幕致辞中重点探讨了数字盗版如何创造有害激励,最终导致社会、创作者和科技公司三方共赢。他首先回应了人工智能公司关于版权执法将扼杀创新的观点,并指出:“虽然时代变了,但当今的基本经济原则与2000年并无二致。运用这些原则,我认为我们可以得出许多相同的结论。”

正如史密斯教授所言,将知识产权和版权视为“创新壁垒”是老套的科技剧本,互联网起步和数字技术崛起的时代经验已证明其错误。他指出,如今我们看到,版权法和许可实际上构成了这些技术的支柱,它们共同支撑着创作者和科技公司——音乐和电视作品的流媒体平台就是其中一个例子。史密斯指出,GAI 也不例外,认为为了确保技术未来可以不尊重版权的结论,将引入不正当的激励机制,这与证据表明通过授予专有权并尊重这些权利来激励创作者的经济原则实际上能够带来更大的经济和社会价值以及技术创新相悖。大量蓬勃发展的人工智能和版权许可表明,版权法一直在努力推动价值增长,并为 GAI 和版权之争铺平道路——如果将人工智能训练过程中的犯罪活动视为“合理使用”或任何其他例外情况而予以宽恕和纵容,那么 GAI 技术稳健且可持续的未来将岌岌可危。

正如史密斯教授所说,“允许生成式人工智能公司通过盗版来洗白可授权内容”,会损害版权作品市场和版权作品许可市场,并为盗版者继续扩大其犯罪网络和企业规模创造不良激励。他总结道:

我认为,今天我们也有类似的机会,通过明确指出盗版是错误的,为社会、创作者和科技公司创造三赢。蓬勃发展的科技经济依赖于蓬勃发展的创意经济……如果走现在这条路,我们可能会杀鸡儆猴——或者说,杀掉那些为生成性人工智能产出提供关键价值的金蛋的作家、音乐家、程序员和电影制作人。

在听证会的后期,佛蒙特州民主党参议员彼得·韦尔奇(Peter Welch)询问了允许GAI公司使用受版权保护的作品而不向版权所有者支付报酬的危险性。史密斯教授回应道,我们宪法的起草者认为版权是一个“非常好的想法”,而GAI公司却让其他人更容易窃取作品,直接参与盗版活动,并且本质上是在支持盗版网络,这进一步滋生了盗版和盗窃的不良动机,同时破坏了版权法许可所带来的鼓励创作和创新的积极激励。他指出:

“当你与一家生成式人工智能公司签署许可协议时,你就像是被人拿枪指着脑袋签了字。因为他们可以说,‘要么签我提供的协议,要么我就去偷。’”

史密斯教授指出,如果版权法得到执行和尊重,GAI 公司和创作者都有可能找到一条可行的前进道路。

Bhamati Viswanathan 教授谈刑事侵权

新英格兰法学院的巴马蒂•维斯瓦纳坦教授在开场发言中重点指出,人工智能公司使用盗版作品的行为构成“加重犯罪”——她强调,这种犯罪并非无受害人犯罪。她还强调,盗版创意作品是对宪法权利的践踏,并指出:

这是美国宪法的庄严基石。知识产权条款是使这个国家不仅伟大,而且强健、强大、经济上取得巨大成功的因素之一……而这整个由我们的开国元勋们精心构想出来的激励机制,现在确实面临危险。

除了参与盗版活动和支持已被美国政府起诉的犯罪企业之外,人工智能公司还有其他选择。维斯瓦纳坦教授强调:

解决方案就是许可。它已经存在。作品许可。创作者的公平报酬……你不能损害创作者的生计……我们需要的是让新技术公平、可持续地蓬勃发展,以我们能够理解的方式,而这已经由我们的宪法、美国版权法和知识产权法本身规定了。

霍利主席向维斯瓦纳坦教授提出了一系列问题,询问了盗版过程以及人工智能公司复制和进一步传播这些盗版作品的来源。维斯瓦纳坦教授指出,人工智能公司使用的盗版网站和存储库已被联邦政府起诉,最重要的是,参与盗版网络最终会支持这些犯罪企业。维斯瓦纳坦教授特别提到了盗版存储库“安娜档案库”,并强调了该盗版网站如何宣传并提供大量被盗的受版权保护资料数据集给人工智能公司用于培训目的,用于出售或数据交换。

在听证会的后期,当参议员德宾询问确定刑事版权侵权的知情标准时,维斯瓦纳坦教授再次强调,GAI公司的员工如何明知从事盗版活动明显违法。此外,她还就合理使用原则在GAI培训中使用盗版作品的背景下的适用性发表了意见,并指出:“这并非合理使用原本想要实现或促成的目标……但这似乎与合理使用原本的意图相悖。”

David Baldacci 提供作者视角

我只是一个人,但书籍改变了我的人生,让我的生活更加美好。我相信人工智能的某些方面也会改变世界。但如果要打赌哪一方的变革性更强,那么对于我们所有人来说,我每次都会押注书籍。

畅销书作家大卫·巴尔达奇(David Baldacci)在开场发言中重点讲述了他个人经历的普遍存在的数字盗版现象,以及他60多部小说中至少44部被反复复制并用于训练Meta的GAI模型所带来的影响。当巴尔达奇的儿子要求ChatGPT写一个读起来像他小说的情节时,巴尔达奇说道:

就在那时,我发现人工智能社区未经许可就盗用了我的大部分小说,并将它们输入到他们的机器学习系统中。我当时真的感觉就像有人把一辆卡车开进了我的想象力世界,偷走了我创作的一切。

在听证会的后期,在回答参议员德宾关于小说创作过程的提问时,巴尔达奇表示,这次使用 ChatGPT 的经历让他感觉自己被抢劫了,“这种事情不应该发生在这个国家”。

Baldacci 还指出:

我知道有人认为,人工智能对我和其他作家的影响,与一个有抱负的作家阅读其他书籍并学习如何以原创方式运用它们并无二致。但我可以从个人经验告诉你,这种说法完全错误。

在听证会的后期,巴尔达奇回答了参议员德宾关于他是否监管侵权行为的问题,他表示:“软件平台唯一能做的就是从已有的东西中攫取。他们无法真正独立创造任何东西。他们把我的杂乱无章的东西拼凑起来,然后扔到另一端。但它看起来仍然是我的东西——因为它就是我的东西。”

巴尔达奇还谈到了他对授权书籍的开放态度,以及授权对他的创作以及整个写作行业的重要性。他表示,他已将自己的书籍授权给“世界各地”的各种媒介和格式,并随时准备接受就其书籍的使用权进行谈判的提议。他继续解释授权对创作者激励的损害:

“从俄罗斯盗版网站窃取作品的不确定性只是为了获得优势,而你并不真正关心像我这样的作家以及其他新兴作家的命运……我为我的出版商赚了很多钱,而我的出版商用这些钱去冒险,寻找那些他们通常不敢冒险的新作家。所以,当你伤害像我这样的成名作家时,你也会伤害到我们之后的所有其他作家。”

爱德华·李教授论证转化性合理使用

圣克拉拉大学法学院的Edward Lee 教授在开场发言中指出,根据合理使用分析,GAI 培训具有极大的变革性,但如果存在其他因素,例如对版权所有者造成市场损害或侵犯人工智能生成的输出,情况可能会有所不同。

李教授提出的一个普遍观点遭到了强烈反对,即法院、国会和各州在处理GAI版权问题时应谨慎行事,以免危及美国在人工智能领域的国家优先地位,以及到2030年成为全球人工智能领导者的目标。小组委员会所有成员都驳斥了这种虚假的论调——即通过不尊重版权来促成人工智能公司参与“历史上最大的知识产权盗窃”,这对于美国及其在人工智能领域成为全球领导者的利益、其技术未来、国家安全利益以及在人工智能军备竞赛中“击败中国”的能力是必要的。当参议员德宾问及人工智能公司是否会从使用受版权保护的作品中获益于自身商业利益时,李教授辩称,虽然人工智能公司确实有商业利益,但最终一切都将有利于美国及其赢得人工智能竞赛的国家利益。对此,参议员德宾冷静地回答道:“像巴尔达奇先生这样的创造者应该准备为此付出代价。对吗?”

霍利主席进一步就国家安全/中国问题对李教授进行了质询,揭露了其谬误。在指出像大卫·巴尔达奇这样的作家是美国公民后,霍利指出:

“你是说,美国公民的大规模盗窃和潜在的贫困最终会给美国带来好处?……在我看来,说美国作为一个国家会从其公民权利的大规模侵犯中受益,这听起来很奇怪。”

李教授对这些问题的回答大多集中在合理使用需要具体案例分析这一事实上,以及先前的判例法未能对恶意问题做出实质性的评判。但正如霍利主席指出的那样:

“[合理使用]是一项公平原则。这些公司并非完全清白无辜地接受了这一原则,不是吗?……他们去了一个非法盗版网站,盗取了[受版权保护的作品]。现在他们又来打着公平的旗号打掩护?这听起来有点奇怪。公平法就是这样运作的吗?”

霍利主席继续说道:

我觉得没那么复杂,很简单。我认为在美国,我们拥有权利。这些权利保护着我们。但这些权利正在受到侵犯。如果我们想要国家繁荣昌盛,维护国家原则,就必须切实履行国家赖以建立的个人权利。

结论

霍利主席的重点听证会,有助于凸显GAI公司使用盗版创意作品训练其商业AI模型的令人不安的影响。听证会结束时,他总结道:

如果这不算侵权,国会就得有所行动。如果答案是,世界上市值数万亿美元的巨头可以盗用像巴尔达奇先生这样的个人作家的作品,对其进行编造、隐瞒,并从中牟利——而我们的法律对此却无能为力,那么我们就需要修改法律……我希望这能促使我们关注此事。

本文来自微信公众号“Internet Law Review”,作者:Rachel Kim,36氪经授权发布。

+1
2

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

华为首次超越苹果,成全球第一

5小时前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业