400家报纸集体起诉AI巨头，AI的“免费午餐”吃到头了？

投行圈子·2026年06月29日 16:21

估值8250以美元，风光无限的AI巨头OpenAI，最近麻烦不断！

估值8250以美元，风光无限的AI巨头OpenAI，最近麻烦不断。

近日，曼哈顿联邦法院收到了一份长达55页的诉状。代表近400家美国报纸的出版商联盟，把OpenAI和微软告了。

原告名单里既有我们熟悉的《纽约每日新闻》，也有大量国人根本就没听说过的M国本地小报，阿肯色州民主党公报、田纳西州查塔努加时报自由报，以及遍布全美各地的地方媒体。

起诉的罪名：偷内容，不付钱。

出版商指控OpenAI和微软“系统性地、秘密地”爬取了数百家新闻网站的内容，包括付费墙后面的文章，复制到自己的服务器上，用来训练ChatGPT和微软Copilot。

“这些生成式AI产品建立在出版商长期投入的内容之上，给被告带来了数十亿美元的市场价值，而出版商1分钱都没拿到。”

原告律师、新泽西州前总检察长马修·普拉特金说得更直白：如果不追究责任，这轮AI热潮就是地方新闻业的“丧钟”。

江湖斗争经验丰富OpenAI的回应还是老一套：模型推动创新，训练数据来自公开渠道，合理使用。微软那边暂时没吭声。

这不是第一起AI版权诉讼，但可能是规模最大的一起。

AI侵权乱象，并非单一案例

说这场诉讼是“爆发”，其实不太准确。AI版权纠纷早就存在了，这次只是又添了一把火。

2023年12月，《纽约时报》率先采取行动，成为全球首家起诉生成式AI公司的大型出版机构。此后，起诉AI公司的队伍越来越长。

2025年9月，迪士尼、环球影业和华纳兄弟集体起诉中国AI公司MiniMax，指控其视频生成工具海螺AI未经许可使用了大量受版权保护的电影和动画内容。2025年11月，德国慕尼黑法院判OpenAI侵权，因为它的模型“记住”了德国音乐人的歌词并在输出中再现。

2026年，争议范围继续扩大。CNN起诉了Perplexity AI，Reddit也起诉了Perplexity。大英百科全书及其旗下的韦氏词典也加入了起诉OpenAI的行列。约翰·格里沙姆、莎拉·西尔弗曼等一批作家也起诉了AI公司，说自己的书被白用了。

不仅仅是媒体和创作者。2026年6月，音乐平台Jamendo起诉英伟达，指控其AI音乐模型Fugatto在未经许可的情况下，使用了一个本应仅用于学术研究的免费数据集进行训练。

从新闻到电影，从音乐到文学，从图片到代码，AI的“数据饥渴”正在撞上每一个内容行业的版权墙。这已经不是什么“个案”，而是一场结构性的产业冲突。

为什么AI公司总爱“先用了再说”？

要理解这场冲突，得先看懂AI的商业模式。

训练一个像GPT这样的大语言模型，需要海量的数据。OpenAI自己承认过，创始人萨姆·奥尔特曼曾在英国上议院作证时说，“不使用受版权保护的材料，训练今天领先的AI模型是不可能的”。

问题就在这里。AI的整个商业模式建立在“免费获取数据”的前提之上，而数据的创造者，记者、作家、音乐人、摄影师，却指望着靠这些内容吃饭。

两边都有道理，但利益完全对立。

AI公司会说：我们是在“学习”，人类学习不也要看书看报吗？这叫“合理使用”。版权方会说：你的“学习”是商业行为，你拿我的东西去赚钱，凭什么不给钱？

这场争论的核心，其实是一个老问题在新场景下的复现：技术带来的效率提升，收益应该怎么分配？

再看看数字就能明白为什么版权方坐不住了。

OpenAI 2023年收入约20亿美元，2024年约60亿美元，2025年约131亿美元。截至2026年2月底，年化收入已突破250亿美元。2026年3月完成1220亿美元融资后，估值高达8520亿美元。

微软那边更夸张。2026财年第三季度（截至2026年3月31日），单季营收829亿美元，同比增长18%；净利润318亿美元，同比增长23%。AI业务的年化收入运行率已达370亿美元，同比增长123%。

一边是AI公司赚得盆满钵满，一边是地方报纸在生死线上挣扎。利益的天平已经严重倾斜。

出版商在诉状里说，他们花了数十亿美元来保护自己的内容，包括设置付费墙，结果全白费了。而OpenAI从一家出版商就提取了138144篇文章。

这张表格会让你看得更清楚：

数据来源：OpenAI收入及估值来自华尔街见闻及公开报道；微软财报来自微软官方公告

数字摆在这里，谁都能看懂：AI公司用别人的内容赚了天量的钱，而内容的创造者不仅没分到一杯羹，自己的饭碗还被AI给砸了。

这对AI使用者意味着什么？

如果你只是一个普通用户，平时用ChatGPT写写邮件、做做总结，这件事对你短期影响不大。但如果你是企业用户，或者用AI生成内容进行商业活动，这个官司的结果可能直接关系到你的“合规成本”。

目前AI版权领域最大的法律不确定性就是“合理使用”的边界。OpenAI一直在用“合理使用”来抗辩。但学术界对此争议很大。

华东政法大学教授王迁指出，建立语料库需要对海量作品进行复制，无论复制是为了人类学习还是机器学习，若未经许可且未产生新价值，单纯以“学习”为由主张“合理使用”在法理上难以自洽。

如果法院最终判定AI公司的大规模数据抓取不构成“合理使用”，那整个行业的游戏规则就要重写。

AI公司要么支付巨额赔偿（《纽约时报》的律师已经在喊“数百亿美元”了），要么跟每一个版权方去谈授权，这几乎是不可能完成的任务。

而对普通用户来说，最直接的后果可能是：AI工具变贵了。合规成本最终会转嫁到用户头上。

另一个值得关注的趋势是，越来越多的内容平台开始“筑墙”。Reddit已经起诉了Perplexity AI。如果AI公司不能通过合法途径获取数据，未来的AI模型可能会面临“数据荒”，高质量的训练数据越来越难免费获得。

这场官司给所有内容创作者的启示

这场近400家报纸的集体诉讼，本质上是在问一个问题：当AI把整个内容产业的数据都“搬”走之后，原创内容的价值由谁来保障？

地方报纸的处境尤其值得关注。在过去十年里，美国已经有超过2500家报纸倒闭。

剩下的那些，正在被AI“免费搬运”最后的生存资源。正如普拉特金所说，“地方记者报道市议会、社区会议、本地犯罪和腐败，报道新餐馆开业。AI系统不做这些事。”

这句话点出了问题的本质：AI是内容的“消费者”，而不是“生产者”。

如果内容的原创者都饿死了，AI将来还能“吃”什么？

好消息是，司法系统正在回应这个问题。我国相关部门已在2026年5月宣布，“十五五”期间将研究制定涉人工智能案件和数据产权司法保护的规范性文件。2025年，中国法院审结涉数据权属和交易等纠纷案件908件，同比增长25.6%。

在这方面，我国历来高度重视，相关文件的出台，也有有效的规范了市场，保护了创作者的权益。

美国的这场诉讼，无论最终结果如何，都将成为AI版权法律史上的标志性案例。

AI不会消失，版权也不会消失。

这场冲突的终点，不会是谁把谁“干掉”，而是一个新的平衡，让技术创新和内容创作都能活下去的平衡。近400家报纸的这次集体起诉，就是这个平衡到来之前的又一次猛烈碰撞。

技术可以改变世界，但不能吃掉世界。

本文来自微信公众号“投行圈子”，作者：投研君，36氪经授权发布。

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

400家报纸集体起诉AI巨头，AI的“免费午餐”吃到头了？

起诉的罪名：偷内容，不付钱。

为什么AI公司总爱“先用了再说”？

这对AI使用者意味着什么？

最近内容

下一篇