400家报纸集体起诉AI巨头,AI的“免费午餐”吃到头了?

投行圈子·2026年06月29日 16:21
估值8250以美元,风光无限的AI巨头OpenAI,最近麻烦不断!

估值8250以美元,风光无限的AI巨头OpenAI,最近麻烦不断。

近日,曼哈顿联邦法院收到了一份长达55页的诉状。代表近400家美国报纸的出版商联盟,把OpenAI和微软告了。

原告名单里既有我们熟悉的《纽约每日新闻》,也有大量国人根本就没听说过的M国本地小报,阿肯色州民主党公报、田纳西州查塔努加时报自由报,以及遍布全美各地的地方媒体。

起诉的罪名:偷内容,不付钱。

出版商指控OpenAI和微软“系统性地、秘密地”爬取了数百家新闻网站的内容,包括付费墙后面的文章,复制到自己的服务器上,用来训练ChatGPT和微软Copilot。

更狠的是,他们还把版权管理信息给删了,作者署名、版权声明、使用条款,统统抹掉。

“这些生成式AI产品建立在出版商长期投入的内容之上,给被告带来了数十亿美元的市场价值,而出版商1分钱都没拿到。”

原告律师、新泽西州前总检察长马修·普拉特金说得更直白:如果不追究责任,这轮AI热潮就是地方新闻业的“丧钟”。

江湖斗争经验丰富OpenAI的回应还是老一套:模型推动创新,训练数据来自公开渠道,合理使用。微软那边暂时没吭声。

这不是第一起AI版权诉讼,但可能是规模最大的一起。

AI侵权乱象,并非单一案例

说这场诉讼是“爆发”,其实不太准确。AI版权纠纷早就存在了,这次只是又添了一把火。

2023年12月,《纽约时报》率先采取行动,成为全球首家起诉生成式AI公司的大型出版机构。此后,起诉AI公司的队伍越来越长。

2025年9月,迪士尼、环球影业和华纳兄弟集体起诉中国AI公司MiniMax,指控其视频生成工具海螺AI未经许可使用了大量受版权保护的电影和动画内容。2025年11月,德国慕尼黑法院判OpenAI侵权,因为它的模型“记住”了德国音乐人的歌词并在输出中再现。

2026年,争议范围继续扩大。CNN起诉了Perplexity AI,Reddit也起诉了Perplexity。大英百科全书及其旗下的韦氏词典也加入了起诉OpenAI的行列。约翰·格里沙姆、莎拉·西尔弗曼等一批作家也起诉了AI公司,说自己的书被白用了。

不仅仅是媒体和创作者。2026年6月,音乐平台Jamendo起诉英伟达,指控其AI音乐模型Fugatto在未经许可的情况下,使用了一个本应仅用于学术研究的免费数据集进行训练。

从新闻到电影,从音乐到文学,从图片到代码,AI的“数据饥渴”正在撞上每一个内容行业的版权墙。这已经不是什么“个案”,而是一场结构性的产业冲突。

为什么AI公司总爱“先用了再说”?

要理解这场冲突,得先看懂AI的商业模式。

训练一个像GPT这样的大语言模型,需要海量的数据。OpenAI自己承认过,创始人萨姆·奥尔特曼曾在英国上议院作证时说,“不使用受版权保护的材料,训练今天领先的AI模型是不可能的”。

问题就在这里。AI的整个商业模式建立在“免费获取数据”的前提之上,而数据的创造者,记者、作家、音乐人、摄影师,却指望着靠这些内容吃饭。

两边都有道理,但利益完全对立。

AI公司会说:我们是在“学习”,人类学习不也要看书看报吗?这叫“合理使用”。版权方会说:你的“学习”是商业行为,你拿我的东西去赚钱,凭什么不给钱?

这场争论的核心,其实是一个老问题在新场景下的复现:技术带来的效率提升,收益应该怎么分配?

再看看数字就能明白为什么版权方坐不住了。

OpenAI 2023年收入约20亿美元,2024年约60亿美元,2025年约131亿美元。截至2026年2月底,年化收入已突破250亿美元。2026年3月完成1220亿美元融资后,估值高达8520亿美元。

微软那边更夸张。2026财年第三季度(截至2026年3月31日),单季营收829亿美元,同比增长18%;净利润318亿美元,同比增长23%。AI业务的年化收入运行率已达370亿美元,同比增长123%。

一边是AI公司赚得盆满钵满,一边是地方报纸在生死线上挣扎。利益的天平已经严重倾斜。

出版商在诉状里说,他们花了数十亿美元来保护自己的内容,包括设置付费墙,结果全白费了。而OpenAI从一家出版商就提取了138144篇文章。

这张表格会让你看得更清楚:

数据来源:OpenAI收入及估值来自华尔街见闻及公开报道;微软财报来自微软官方公告

数字摆在这里,谁都能看懂:AI公司用别人的内容赚了天量的钱,而内容的创造者不仅没分到一杯羹,自己的饭碗还被AI给砸了。

这对AI使用者意味着什么?

如果你只是一个普通用户,平时用ChatGPT写写邮件、做做总结,这件事对你短期影响不大。但如果你是企业用户,或者用AI生成内容进行商业活动,这个官司的结果可能直接关系到你的“合规成本”。

目前AI版权领域最大的法律不确定性就是“合理使用”的边界。OpenAI一直在用“合理使用”来抗辩。但学术界对此争议很大。

华东政法大学教授王迁指出,建立语料库需要对海量作品进行复制,无论复制是为了人类学习还是机器学习,若未经许可且未产生新价值,单纯以“学习”为由主张“合理使用”在法理上难以自洽。

如果法院最终判定AI公司的大规模数据抓取不构成“合理使用”,那整个行业的游戏规则就要重写。

AI公司要么支付巨额赔偿(《纽约时报》的律师已经在喊“数百亿美元”了),要么跟每一个版权方去谈授权,这几乎是不可能完成的任务。

而对普通用户来说,最直接的后果可能是:AI工具变贵了。合规成本最终会转嫁到用户头上。

另一个值得关注的趋势是,越来越多的内容平台开始“筑墙”。Reddit已经起诉了Perplexity AI。如果AI公司不能通过合法途径获取数据,未来的AI模型可能会面临“数据荒”,高质量的训练数据越来越难免费获得。

这场官司给所有内容创作者的启示

这场近400家报纸的集体诉讼,本质上是在问一个问题:当AI把整个内容产业的数据都“搬”走之后,原创内容的价值由谁来保障?

地方报纸的处境尤其值得关注。在过去十年里,美国已经有超过2500家报纸倒闭。

剩下的那些,正在被AI“免费搬运”最后的生存资源。正如普拉特金所说,“地方记者报道市议会、社区会议、本地犯罪和腐败,报道新餐馆开业。AI系统不做这些事。”

这句话点出了问题的本质:AI是内容的“消费者”,而不是“生产者”

如果内容的原创者都饿死了,AI将来还能“吃”什么?

好消息是,司法系统正在回应这个问题。我国相关部门已在2026年5月宣布,“十五五”期间将研究制定涉人工智能案件和数据产权司法保护的规范性文件。2025年,中国法院审结涉数据权属和交易等纠纷案件908件,同比增长25.6%。

在这方面,我国历来高度重视,相关文件的出台,也有有效的规范了市场,保护了创作者的权益。

美国的这场诉讼,无论最终结果如何,都将成为AI版权法律史上的标志性案例。

AI不会消失,版权也不会消失。

这场冲突的终点,不会是谁把谁“干掉”,而是一个新的平衡,让技术创新和内容创作都能活下去的平衡。近400家报纸的这次集体起诉,就是这个平衡到来之前的又一次猛烈碰撞。

技术可以改变世界,但不能吃掉世界。

本文来自微信公众号“投行圈子”,作者:投研君,36氪经授权发布。

+1
5

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000
36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业