生成式AI下一道门槛:数据合规

知产力·2026年03月11日 08:54
海量训练数据,究竟来自哪里,又该如何获得合法授权?

从媒体机构与AI公司的版权纠纷,到音乐、影视行业对生成式模型的质疑,再到创作者发现作品被秘密用于AI训练,围绕训练数据来源的争议不断浮现。

AI模型赖以成长的海量数据,究竟来自哪里,又该如何获得合法授权?

随着生成式AI从技术探索走向产业应用,这一问题已成为行业无法回避的现实。当AI从技术探索走向产业应用,训练数据不再只是技术问题,而开始成为一个制度问题。

合作止痛,难医根本

面对不断增加的版权争议,一些企业已经开始尝试通过合作方式,为AI训练数据寻找更加稳定的来源。

部分AI公司正在与媒体机构、出版机构建立内容授权合作,通过付费授权或联合开发的方式,为模型训练提供合法数据来源。一些大型内容集团,例如迪士尼与OpenAI以及达成相关协议,探索类似合作路径。

这种模式在一定程度上缓解了版权冲突,也让AI企业能够获得更清晰的数据来源。

但从行业角度看,个别合作很难成为长期解决方案。AI模型训练所需的数据规模往往以亿计,涉及的内容类型复杂,权利主体极其分散。即便大型机构之间能够达成合作,也难以覆盖数量庞大的中小创作者和海量内容。

换句话说,合作可以缓解局部问题,却无法解决规模问题。

权利合流,集体授权

AI模型需要规模化数据,而版权却天然是分散的,这是技术与制度之间自然形成的矛盾。

当逐一授权无法支撑产业规模时,制度化授权往往会成为新的解决方式。

在传统版权领域,类似问题早已出现。音乐、文字作品等内容同样具有"权利分散、使用规模巨大"的特点。如果每一次使用都需要逐一取得授权,文化产业几乎无法正常运转。

为了解决这一问题,市场逐渐发展出著作权集体管理制度。通过集体管理组织,大量分散的作品权利被集中管理,使用者只需获得一次许可,便可以在一定范围内合法使用大量作品,而相关收益则通过统一机制分配给权利人。

从制度逻辑看,AI训练数据所面临的问题,与传统版权领域的"大规模分散权利交易"高度相似。如果仍然依赖逐一授权,不仅成本难以承受,也几乎无法在现实中操作。

因此,借鉴集体管理制度,探索面向AI训练的数据集体授权机制,很可能成为未来的重要制度方向

这一制度的核心作用,可以概括为"降本增效"。

降本,降的不仅是权利人的维权成本,也降低了AI企业在谈判与合规上的交易成本。

增效,增的不只是权利人的稳定收益,也使AI企业能够在合法框架下获得规模化训练数据。

这一制度的核心作用,可以概括为"降本增效"。

降本,降的不仅是权利人的维权成本,也降低了AI企业在谈判与合规上的交易成本。

增效,增的不只是权利人的稳定收益,也使AI企业能够在合法框架下获得规模化训练数据。

在这样的机制下,分散的内容资源可以进入更顺畅的数据流通体系,既提高作品利用效率,也为AI训练建立更加稳定的合法来源。

当然,这并不意味着简单复制现有模式。与传统作品使用相比,AI训练数据在权利界定、使用方式和价值分配上都更加复杂。例如训练数据中可能同时包含原始作品、二次创作内容以及来源不清的数据;不同内容对模型能力的贡献也难以精确衡量

这意味着,围绕AI训练数据建立集体授权体系,本身将是一项复杂的制度工程。但随着训练规模扩大、版权争议增加,市场与制度都可能推动更加集中化的数据授权机制逐步形成。

数据门槛,垄断隐现

训练数据问题,正在悄然改变AI行业的竞争结构。

过去几年,AI行业的竞争主要集中在算力和算法能力上。谁拥有更强的计算资源,谁能够训练出更大的模型,往往就能在技术竞赛中占据优势。

但随着版权争议不断增加,训练数据的来源和合规性开始成为新的现实约束。获取高质量、合法来源的数据,不仅意味着更高成本,也意味着更复杂的合规体系。

如果未来的数据获取主要依赖大型内容机构与头部AI企业之间的个别合作,这种模式很可能进一步抬高行业门槛。

大型科技企业更容易通过资金和资源获得优质内容授权,而大量中小创作者和小型IP却难以进入合作体系。

对于资源有限的新兴AI企业而言,缺乏稳定的数据来源,也可能使其难以参与竞争。

从长期看,如果训练数据逐渐集中在少数大型企业手中,AI产业甚至可能形成新的数据垄断格局。届时,数据不仅是技术资源,更可能成为新的产业权力。

也正因为如此,建立更加开放、规模化的数据授权机制才显得尤为重要。如果能够通过集体授权等制度安排,让分散的内容权利进入统一的数据流通体系,不仅可以降低AI企业的授权成本,也能够让更多创作者参与数据价值分配,从而避免数据资源过度集中。

AI行业的竞争正在悄然改变方向。

如果说过去的门槛是算力和算法,那么未来的门槛很可能是数据来源的合法性。

当训练数据成为新的准入条件时,AI行业的竞争规则也将随之改写。

本文来自微信公众号“知产力”(ID:zhichanli),作者:Edwin,36氪经授权发布。

+1
2

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

让员工技能与公司需求最大程度相匹配。

1小时前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业