随着 ChatGPT、Bard 等聊天机器人的快速发展,生成式人工智能对大规模训练数据的依赖也受到越来越多关注。出版行业认为,这些训练数据中可能包含大量受版权保护的新闻与出版内容,因此相关使用方式应当受到更明确的规范。
据报道,多家出版商正在收集和调查相关证据,希望证明用于训练人工智能模型的数据集内存在版权作品。在此基础上,这些出版机构已联合行动,尝试推动更清晰的法律和行业规则,以维护自身的合法权益。
目前,这些出版商正通过出版贸易组织 News Media Alliance 向开发生成式 AI 的公司施压,主张相关企业应就使用版权内容训练模型一事,向内容提供方支付合理的补偿与报酬。
News Media Alliance 高管 Danielle Coffey 表示,这些有价值的内容本身受到版权保护,而当它们被持续用于帮助他人创造收入时,内容权利方理应获得相应回报。
这一动向也反映出,随着生成式 AI 技术不断扩张,围绕训练数据来源、版权归属以及利益分配的争议正在进一步升温。未来,相关法律法规和行业协商机制或将成为这一领域的重要焦点。
