近期,多家媒体组织发起呼吁,要求制定法规以保护用于训练生成人工智能模型的数据版权。
这封公开信向全球立法者发出请求,希望他们考虑制定新规,确保培训数据集的透明度,并在使用数据进行培训前获得权利人的同意。同时,他们还要求媒体公司能够与人工智能模型运营商进行协商,识别人工智能生成的内容,并要求人工智能公司消除其服务中的偏见与错误信息。
这封信的签署单位包括法新社、欧洲新闻图片社、欧洲出版商理事会、甘尼特、盖蒂图片社、国家新闻摄影师协会、国家作家联盟、新闻媒体联盟、美联社和作家协会等。
签署者指出,使用媒体内容训练的模型传播信息,未能考虑原始创作者的权益,也未向他们提供报酬或归属。
信中提到:“这种做法破坏了媒体行业的核心商业模式,而这些模式是基于读者群和收视率发展的。除了违反版权法之外,随之而来的影响还大大减少了媒体的多样性,损害了公司对媒体报道的投资可行性,进而减少了公众获取高质量、可信信息的机会。”
据报道,谷歌已向《纽约时报》、《华盛顿邮报》和《华尔街日报》所属的新闻集团展示了其生成式人工智能新闻写作工具Genesis。其他采用生成式人工智能的新闻机构在生成的文章中发现了多个错误。
新闻机构并非唯一担忧人工智能模型在受版权保护材料上进行训练的组织——这一做法的法律地位尚未得到明确。参议院在多次听证会上讨论了此问题,生成人工智能艺术平台Midjourney和Stable DiFFUSion因侵犯艺术家权利而面临的诉讼正在法庭审理中。喜剧演员SaRah SilveRMan与两位作者也对OpenAI提起诉讼,指控其侵犯版权。
签署者们表示,他们相信生成式人工智能能为组织和公众带来显著的益处,同时要求在讨论中尊重媒体公司的权利。
路透社报道,一些签署方已与人工智能公司达成协议,允许其使用他们的材料进行培训。例如,美联社已允许OpenAI授权其部分档案,并探索利用生成式人工智能进行新闻写作。
[[[IMG_1]]]
[[[IMG_2]]]
[[[IMG_3]]]
