互联网资讯 / 人工智能 · 2024年3月7日

OpenAI回应侵权指控

1月9日消息,OpenAI在被指控侵权后公开回应。

OpenAI回应《纽约时报》侵权指控:没有法律依据 训练数据来自公开渠道

据悉,OpenAI在训练其人工智能语言模型时,使用了大量从网络收集的数据,包括维基百科文章、著名小说及社交媒体帖子等,而并未获得相关许可。

微软是OpenAI的重要支持者,已在其多款产品中应用了OpenAI的人工智能工具。

2023年12月27日,《纽约时报》在联邦法院对OpenAI和微软提起诉讼,指控两家公司未经许可使用其内容训练人工智能模型,侵犯了版权。

《纽约时报》声称,这两家公司非法使用了其数百万篇文章,导致生成的内容与《纽约时报》的内容形成直接竞争。

在诉讼中,《纽约时报》的律师表示,该报在与OpenAI就内容使用进行谈判时寻求“公平价值”,但未能达成一致。

针对侵权指控,OpenAI知识产权和内容主管汤姆·鲁宾(ToM RuBIn)在1月4日表示,对《纽约时报》的起诉感到“惊讶”,因为双方在此之前的谈判是“积极和富有成效”的。

OpenAI最近再次对诉讼发表声明,称《纽约时报》在文章开头提示GPT模型,导致生成的文本与原文过于相似,从而增加了侵犯版权的风险,认为这违反了语言模型的使用条款。

鲁宾进一步指出,这些“提示”违反了大模型的使用条款,《纽约时报》故意利用这些“提示”使大模型复制训练数据。

在周一的声明中,OpenAI重申,《纽约时报》提起的诉讼“没有法律依据”,并且未陈述完整事实。尽管如此,该公司希望与《纽约时报》建立建设性的合作关系,并尊重其历史。

OpenAI表示,使用公开的互联网材料训练AI模型属于合理使用,这一点得到了长期和广泛的认可。该公司同时为出版商提供了退出选项,以防止OpenAI的工具访问其网站。

此外,OpenAI指出,“重复”是公司努力消除的罕见错误。《纽约时报》提到的重复内容似乎来自多年前在多个第三方网站上广泛传播的文章,他们似乎故意操纵提示,通常包括冗长的文章摘录,以使模型重复。即使使用这些提示,模型的表现仍然未如《纽约时报》所暗示的那样,这表明他们要么指示模型重复,要么从多次尝试中挑选出例子。

在《纽约时报》提起诉讼后,OpenAI上周表示正在与多家出版商洽谈版权合作。消息人士称,OpenAI愿意每年向一些媒体公司支付100万至500万美元,以获取使用版权内容训练其大模型的许可。