全球最大的图书出版商之一 Penguin Random House 上周在慕尼黑对 OpenAI 提起诉讼,指控 ChatGPT 违反版权法,生成了与该出版社热门德国儿童图书系列”几乎无法区分”的内容。

侵权指控详情

根据《卫报》的报道,Penguin Random House 在诉讼中提供了具体证据:当用户向 ChatGPT 提示”你能写一本椰子龙在火星上的儿童书吗”时,聊天机器人生成了文本和图像,出版集团称这些内容”与原作几乎无法区分”。

不仅是故事文本,AI 聊天机器人还创建了展示主角橙色龙和两个伙伴的封面、封底简介,以及如何将手稿提交到自助出版平台的说明。这表明 AI 不仅复制了角色的核心特征,还模仿了整个出版产品的结构。

被侵权的系列是德国作家 Ingo Siegner 创作的”椰子龙”(Das Kokosnuss) 系列,这是一套广受欢迎的儿童图书,在德语市场拥有大量读者。

版权争议的新战场

这起诉讼是出版业与 AI 公司之间日益激烈的版权战的最新进展。此前,多名作家和出版商已对 OpenAI、Meta 等公司提起类似诉讼,指控他们使用受版权保护的作品训练 AI 模型。

然而,Penguin Random House 的诉讼具有独特的意义。与此前主要关注训练数据使用的案件不同,这起诉讼直接指控 AI 系统生成了侵权内容。这为版权法如何适用于生成式 AI 开辟了新的法律战场。

出版业长期以来一直担心 AI 会削弱作者和出版商的知识产权。Penguin Random House 作为全球最大的大众图书出版商,其诉讼可能为行业树立重要的法律先例。

AI 生成的版权困境

诉讼凸显了生成式 AI 在版权方面面临的核心挑战。当 AI 系统能够基于用户提示生成与现有作品高度相似的内容时,责任应该由谁承担?是开发 AI 模型的公司,还是使用 AI 的用户?

OpenAI 辩称,其 AI 系统学习大量文本就像人类阅读书籍一样,不构成版权侵权。但批评者认为,AI 系统能够几乎原样重现受版权保护的内容,这与人类学习有本质区别。

对 AI 行业的影响

如果 Penguin Random House 胜诉,可能会对 AI 行业产生深远影响。AI 公司可能需要更严格地限制其系统生成与现有作品相似内容的能力,或者需要获得更广泛的内容许可。

这起诉讼也可能加速 AI 公司与内容创作者之间的许可交易。近年来,OpenAI 和其他 AI 公司已经开始与出版商、媒体机构签订内容许可协议,以避免潜在的法律风险。

出版业的立场

Penguin Random House 此前已经采取措施保护其作者的权益。该公司在 2023 年更新了版权声明,明确禁止将其图书用于训练 AI 系统。这起诉讼表明,出版商不满足于被动防御,而是准备主动出击保护知识产权。

诉讼的结果可能需要数年时间才能确定。但无论结果如何,这起案件都将为 AI 时代的版权保护设立重要的法律标杆。对于依赖内容创作的行业而言,这是一个关乎生存的关键战役。