人工智能与盗版:通用人工智能能否阅读书籍并抄袭内容以供学习?

文章讨论了人工智能公司Anthropic使用书籍训练其LLM模型的法律问题。法院认为,Anthropic购买或从公共图书馆获取书籍进行扫描和用于LLM训练属于合理使用,但使用盗版书籍则不属于合理使用,可能会面临诉讼和赔偿。

AI 和盗版:GenAI 可以阅读书籍并窃取内容用于学习吗?

我参与了一起集体诉讼,这与 Anthropic 扫描了我的两本书有关——他们拥有 Claude AI 代理——然后用于他们的 LLM 模型:

图:这封电子邮件是真实的,与针对 Anthropic 的集体诉讼有关

所以,我们有这个问题……

GenAI 在未经我同意的情况下扫描我的书籍内容是可以接受的吗?

正如我们将看到的,答案是,如果该公司购买了该书或从公共图书馆获得该书,则是可以接受的,这就像有人阅读我的书并从中学习一样。只要 LLM 不向用户回放我的书的内容,就是可以接受的。但是,如果 GenAI 公司从盗版网站获得我的书,那是不可接受的,我可以起诉该公司。明白了吗?嗯,我会解释。

简介

扪心自问,我不太喜欢 GenAI 为了少数公司的利润而盗用知识产权 (IP) 的方式。对我来说,目前,GenAI 呈现出一种虚假的智能,远非人类智能。通过 LLM,我们看到了一种智能模型,它基本上只是对模板化答案中的下一个单词进行概率猜测。

因此,主要的担忧之一是 GenAI 在未经许可的情况下抓取 IP,然后在其模型中使用它。这违反了我们现有的法律,并且没有回报给那些创造它的人——所有的利润都归 GenAI 公司所有。尽管如此,这种情况已经发生了至少十年,谷歌几乎扫描了它能找到的每一本书,但没有征求许可。

Bartz v Antropic

总的来说,很明显,一些 GenAI 公司正在违反现有的版权规则,并且在需要时没有征求许可。一个成功的案例是 Bartz v Antropic [ 这里]:

这与加利福尼亚州的一位法官于 2025 年 6 月 23 日的裁决有关:

地区法院认为,Anthropic 使用书籍训练其 Claude 大型语言模型以及使用购买的书籍副本创建数字永久图书馆构成合理使用,但其使用盗版书籍创建此类图书馆不构成合理使用。

这与 GenAI Claude 平台有关。为此,Anthropic 使用来自中央图书馆的书籍来训练他们的 LLM,但也从在线盗版图书馆(如 Books3 和 Library Genesis)使用了这些书籍。他们还批量购买书籍,然后剥去装订并扫描书籍——购买并扫描的副本。所有这些书籍随后都在 LLM 中编入索引以进行训练。总的来说,这些书籍没有以其原始内容的形式呈现,因此 Anthropic 认为他们没有违反版权。对于 Anthropic 来说,这些书籍仅仅用于训练他们的模型。

对于 LLM 的训练,法院概述:

使用受版权保护的作品训练 LLM 以生成新文本的目的和性质本质上是变革性的……[l] 就像任何渴望成为作家的读者一样,Anthropic 的 LLM 基于作品进行训练,而不是竞相复制或取代 [这些作品]——而是急转弯并创造出不同的东西。

因此,它裁定 LLM 训练要素为“合理使用”,因为它以与某人阅读书籍然后从中学习相同的方式行事。

对于“购买和扫描”方法,法院认为它已经公平地购买了实体书籍,然后有权将内容更改为另一种形式,然后随意处置该书。格式的更改使 Anthropic 能够快速索引内容并压缩内容的存储。

对于未经购买而下载的盗版书籍,法院裁定 Anthropic 无权在其图书馆中使用这些书籍,无论它是否将这些书籍用于 LLM 训练。法院将此定义为非变革性的。另一方面,对于 Google Books,这些书籍直接链接到原始作品。对于 LLM 训练,情况并非如此(因为没有全文版本可用):

不存在 Anthropic 从中制作其第一个副本的授权副本。没有将全文副本立即用于训练 LLM。并非每个副本都是必要的,甚至都未用于训练 LLM。

可以扫描所有相关的书籍 [ 这里]:

这是我的其中一本书:

总而言之,该裁决定义,当一家公司购买书籍或使用开放图书馆时,扫描并用于训练 LLM 模型是合理使用,但盗版副本违反了合理使用:

然而,对于用于构建 Anthropic 中央图书馆的下载的盗版副本,每个因素都对合理使用不利。因此,法院驳回了对该问题的即决判决,并将由此造成的损害赔偿问题留待审判。

正是这一判决将被用于索赔每本书约 3,000 美元的赔偿金。

结论

GenAI 正在盗用 IP,从法律的角度来看,他们可以侥幸逃脱,所以要小心!任何公开的东西都可能成为 GenAI 的公平游戏,所以注意你分享的内容!

  • 原文链接: medium.com/asecuritysite...
  • 登链社区 AI 助手,为大家转译优秀英文文章,如有翻译不通的地方,还请包涵~
点赞 0
收藏 0
分享
本文参与登链社区写作激励计划 ,好文好收益,欢迎正在阅读的你也加入。

0 条评论

请先 登录 后评论
asecuritysite
asecuritysite
江湖只有他的大名,没有他的介绍。