据路透社报道,一群作家对人工智能公司 Anthropic 提起诉讼,指控该公司使用盗版书籍来训练其 AI模型。
据报道,这起集体诉讼周一在加利福尼亚州法院提起,原告声称 Anthropic “通过窃取数十万本受版权保护的书籍,建立了一个价值数十亿美元的业务”。
作者们在诉讼中表示,Anthropic 使用了一个庞大的开源数据集“The Pile”来训练其 Claude 系列 AI 聊天机器人。这个数据集包含了一个名为 Books3 的部分,这是一个巨大的盗版电子书库,其中包括 Stephen King、Michael Pollan 和数千名其他作家的作品。本月早些时候,Anthropic 向 Vox 证实其使用了 The Pile 来训练 Claude。
“很明显,Anthropic 下载并复制了 The Pile 和 Books3 的副本,明知这些数据集包含了大量来自 Bibiliotik 等盗版网站的受版权保护的内容,”诉讼中写道。作者们希望法院批准他们的集体诉讼,并要求 Anthropic 支付拟议的赔偿金,并禁止该公司将来使用受版权保护的材料。
去年前阿肯色州州长 Mike Huckabee 和其他作者对 Meta、微软和 EleutherAI(The Pile 背后的非营利组织)提起类似诉讼,指控他们盗用作品来训练 AI 模型。George R.R. Martin、Jodi Picoult、Michael Chabon 和其他几位作者也因 OpenAI 涉嫌使用他们的受版权保护内容而起诉了该公司。