AI训练引发版权风暴:Anthropic销书案将生成式AI推上风口浪尖

近期,人工智能领域的一起法庭案件引发了广泛关注,焦点集中在Anthropic公司训练AI助手的方式上。据悉,该公司为了构建其语言模型Claude,采取了极端的措施:购买并销毁了数百万本实体书籍。

案件细节显示,Anthropic购买大量书籍后,通过撕毁装订线和扫描书页的方式将它们数字化。这一过程不仅导致实体书籍的彻底毁坏,而且数字化的书籍也并未公开。然而,在法庭上,这一行为被法官视为合理的转化使用,因此Anthropic在部分问题上获得了胜诉。法官认为,这种数字化处理符合版权法中的合理使用原则。

尽管如此,批评者依然对Anthropic的做法表示强烈质疑。他们指出,尽管Claude能够生成独特内容,但大型语言模型在训练过程中仍有可能逐字复制原文。Anthropic在法律上的部分胜利意味着,该公司能够在不通知原出版商或作者的情况下,利用受版权保护的书籍训练AI模型。这一行为可能为生成式人工智能行业扫清了一大障碍,但也引发了关于版权保护的广泛讨论。

事实上,版权问题一直是生成式人工智能发展的痛点之一。有业内人士表示,如果AI必须严格遵守版权法,整个行业可能会面临崩溃的风险。这是因为,开发大型语言模型需要庞大的数据集,而获取这些数据往往困难重重。持续的版权纠纷更是给这一技术的发展带来了巨大挑战。

近期,一些知名公司也卷入了与AI相关的版权诉讼中。例如,Getty Images的首席执行官承认,公司无法承担所有与AI相关的版权侵权费用。同时,迪士尼对图像生成公司Midjourney的诉讼也凸显了图像生成器复制受版权保护内容的能力,这进一步加剧了业界对生成式人工智能未来发展的担忧。

值得注意的是,尽管法官在部分问题上判决Anthropic胜诉,但该公司仍需在12月面临版权审判。据称,如果Anthropic被判侵权,每部盗版作品可能面临高达15万美元的赔偿金。这一潜在的巨额赔偿无疑为生成式人工智能的未来增添了更多不确定性。

文章采集于互联网