Mark Zuckerberg亲自授权用盗版材料训练Llama的AI模型

360影视 2025-01-12 14:14 3

摘要:Meta首席执行官马克·扎克伯格(Mark Zuckerberg)亲自授权Meta部门,负责开发Llama人工智能模型,使用包含非法获取书籍和文章的数据集来训练他们。这是由作家理查德·卡德里(Richard Kadrey)对Meta的审判中公布的文件公布的。

Meta首席执行官马克·扎克伯格(Mark Zuckerberg)亲自授权Meta部门,负责开发Llama人工智能模型,使用包含非法获取书籍和文章的数据集来训练他们。这是由作家理查德·卡德里(Richard Kadrey)对Meta的审判中公布的文件公布的。

图片来源:Tingey Injury /unsplash.com

这个过程只是人工智能技术巨头被指控在未经作者许可的情况下用受版权保护的材料训练模型的一系列案例中的一个。被告历来声称自己的行为符合公平使用内容的规则--这一原则允许在创作与原始作品有很大不同的新作品或产品时忽略版权。许多权利持有人不同意这一立场。

在解密文件的新部分(PDF)引用了代表Meta的证词:事实证明,马克·扎克伯格亲自批准该公司使用Libgen阵列来培训Llama。LibGen项目将自己定位为链接聚合器,实际上提供了对由大型出版商管理的受版权保护作品的访问。他曾多次受到法律诉讼,并因侵犯版权而被追回数千万美元,最终该项目被迫关闭。文件称,扎克伯格已经批准使用LibGen来训练至少一个Llama模型,尽管普通员工和Meta管理层成员表达的担忧。一份内部备忘录指出,在“升级到MZ”之后,LibGen的工作已经获得批准,这显然是该公司首席执行官的意思。

图片来源:Igor unsplash.com

原告方于1月8日向法院提出了新的指控。特别是,据称Meta可能试图掩盖这一行为,并删除有关使用LibGen材料的信息-这据称是由工程师Meta尼古拉巴什利科夫(Nikolay Bashlykov),谁写了一个脚本,从书籍中删除了知识集的版权信息。Meta还据称删除了版权信息和相关元数据从该阵列科学期刊文章中的相关元数据。此外,Meta侵犯了版权,通过BitTorrent协议下载LibGen阵列-在这一点上,该公司不仅下载,但同时“分发”这些数据,实际上传播盗版材料,原告方声称。 Meta的生成AI部门负责人Ahmad Al-Dahle允许通过BitTorrent下载LibGen数据,尽管工程师Bashlykov表示,这“可能在法律上是不允许的”

事情还远未结束。到目前为止,它仅适用于早期的 Llama 模型,不适用于最新版本。如果 Meta✴ 说服法院合理使用这些材料,它可能会站在公司一边——2023 年,几名原告无法证明侵犯版权,他们对 Meta 的索赔✴被驳回。

来源:A7a369

相关推荐