独家：OpenAI未能在2025年前交付承诺的选择退出工具

摘要：OpenAI于2024年5月宣布计划开发一款名为媒体管理器的工具，旨在允许创作者控制其作品在人工智能训练数据中的使用。然而，七个月后，该功能尚未推出，且公司内部对此并不重视。一位前员工表示该项目并非优先事项，且没有人积极参与开发。此外，OpenAI面临来自创作

OpenAI于2024年5月宣布计划开发一款名为媒体管理器的工具，旨在允许创作者控制其作品在人工智能训练数据中的使用。然而，七个月后，该功能尚未推出，且公司内部对此并不重视。一位前员工表示该项目并非优先事项，且没有人积极参与开发。此外，OpenAI面临来自创作者的集体诉讼，因其人工智能模型未经同意使用了大量作品，导致知识产权担忧。虽然OpenAI提供了一些临时的“选择退出”方法，但创作者认为这些措施不够有效。媒体管理器本被视为改善这一情况的解决方案，OpenAI曾声称会与监管机构合作开发，并希望设立行业标准。然而，自宣布以来，该工具的进展并不明朗，OpenAI在2024年8月时仍称其“在开发中”，之后未再更新。

在2024年5月，OpenAI宣布计划创建一款工具，使创作者能够指定他们的作品应如何被纳入或排除在其人工智能训练数据中。然而，七个月后，这一功能仍未推出。根据OpenAI的说法，这款名为媒体管理器的工具旨在“识别受版权保护的文本、图像、音频和视频”，以反映创作者“来自多个来源的偏好”。这一举措旨在回应针对公司的强烈批评，并可能保护OpenAI免受知识产权（IP）法律挑战的影响。

尽管最初引起了广泛关注，但知情人士向TechCrunch透露，媒体管理器在公司内部并未被视为重要优先事项。一位前员工表达了怀疑，表示：“我认为这并不是一个优先事项”，并补充道：“说实话，我不记得有人在为此工作。”一位与OpenAI协调的非员工在2024年12月指出，关于该工具的讨论曾经发生过，但近期并没有更新。此外，参与媒体管理器项目的OpenAI法律团队成员Fred von Lohmann在2024年10月转为兼职顾问角色，进一步表明该项目的前景不明。

知识产权的担忧

像OpenAI开发的人工智能模型，通过从庞大的数据集中学习模式来进行预测。例如，它们可以预测一个人咬汉堡时会留下咬痕。这一能力使得像ChatGPT这样的模型能够生成令人信服的电子邮件和论文，而OpenAI的视频生成器Sora则能够制作出相对真实的视频片段。然而，引用现有作品的能力引发了关于重复使用的担忧。当适当提示时，这些模型能够生成近乎完全相同的数据副本，而这些数据虽然“公开可用”，却并未被意图用于这种类型的用途。

这一情况自然令那些作品在未经同意的情况下被纳入人工智能训练的创作者感到不满。许多人寻求法律救济，导致OpenAI面临来自艺术家、作家、YouTuber、计算机科学家和新闻机构的集体诉讼。原告包括著名人物如作家Sarah Silverman和Ta-Nehisi Coates，以及《纽约时报》和加拿大广播公司等视觉艺术家和媒体集团。尽管OpenAI与部分合作伙伴寻求许可协议，但许多创作者发现这些条款并不吸引人。

OpenAI为创作者提供了几种临时方法，以“选择退出”其人工智能训练过程。去年九月，该公司推出了一种提交表单，供艺术家标记其作品以便从未来的训练集中移除。此外，OpenAI还允许网站管理员阻止其网络爬虫在他们的域名上抓取数据。然而，许多创作者批评这些方法不一致且不足。对于书面作品、视频或音频录音，并没有具体的选择退出机制。此外，图像的选择退出表单要求创作者提交每个图像及其描述，这一过程被许多人认为繁琐。

媒体管理器被提议作为改善OpenAI选择退出选项的全面解决方案。在其5月的公告中，OpenAI表示媒体管理器将利用“前沿的机器学习研究”，赋予创作者和内容拥有者通知OpenAI其所有权利的能力。公司声称在开发这一工具时与监管机构合作，并表达了媒体管理器将“为人工智能行业设立标准”的期望。然而，自那时起，OpenAI未再公开提及该工具，留下了许多关于其未来的问题。一位发言人表示，该工具在2024年8月时“仍在开发中”，但在12月中旬的后续评论请求中未得到回应。