Getty Images构建确保版权的生成式人工智能模型

360影视 动漫周边 2025-04-21 17:08 2

摘要:生成式人工智能几乎可以创造出任何图像,但它很少告诉你图像来自哪里或谁做出了贡献。最近围绕吉卜力工作室和OpenAI的争议让我们看到了其中的利害关系,因为人工智能生成的模仿工作室独特动画风格的图像在网上疯传,尽管并没有与宫崎骏关联,也没有获得授权模仿他的作品。

生成式人工智能几乎可以创造出任何图像,但它很少告诉你图像来自哪里或谁做出了贡献。最近围绕吉卜力工作室和OpenAI的争议让我们看到了其中的利害关系,因为人工智能生成的模仿工作室独特动画风格的图像在网上疯传,尽管并没有与宫崎骏关联,也没有获得授权模仿他的作品。

在一个充满人工智能的世界里,人工智能模型经常在抓取和未经许可的内容上进行训练,Getty Images提供了一种不同的工具:一种完全基于许可的、人工创建的内容定制的图像生成模型,并有一个版税制度,确保贡献者的工作得到报酬。

Getty Images人工智能/机器学习负责人Andrea Gagliano接受了媒体采访。她的团队负责监督该公司的搜索和生成式人工智能工作,这些工作植根于Getty Images的创意方面,包括广告和营销活动中使用的图像、插图和视频。与该公司涵盖名人、政治和时事的编辑内容不同,创意库提供了一个没有版权问题的基础,完全来自授权的贡献者内容。

Getty Images在其人工智能生成器中建立了严格的保护措施:它不会生成已知的肖像或可识别的商标,确保内容可用于商业用途。Gagliano说,客户需要可以自由使用的视觉效果,而不必担心法律风险。我们的目标是支持两端的创造力:让用户能够突破界限,同时继续投资于使这一切成为可能的艺术家。

Gagliano说:“我们真的认为它可以提升创造力,让我们的客户、创意人员和艺术家更具概念性,或者在创造力方面突破界限,但我们希望利用这种力量,同时确保我们以保护创作者和商业安全的方式这样做。”。

Getty没有使用从互联网上抓取的公共数据来训练他们的模型,而是完全依赖其约2亿张图片的授权创意库,贡献者通过收入分成模式获得报酬,该模式在产品生命周期内对他们进行奖励。Gagliano说,这些内容是“从摄影师和贡献者那里获得许可的,它会定期向这些贡献者提供补偿,所以不仅仅是一次性费用,而是根据生成工具的收入,作为收入的一部分,直到永远。”

通过测试Getty Images的人工智能生成模型,以创建一位艺术家和他的人工智能助手的图像。用户界面非常直观,内置的提示生成器有效且易于使用。用户还可以使用特殊工具对图像进行微调,通过额外的提示突出显示我们想要改进的区域。

与许多生成工具不同,Getty Images的模型提供了一些具体的东西:法律保证和商业可用性。生成的视觉效果具有每幅图像高达50000美元的自动法律保护,该公司提供无上限的赔偿作为其企业解决方案的一部分,以及永久和全球使用权,对印刷量或数字展示没有限制。此外,用户输出永远不会添加到Getty的可搜索创意库中,并且有及时的保护措施来防止产生已知的品牌、徽标或名人肖像。“可安全用于商业用途”不仅是一种说法,也是该工具的基础。

承诺一个真正的无版权图像并不是一件容易的事。为了确保这一标准,Getty Images的生成模型没有改编自任何现有的基础模型。相反,它是与Nvidia合作,使用Nvidia Edify从头开始构建的,这是一种用于开发视觉生成AI的多模态架构。Getty Images使用Nvidia AI Foundry训练和定制模型,这是构建自定义模型的端到端平台。这种方法使公司不仅可以控制数据管道,还可以控制模型的演变方式,从而规避预先训练的公开来源模型带来的法律和创意风险。

该公司还避免了常见的技术捷径,这些捷径可能会随着时间的推移损害质量或原创性。Getty Images不使用强化学习或对模型自己的输出进行训练。做出这一决定是为了防止一种称为模型崩溃的现象,当生成的图像逐渐变窄为重复的、同质的风格时,就会发生这种现象。

Gagliano解释说:“基本上,模型的输出开始收敛到一种非常小的像素分布。”“对我们来说,我们的模型保持更广泛的适用性非常重要,这样它就可以产生很多不同的像素和很多不同的东西。”

为了应对模式崩溃,Getty Images每季度都会注入数百万新的创意资产,这些资产都是由其全球艺术家和摄影师网络贡献的。其结果是,该系统不仅反映了从时尚到文化美学的当前视觉趋势,而且保留了通过图像讲故事所必需的多样性和新颖性。

Gagliano说:“我们有一个庞大的团队,他们与我们的摄影师和创作人合作,不断进行定量和定性研究,以发现我们的空白。”内容团队与贡献者合作解决差距,添加新的主题、风格和代表性不足的观点,支持公司的核心许可业务和生成模型的健康发展。

对新鲜度和多样性的强调有助于保持模型的相关性和扩展性,但它也指出了生成式人工智能领域的一个更深层次的挑战,Gagliano认为这个挑战尚未得到充分解决:对不断扩大的数据量的依赖。“这些模型饿了,”她说。“只需向他们提供越来越多的数据。这就是让你获得更好输出的力量,这是真的。但我认为,还有一个研究领域还没有真正得到利用,那就是,我们如何让这些模型在更少的数据下更高效地工作?”

这个问题是Getty方法的核心。因为该公司致力于授权内容和补偿创作者,所以它不能走依赖于大量、不加选择的数据集的捷径。Gagliano说,相反,重点是开发能够利用高价值、精心策划的内容做更多事情的模型架构。

她说:“在一个我们想补偿创作者的世界里,有时我们不得不用更少的数据来做到这一点。”

虽然合成数据通常被视为解决方案,但Gagliano警告说,这并不总是一个干净的解决方案。“合成数据可能很棒,”她说,“但前提是合成数据本身是在经过许可内容训练的模型上训练的。”否则,艺术家不会得到补偿,模型只是从未经许可的来源生成更多的数据。

Gagliano从双方都理解创新和艺术完整性之间的微妙平衡。在她领导Getty的人工智能工作之前,她自己是一名视觉艺术家,现在仍然是,这使她能够应对这些挑战。

她说:“我对双方都产生了同情和理解:对创新的技术驱动,对保护艺术家和创作者。我真的在努力思考如何找到一个更微妙的解决方案,一个不是一刀切的要么全有要么全无的解决方案。”

来源:科技蜜谈

相关推荐