谷歌向部分私人用户开放 Veo 和 Imagen 3 生成式 AI 模型

摘要：12月5日，从今天开始，谷歌 Vertex AI Google Cloud 套件的客户可以开始使用Veo从文本提示和图像生成视频。然后，从下周开始，谷歌将向这些用户提供其最新的文本转图像框架 Imagen 3。

12月5日，从今天开始，谷歌 Vertex AI Google Cloud 套件的客户可以开始使用Veo从文本提示和图像生成视频。然后，从下周开始，谷歌将向这些用户提供其最新的文本转图像框架 Imagen 3。

Veo 是谷歌推出的全新 AI 视频生成模型，也是全球首个由超大规模云提供商推出的图像转视频模型。通过文本提示或图像输入，Veo 能够生成“连贯且一致”的视频内容，支持 1080p 分辨率并且可持续播放一分钟以上。用户可以直接通过上传的图片（无论是 AI 生成还是人工拍摄）作为起点，创造动态视觉内容。

谷歌展示的示例视频强调了 Veo 的创造力和技术潜力，但也揭示了一些限制。例如，在烤棉花糖的视频中，棉花糖未能正确模拟受热变化；在音乐会场景中，手部细节存在伪影。与 Veo 相辅相成，Imagen 3 是谷歌的最新文本转图像框架，具备更先进的细节表现、光影处理和伪影减少能力。谷歌声称，Imagen 3 在图像质量方面超越了前代版本。然而，测试样本显示，该模型在某些情况下仍需进一步改进。例如，针对“闪光摄影”的提示生成的图像，拍摄对象未能完美契合提示意图。

谷歌希望通过这两款 AI 模型，加速生成式 AI 在企业客户中的应用。谷歌引用其研究数据称，采用生成式 AI 的公司中有 86% 实现了收入增长，进一步表明生成式 AI 的潜在商业价值。然而，一项由 Appen 进行的调查也指出，人工智能项目的投资回报率在 2023 至 2024 年间下降了 4.6 个百分点，说明这一领域仍面临成本效益挑战。

来源：TMT科技

标签：谷歌 veo imagen

本文地址：https://news.43u.com.cn/a/123085.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!