谷歌向部分私人用户开放 Veo 和 Imagen 3 生成式 AI 模型

摘要:12月5日,从今天开始,谷歌 Vertex AI Google Cloud 套件的客户可以开始使用Veo从文本提示和图像生成视频。然后,从下周开始,谷歌将向这些用户提供其最新的文本转图像框架 Imagen 3。

12月5日,从今天开始,谷歌 Vertex AI Google Cloud 套件的客户可以开始使用Veo从文本提示和图像生成视频。然后,从下周开始,谷歌将向这些用户提供其最新的文本转图像框架 Imagen 3。

Veo 是谷歌推出的全新 AI 视频生成模型,也是全球首个由超大规模云提供商推出的图像转视频模型。通过文本提示或图像输入,Veo 能够生成“连贯且一致”的视频内容,支持 1080p 分辨率并且可持续播放 一分钟以上。用户可以直接通过上传的图片(无论是 AI 生成还是人工拍摄)作为起点,创造动态视觉内容。

谷歌展示的示例视频强调了 Veo 的创造力和技术潜力,但也揭示了一些限制。例如,在烤棉花糖的视频中,棉花糖未能正确模拟受热变化;在音乐会场景中,手部细节存在伪影。与 Veo 相辅相成,Imagen 3 是谷歌的最新文本转图像框架,具备更先进的细节表现、光影处理和伪影减少能力。谷歌声称,Imagen 3 在图像质量方面超越了前代版本。然而,测试样本显示,该模型在某些情况下仍需进一步改进。例如,针对“闪光摄影”的提示生成的图像,拍摄对象未能完美契合提示意图。

谷歌希望通过这两款 AI 模型,加速生成式 AI 在企业客户中的应用。谷歌引用其研究数据称,采用生成式 AI 的公司中有 86% 实现了收入增长,进一步表明生成式 AI 的潜在商业价值。然而,一项由 Appen 进行的调查也指出,人工智能项目的投资回报率在 2023 至 2024 年间下降了 4.6 个百分点,说明这一领域仍面临成本效益挑战。

来源:TMT科技

相关推荐