新Sora发布！生成视频最长20秒，AI视频赛道拥挤加剧

摘要：在首次公开展示过去近10个月后，当地时间12月9日，OpenAI终于宣布正式向用户开放AI视频生成模型Sora，并发布新的高端加速版本Sora Turbo。南都记者从发布会上了解到，Sora分辨率最高支持1080p，生成视频最长20秒，有三种常见画面比例供用户

在首次公开展示过去近10个月后，当地时间12月9日，OpenAI终于宣布正式向用户开放AI视频生成模型Sora，并发布新的高端加速版本Sora Turbo。南都记者从发布会上了解到，Sora分辨率最高支持1080p，生成视频最长20秒，有三种常见画面比例供用户选择。在文图生成视频的基础功能之外，此次Sora全面升级交互页面，新增storyboard等功能，进一步提高用户体验和视频质量。

今年2月，OpenAI首次推出文生视频大模型Sora，迅速引发AI圈的关注。Sora展示的全新影像画面精细生动，远胜于此前生成式AI所生产的动画内容。不过初次展示后，Sora一直未对公众开放，仅面向部分人开启小范围测试。

12月9日，OpenAI CEO山姆·奥特曼（Sam Altman）以及Sora团队的数名负责人进行了一场近20分钟的直播。Sora的神秘面纱终于被揭开。

OpenAI发布会

据直播介绍，Sora分辨率最高支持1080p，生成的视频长度为5至20秒，用户可选择横向（16:9）、正方形（1:1）、竖向（9:16）三种常见画面比例。

在直播的演示环节，相关负责人介绍了Sora的新亮点。一方面，用户不仅能更轻松地通过文本提示生成视频，还能基于图片和已有视频生成新内容，比如延续一段视频的后续画面等。

另一方面，Sora新上线了最重要的创意工具之一——storyboard（故事板）。该功能相当于以时间轴的形式，将一段视频“切”成多段，用户可以为每个“切口”提供更详细的场景描述或图片参考，Sora根据这些提示生成整段视频，以此达到用户精确控制生成视频内容和风格走向的目的。

此外，Sora还支持用户对生成视频进行重新切割（Re-cut），保留其中满意的部分，延展、混合、重新生成其它部分。在高级编辑功能中，Remix（重混）支持用户对生成视频进行改编，可通过1-8级强度调节控制改编程度，Loop（循环）、Blend（混合）功能可实现场景循环、场景融合，Style presets（风格预设）可预设生成视频的总体风格。

在定价方面，Sora主要提供两种方案。月收费20美元的ChatGPT Plus用户可免费使用Sora，每月最多生成50个720p视频，时长为5秒。每月支付200美元的ChatGPT Pro用户最多可生成500个高级视频，不限次数享受“慢速”生成视频的权限，分辨率高达1080p，持续时间为20秒，并且下载的视频无水印。

Sora收费方案

值得一提的是，生成视频的清晰程度会影响配额的消耗，用户每次生成的视频分辨率越高，被消耗的配额越多。OpenAI方面表示，目前正针对不同类型的用户定制更多元的价格方案，计划在明年年初推出。

OpenAI官网显示，Sora目前支持155个国家及地区的用户使用，但不包括英国、大部分欧洲，以及中国大陆等。

发布会结束后不久，大量用户争相涌入Sora尝试新工具，导致服务器多次崩溃。奥特曼发文提醒用户，由于需求超出预期，Sora注册通道已被暂时关闭，视频生成速度将在一段时间内变慢。

南都记者注意到，Sora功能让人眼前一亮的同时，有些硬伤也无法完全忽视。在发布会的演示过程中，可以看到一些不符合物理逻辑的技术“翻车”痕迹。

比如，在展示storyboard功能时，负责人要求Sora生成一只鹤从水里抓出鱼的视频。可以看到鹤头在进入水中时，迸溅的水花非常夸张，与真实情况不符，显得画面有些不自然；还有部分画面中，鹤喙还未碰到水面，水花就已经扬起，违背了物理规律。

发布会上的演示画面

Sora团队负责人阿迪亚·拉梅什（AdityaRamesh）在直播中表示，启动Sora项目是为了构建真正深入了解世界及其物理规律的AI系统，目前的Sora并不完美，会犯错误，但它已经达到了非常有利于增强人类创造力的阶段，“我们迫不及待想知道世界会开始用Sora创造什么。”

Sora从初次展示到正式发布，历经十个月。这段时间里，国内外科技企业纷纷涌入视频大模型赛道，并且取得了重大进展。

在国外，Runway、Luma AI等专攻视频赛道的企业推出了先进的AI视频模型，Pika、HeyGen曾声称产品可以超越Sora。就在OpenAI发布会前几日，亚马逊云科技发布了Nova Reel文生视频大模型，谷歌面向企业开放生成式AI视频模型Veo。国外这一赛道可谓挤满了新老选手，竞争激烈。

国内也有着相似情形，据不完全统计，目前已发布或已在内测的国内视频生成产品已超过10个。快手可灵、字节即梦、Minimax旗下海螺AI、阿里巴巴通义万相等都是该领域的代表产品，阿里云、生数科技、智谱AI等今年也发布了视频生成模型，腾讯混元近日宣布上线视频生成能力。

随着Sora Turbo的正式加入，可以预见AI视频生成这一新兴市场的角逐将更为激烈。在其商业化形势仍不明朗的情况下，谁能在新时代引领全球视频生成大模型行业，也许很快就能有答案。

采写：南都记者樊文扬

来源：南方都市报一点号

标签：视频 sora 文生

本文地址：https://news.43u.com.cn/a/171957.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!

相关推荐