摘要:在首次公开展示过去近10个月后,当地时间12月9日,OpenAI终于宣布正式向用户开放AI视频生成模型Sora,并发布新的高端加速版本Sora Turbo。南都记者从发布会上了解到,Sora分辨率最高支持1080p,生成视频最长20秒,有三种常见画面比例供用户
在首次公开展示过去近10个月后,当地时间12月9日,OpenAI终于宣布正式向用户开放AI视频生成模型Sora,并发布新的高端加速版本Sora Turbo。南都记者从发布会上了解到,Sora分辨率最高支持1080p,生成视频最长20秒,有三种常见画面比例供用户选择。在文图生成视频的基础功能之外,此次Sora全面升级交互页面,新增storyboard等功能,进一步提高用户体验和视频质量。
今年2月,OpenAI首次推出文生视频大模型Sora,迅速引发AI圈的关注。Sora展示的全新影像画面精细生动,远胜于此前生成式AI所生产的动画内容。不过初次展示后,Sora一直未对公众开放,仅面向部分人开启小范围测试。
12月9日,OpenAI CEO山姆·奥特曼(Sam Altman)以及Sora团队的数名负责人进行了一场近20分钟的直播。Sora的神秘面纱终于被揭开。
OpenAI发布会
据直播介绍,Sora分辨率最高支持1080p,生成的视频长度为5至20秒,用户可选择横向(16:9)、正方形(1:1)、竖向(9:16)三种常见画面比例。
在直播的演示环节,相关负责人介绍了Sora的新亮点。一方面,用户不仅能更轻松地通过文本提示生成视频,还能基于图片和已有视频生成新内容,比如延续一段视频的后续画面等。
另一方面,Sora新上线了最重要的创意工具之一——storyboard(故事板)。该功能相当于以时间轴的形式,将一段视频“切”成多段,用户可以为每个“切口”提供更详细的场景描述或图片参考,Sora根据这些提示生成整段视频,以此达到用户精确控制生成视频内容和风格走向的目的。
此外,Sora还支持用户对生成视频进行重新切割(Re-cut),保留其中满意的部分,延展、混合、重新生成其它部分。在高级编辑功能中,Remix(重混)支持用户对生成视频进行改编,可通过1-8级强度调节控制改编程度,Loop(循环)、Blend(混合)功能可实现场景循环、场景融合,Style presets(风格预设)可预设生成视频的总体风格。
在定价方面,Sora主要提供两种方案。月收费20美元的ChatGPT Plus用户可免费使用Sora,每月最多生成50个720p视频,时长为5秒。每月支付200美元的ChatGPT Pro用户最多可生成500个高级视频,不限次数享受“慢速”生成视频的权限,分辨率高达1080p,持续时间为20秒,并且下载的视频无水印。
Sora收费方案
值得一提的是,生成视频的清晰程度会影响配额的消耗,用户每次生成的视频分辨率越高,被消耗的配额越多。OpenAI方面表示,目前正针对不同类型的用户定制更多元的价格方案,计划在明年年初推出。
OpenAI官网显示,Sora目前支持155个国家及地区的用户使用,但不包括英国、大部分欧洲,以及中国大陆等。
发布会结束后不久,大量用户争相涌入Sora尝试新工具,导致服务器多次崩溃。奥特曼发文提醒用户,由于需求超出预期,Sora注册通道已被暂时关闭,视频生成速度将在一段时间内变慢。
南都记者注意到,Sora功能让人眼前一亮的同时,有些硬伤也无法完全忽视。在发布会的演示过程中,可以看到一些不符合物理逻辑的技术“翻车”痕迹。
比如,在展示storyboard功能时,负责人要求Sora生成一只鹤从水里抓出鱼的视频。可以看到鹤头在进入水中时,迸溅的水花非常夸张,与真实情况不符,显得画面有些不自然;还有部分画面中,鹤喙还未碰到水面,水花就已经扬起,违背了物理规律。
发布会上的演示画面
Sora团队负责人阿迪亚·拉梅什(AdityaRamesh)在直播中表示,启动Sora项目是为了构建真正深入了解世界及其物理规律的AI系统,目前的Sora并不完美,会犯错误,但它已经达到了非常有利于增强人类创造力的阶段,“我们迫不及待想知道世界会开始用Sora创造什么。”
Sora从初次展示到正式发布,历经十个月。这段时间里,国内外科技企业纷纷涌入视频大模型赛道,并且取得了重大进展。
在国外,Runway、Luma AI等专攻视频赛道的企业推出了先进的AI视频模型,Pika、HeyGen曾声称产品可以超越Sora。就在OpenAI发布会前几日,亚马逊云科技发布了Nova Reel文生视频大模型,谷歌面向企业开放生成式AI视频模型Veo。国外这一赛道可谓挤满了新老选手,竞争激烈。
国内也有着相似情形,据不完全统计,目前已发布或已在内测的国内视频生成产品已超过10个。快手可灵、字节即梦、Minimax旗下海螺AI、阿里巴巴通义万相等都是该领域的代表产品,阿里云、生数科技、智谱AI等今年也发布了视频生成模型,腾讯混元近日宣布上线视频生成能力。
随着Sora Turbo的正式加入,可以预见AI视频生成这一新兴市场的角逐将更为激烈。在其商业化形势仍不明朗的情况下,谁能在新时代引领全球视频生成大模型行业,也许很快就能有答案。
采写:南都记者 樊文扬
来源:南方都市报一点号