摘要:在科技界的万众瞩目中,OpenAI终于揭开了其视频生成模型Sora的神秘面纱。这一备受期待的发布,是在北京时间12月10日凌晨的直播中宣布的,标志着Sora正式面向全球用户开放。
在科技界的万众瞩目中,OpenAI终于揭开了其视频生成模型Sora的神秘面纱。这一备受期待的发布,是在北京时间12月10日凌晨的直播中宣布的,标志着Sora正式面向全球用户开放。
自今年2月首次预告以来,Sora一直处于测试阶段,仅限于少数艺术家、知名演员和导演使用。长时间的等待无疑增加了公众的好奇心和期待值。此次发布后,全球网友的热情迅速高涨,一度导致服务器过载。
相较于之前的版本,Sora Turbo在功能和性能上都有了显著提升。它支持生成最高1080p分辨率、最长20秒的视频,这在时长上是一个明显的突破。更令人瞩目的是,Sora Turbo提供了强大的“编辑”功能,用户不仅可以通过文字、图片或视频生成内容,还能通过指令实现视频的重混、重新剪辑、循环、混合等操作,几乎相当于一个高级视频编辑器。
Sora的正式发布,也引发了国内AI视频生成领域的关注。为了对比国内外产品的差异,“深度观察”团队迅速进行了实测。测试结果显示,国内产品在某些方面并不逊色于Sora。
在视频生成时长上,Sora凭借20秒的优势领先,紧随其后的是Runway,能达到10秒。相比之下,国内的产品普遍在5-6秒左右。然而,需要注意的是,这并不意味着国内产品在性能上落后。例如,白日梦虽然单次生成时长不是最长,但它通过先生成人物、再生成分镜、最后编辑图片的方式,可以支持长达6分钟的视频生成。
在收费方面,Sora对ChatGPT的Plus会员(每月20美元)和Pro会员(每月200美元)开放使用,Plus会员每月可生成50个480P分辨率的视频,而Pro会员则享有不限次慢速生成的额度。相比之下,国内的产品大多提供免费试用,但会限制使用次数。Runway的收费则介于Sora和国内产品之间,最低月付费为15美元。
在功能对比上,“深度观察”团队选择了基础功能和进阶功能两个维度进行测试。基础功能主要测试文生视频的能力,包括产品对文字指令的理解度、运动过程中人物面部的清晰度和多人物的准确度。测试结果显示,Sora在识别主体数量上存在一定问题,但整体表现尚可接受。国内产品中,即梦在人物真实感上有明显提升,而智谱清言和FilmAction则在画风和指令理解上各有千秋。
进阶功能则主要测试Sora发布的新功能。在Remix(重混)功能的测试中,Sora将生成视频中的兔子替换成小狗时,出现了胡萝卜或小狗起飞的状况,说明实际操作并不如样片中那般丝滑。然而,也有业内人士指出,这可能与提示词、场景和风格的选择有关。
尽管Sora的发布引发了广泛关注,但国内从业者对其整体评价并未过分恐慌。生数科技投融资负责人樊家睿表示,相比今年2月发布的demo,Sora在模型效果的真实感上并没有显著变化。同时,多位网友实测反馈显示,Sora在长时间处理复杂动作时还存在一定困难,模拟物理世界时可能会犯错。
不过,Sora的一些新功能还是得到了业界的认可。瀚皓科技CEO吴杰茜指出,Storyboard(故事板)和Style presets(风格预设)功能在FilmAction中已经实现,而Blend(混合)功能则最先在国外的AI生成视频工具Luma中亮相。尽管这些功能在国内产品中已有类似实现,但Sora的实现方式被认为更为高明。
AI行业资深研究者江树认为,Sora此次发布的一些功能属于独家,国内产品基本没有。他特别提到Sora在处理细节连贯性上的优势,如直播演示中机器人在沙漠中漫步的画面,从远景到特写转换十分自然。Sora的空间感也不错,摄像机绕物体360度旋转时,每个角度下的细节都非常准确。
产品体验方面,Sora也获得了好评。江树表示,Sora此次发布的是一个从视频生成到制作成品的端到端完整产品,提供了提升视频创作体验的功能。樊家睿则认为,Sora新功能的实现路径非常明确,对于国内从业者而言,主要是时间问题。
来源:ITBear科技资讯