Sora亮相！国内AI视频生成工具能否迎头赶上？

摘要：在科技界的万众瞩目中，OpenAI终于揭开了其视频生成模型Sora的神秘面纱。这一备受期待的发布，是在北京时间12月10日凌晨的直播中宣布的，标志着Sora正式面向全球用户开放。

在科技界的万众瞩目中，OpenAI终于揭开了其视频生成模型Sora的神秘面纱。这一备受期待的发布，是在北京时间12月10日凌晨的直播中宣布的，标志着Sora正式面向全球用户开放。

自今年2月首次预告以来，Sora一直处于测试阶段，仅限于少数艺术家、知名演员和导演使用。长时间的等待无疑增加了公众的好奇心和期待值。此次发布后，全球网友的热情迅速高涨，一度导致服务器过载。

相较于之前的版本，Sora Turbo在功能和性能上都有了显著提升。它支持生成最高1080p分辨率、最长20秒的视频，这在时长上是一个明显的突破。更令人瞩目的是，Sora Turbo提供了强大的“编辑”功能，用户不仅可以通过文字、图片或视频生成内容，还能通过指令实现视频的重混、重新剪辑、循环、混合等操作，几乎相当于一个高级视频编辑器。

Sora的正式发布，也引发了国内AI视频生成领域的关注。为了对比国内外产品的差异，“深度观察”团队迅速进行了实测。测试结果显示，国内产品在某些方面并不逊色于Sora。

在视频生成时长上，Sora凭借20秒的优势领先，紧随其后的是Runway，能达到10秒。相比之下，国内的产品普遍在5-6秒左右。然而，需要注意的是，这并不意味着国内产品在性能上落后。例如，白日梦虽然单次生成时长不是最长，但它通过先生成人物、再生成分镜、最后编辑图片的方式，可以支持长达6分钟的视频生成。

在收费方面，Sora对ChatGPT的Plus会员（每月20美元）和Pro会员（每月200美元）开放使用，Plus会员每月可生成50个480P分辨率的视频，而Pro会员则享有不限次慢速生成的额度。相比之下，国内的产品大多提供免费试用，但会限制使用次数。Runway的收费则介于Sora和国内产品之间，最低月付费为15美元。

在功能对比上，“深度观察”团队选择了基础功能和进阶功能两个维度进行测试。基础功能主要测试文生视频的能力，包括产品对文字指令的理解度、运动过程中人物面部的清晰度和多人物的准确度。测试结果显示，Sora在识别主体数量上存在一定问题，但整体表现尚可接受。国内产品中，即梦在人物真实感上有明显提升，而智谱清言和FilmAction则在画风和指令理解上各有千秋。

进阶功能则主要测试Sora发布的新功能。在Remix（重混）功能的测试中，Sora将生成视频中的兔子替换成小狗时，出现了胡萝卜或小狗起飞的状况，说明实际操作并不如样片中那般丝滑。然而，也有业内人士指出，这可能与提示词、场景和风格的选择有关。

尽管Sora的发布引发了广泛关注，但国内从业者对其整体评价并未过分恐慌。生数科技投融资负责人樊家睿表示，相比今年2月发布的demo，Sora在模型效果的真实感上并没有显著变化。同时，多位网友实测反馈显示，Sora在长时间处理复杂动作时还存在一定困难，模拟物理世界时可能会犯错。

不过，Sora的一些新功能还是得到了业界的认可。瀚皓科技CEO吴杰茜指出，Storyboard（故事板）和Style presets（风格预设）功能在FilmAction中已经实现，而Blend（混合）功能则最先在国外的AI生成视频工具Luma中亮相。尽管这些功能在国内产品中已有类似实现，但Sora的实现方式被认为更为高明。

AI行业资深研究者江树认为，Sora此次发布的一些功能属于独家，国内产品基本没有。他特别提到Sora在处理细节连贯性上的优势，如直播演示中机器人在沙漠中漫步的画面，从远景到特写转换十分自然。Sora的空间感也不错，摄像机绕物体360度旋转时，每个角度下的细节都非常准确。

产品体验方面，Sora也获得了好评。江树表示，Sora此次发布的是一个从视频生成到制作成品的端到端完整产品，提供了提升视频创作体验的功能。樊家睿则认为，Sora新功能的实现路径非常明确，对于国内从业者而言，主要是时间问题。