摘要:美东时间12月9日周一,OpenAI在社交媒体宣布给大家带来一份节日礼物Sora,称它可以根据文本生成全新的视频,让图像栩栩如生,也可以用它扩展、重新混合编辑视频或融合已有的视频。
美东时间12月9日周一,OpenAI在社交媒体宣布给大家带来一份节日礼物Sora,称它可以根据文本生成全新的视频,让图像栩栩如生,也可以用它扩展、重新混合编辑视频或融合已有的视频。
OpenAI称,自2月发布预览Sora以来,一直在构建Sora Turbo——一个速度明显更快的模型版本,本周一,将它作为独立的产品面向ChatGPT Plus 和ChatGPT Pro的用户推出。
当地时间12月9日,OpenAI CEO山姆·奥特曼(Sam Altman)与Sora团队负责人比尔·皮布尔斯(Bill Peebles)、阿迪亚·拉梅什(Aditya Ramesh)进行了约20分钟的直播。
有所不同的是,此次发布的是Sora Turbo版本。OpenAI表示,从今年2月Sora发布后,就开始开发Sora Turbo,将会比上一个版本要快很多。
据直播介绍,Sora可以生成1080p、最长20秒的视频,支持横屏(16:9)、正方形(1:1)和竖屏(9:16)多种常见比例,并且可以对生成的视频进行Remix(重混):替换、删除或重构视频中的元素,Re-cut(重新切割):找到最佳的一帧再进行延展,循环剪辑,混合:将两个视频进行无缝合并剪辑,故事板剪辑:精准指定每个帧的输入,风格预设:预设创建视频的风格等操作。
Sora的视频Remix(00:05)
Sora的视频Re-cut(00:15)
根据官方介绍,Sora还支持探索社区功能,用户生成的视频可以分享至社区,也可以在社区看到、搜索或再创作其他用户分享的视频(用户也可以选择关闭这一功能)。
奥特曼在直播中表示,对于OpenAI而言,Sora不仅仅是一项技术,更是一种赋能创意人士的工具。在OpenAI的文化基因中,用AI激发人类创造力也很重要。通过Sora,OpenAI看到了AI和人类共同创造的全新协作模式。文本曾是人机交互主要形式,但他们坚信这远远不够,视频能够传递更多的情感和细节。同时,Sora对于OpenAI而言,不仅仅是一个视频生成工具,更是AGI(通用人工智能)之路的重要里程碑。
OpenAI表示,Sora不仅能理解用户提示词的要求内容,还能了解这些内容在物理世界中的存在方式。
奥特曼也在X(推特)发文表示,最令他兴奋的一点是与其他人共同创作的便捷性,感觉就像是一个有趣的新事物。大家可以将Sora看作视频版的GPT-1。
根据网友实测反馈,对物理规律的理解并不够好,仍会出现人的手部不自然、文字乱码、动物跑着跑着就飞起来等情况。
据介绍,Sora将于当天晚些时候向美国及其他市场的ChatGPT付费用户开放Sora Turbo版本,这是一个生成速度更快的版本。
OpenAI官网显示,Sora目前支持155个国家及地区的用户使用,但不包括英国、大部分欧洲,以及中国大陆等原先就无法使用ChatGPT的地方。
月收费20美元的ChatGPTPlus用户可直接使用Sora,但每月最多生成50个480p视频或更少的720p视频,时长为5秒。新推出的ChatGPT Pro付费套餐支持更多的视频生成数量和更高的分辨率,时长达20秒。这一新套餐的定价高达200美元/月,还包含对o1等OpenAI所有模型的无限制访问权。OpenAI表示,正在为不同类型的用户制定定制的价格,计划将于明年初推出。
因热度过高,Sora网页一度崩溃。OpenAI CEO Sam Altman在社交平台X上表示,“需求超出预期。由于扩展中,注册会时不时关闭,生成速度也会变慢。我们会尽最大努力!”
来源:齐鲁壹点