国产视频大模型，哪家强？

摘要：当前，DeepSeek等大模型引发的人工智能浪潮日渐升温，大模型落地应用的门槛和成本持续降低。视频大模型作为一种能够处理和生成视频内容的大规模深度学习模型，具有在处理复杂视觉信息方面的独特优势，展现出巨大的发展潜力，逐渐在影视制作、在线教育、智能客服等领域得到

当前，DeepSeek等大模型引发的人工智能浪潮日渐升温，大模型落地应用的门槛和成本持续降低。视频大模型作为一种能够处理和生成视频内容的大规模深度学习模型，具有在处理复杂视觉信息方面的独特优势，展现出巨大的发展潜力，逐渐在影视制作、在线教育、智能客服等领域得到应用。

《政府工作报告》首次提出支持大模型广泛应用，《政府工作报告》起草组成员、国务院研究室副主任陈昌盛在国务院新闻办公室举行吹风会答记者问时也提到，可灵AI从某种程度上在国际上的评价已经超过了Sora，更是为国产视频大模型行业加速发展释放积极信号，我国国产视频大模型发展前景广阔、未来可期。

AI大模型制作的图像

一、全球视频大模型进入发展快车道

视频大模型可以接受多种模态的信息作为输入，例如文本、语音、图像和视频等，并执行包括视频生成、编辑、理解和分析等多种任务，被认为是大模型领域极具挑战性的前沿方向。

与语言大模型相比，视频大模型所需要的技术更加复杂，例如：需要更强大的计算能力和更复杂的模型架构，能够处理海量且高维度的视频数据，解决数据的时序一致性、空间理解、运动物理规律模拟、真实世界因果关系等问题；需要突破跨模态理解和生成等关键技术难点，有效融合不同模态的信息，确保生成高质量、连贯的视频内容。

当前，全球科技巨头凭借强大的技术实力和丰富的资源储备，在视频大模型领域展开了激烈角逐。

国外方面，OpenAI率先发布文生视频模型Sora，开启了AI视频生成的“ChatGPT时刻”；谷歌发布Veo2，在理解电影摄影语言和分辨率等方面表现突出。其他公司如Stability AI、Luma、Runway、Haiper等也相继发布了各自的视频大模型产品。

国内方面，视频领域佼佼者以及人工智能企业纷纷立足自身优势推出系列产品，如快手率先上线可公开体验的视频大模型可灵AI，开启视频大模型的视频产业化探索，随后生数科技的Vidu、字节跳动的即梦AI、MiniMax的海螺AI、智谱的清影、通义的万相等纷纷上线。

二、国产视频大模型价值逐步释放、潜力巨大

近一年来，国产视频大模型在技术突破和商业拓展方面取得了显著进展。

从技术能力看，视频大模型在生成视频时长、分辨率、画面比例以及镜头运动方面性能不断提升。

视频时长方面，单次生成已经从最初的2-4秒，普遍延长至6-10秒，甚至数十秒，另有产品支持视频续写功能，如可灵AI支持最长3分钟的视频续写。

分辨率方面，生成视频已达到1080P甚至4K水平。此外，镜头控制、比例切换等技术能力也不断提升。如可灵AI在时间维度的一致性上表现优秀，且视频中生成的运动平滑度高、对物理定律的遵循较好。

数据显示，截至2024年12月，可灵AI已有超600万用户，累计生成超6500万个视频。

从价值变现看，会员制等商业化模式探索不断加快。当前视频大模型的收费模式包括会员制、按需收费、定制收费、API调用次数收费等多种收费模式，其中会员制模式较为普遍，即将视频大模型按照性能不同分为不同等级，提供单月、年度会员等多种收费模式，如Vidu、可灵AI、PixVerse等均采用这种模式，1秒收费在0.05-0.9元之间。

目前，可灵AI商业化探索较为成功，数据显示，可灵AI单月流水超千万，已与伊利、vivo、联想、周大福、玛氏箭牌、青岛啤酒等多个企业进行多样化商业探索。

未来，随着技术加速迭代以及算力成本不断下降，视频大模型技术应用的门槛和成本将实现“双降”，进而催化国产视频大模型加快规模化使用。

据东方证券报告指出，未来内容生态将在现有量级基础上进一步实现指数级提升，形成下一代内容生态，国产视频大模型的价值有望进一步释放。

三、视频大模型应用正引发一场视觉革命

推动视频领域生产方式智能化，大幅提升内容生产效率和质量。通过应用大模型技术深入挖掘视听领域丰富数据，打造的视频大模型将化身有着丰富知识和资深经验的“行家里手”，推动从剧本创作到特效制作等工作由高度依赖从业人员经验转向由AI承担，大幅缩短了内容生产时间，提高了内容质量。

如多家电视台推出AI生成短片和短剧，通过分析观众偏好，实现了较高的观众粘性和满意度。数据显示，河南大象融媒通过应用AIGC技术，推动短视频制作周期由一天缩短至数小时。

据东吴证券数据显示，在人机协作模式下，AI可以降低43%的影视制作成本，在全部应用视频大模型等人工智能技术情况下成本可降低95%。

培育视频新模式新业态，大幅提升内容体验感和竞争力。

通过应用视频大模型，创意视频、AI导演、虚拟主播等创新产品，并为用户带来新奇的观看体验。如湖南广电推出AI导演爱芒，参与湖南卫视《我们仨》综艺节目录制，以助理导演的身份与嘉宾共同探索潮流生活新方式。

可灵AI推出国内首部AIGC短剧《山海奇镜之劈波斩浪》；与青年导演团队“异类Outliers”上线全球首部AI单元剧集《新世界加载中》先导片，推动AI短剧制作进入2.0时代；联合李少红等9位知名导演打造的9部AIGC电影短片被中国电影博物馆永久收藏、放映展示，电影工业开启人工智能序幕。

四、视频大模型未来的发展机遇与挑战

未来视频大模型跨领域应用拓展前景可期。

一是视频大模型技术以其强大的内容生成能力开启内容创新“万花筒”，为视听行业提供了全新的内容创作和呈现方式，孕育了丰富的应用场景和广阔的创新空间。

二是实现“千人千面”的智能内容和产品推荐、制作或成为可能。通过视频大模型技术进步以及智能体等前沿技术的应用，精准挖掘用户对内容题材、时长等的偏好，实现内容产品的量身推荐，通过智能生成等方式为用户定制个性化内容，提高消费者满意度和粘性。

三是推动视听领域与其他行业跨界融合拓展增长新空间。利用视频大模型技术，促进视听领域与文旅、教育、公益、健康等领域深度融合，形成跨界融合、良性互促的生态系统，激发各领域广泛形成新商业模式、新产业形态和新增长空间。

视频大模型发展仍面临诸多挑战。技术的发展是一柄双刃剑，视频大模型进步在带来产业发展、经济增长和社会进步的同时，但也会产生一些如虚假信息传播、深度伪造、内容侵权等潜在风险。需平衡好发展与安全的关系，既不能因技术进步伴生的潜在风险而“因噎废食”，也不能对出现的问题置之不理，应通过技术创新、机制完善等手段让技术更好地服务于人。

来源：中国经济周刊一点号

标签：视频模型模态短剧 sora

本文地址：https://news.43u.com.cn/a/1031175.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!