视频生成大模型两极分化：向左刷榜“跑分”，向右刷屏“跑量”

摘要：在举办的2025 Google I/O开发者大会上，谷歌带来视频生成类大模型领域的又一重磅产品Veo 3。距离上一代Veo 2发布，才过去半年左右，Veo 3的更新非常炸裂，不仅成功实现了视频与音频的原生集成，包括音乐、背景音效，甚至是角色之间的对话也能自然生

文 | 智能相对论

作者 | 陈泊丞

果然，一如当年Sora的发布一般炸裂，在AI视频生成上还得看国外厂商秀操作？！

在举办的2025 Google I/O开发者大会上，谷歌带来视频生成类大模型领域的又一重磅产品Veo 3。距离上一代Veo 2发布，才过去半年左右，Veo 3的更新非常炸裂，不仅成功实现了视频与音频的原生集成，包括音乐、背景音效，甚至是角色之间的对话也能自然生成，并根据画面同步口型。

视频生成类大模型全面开启“有声时代”。在Veo 3更强的物理规律理解与模拟下，当前AI视频生成的真实感与沉浸感又上升了一个层级。

在这样的效果面前，国产的视频生成类大模型还有超越的可能吗？先不说结果，只讨论过去Veo 2发布后半年的行业历程，在全球权威评测榜单VBench Leaderboard、Artificial Analysis上，这一领域的竞争格局并非一成不变，国内厂商如快手的可灵1.6pro、可灵2.0、阿里的通义万相、生数科技的Vidu Q1等都曾陆续登顶榜首。

视频作为当今内容消费的主要载体，在诸多领域都是拥有极高的流量和热度。哪怕是在AI大模型领域，关于视频生成类大模型赛道的竞争似乎也比其他细分领域要激烈些，厂商之间的“互殴”尤为精彩。

国产模型“暴打”海外模型？视频生成类大模型的“螺旋式”互殴

前不久，全球权威评测榜单Artificial Analysis发布最新的全球视频生成大模型榜单，继快手的可灵1.6pro登顶榜首之后，可灵2.0再次以1124分的Arena ELO基准测试评分位居图生视频（Image to Video）赛道榜首，力压一众国内外主流视频生成类模型。

可灵2.0是可灵AI在4月份发布的最新产品，自去年可灵AI上线以来，期间就历经20多次的迭代。在这样的高频迭代之下，可灵AI迅速跻身全球视频生成类大模型领域的第一梯队，表现出强大的性能。

据可灵AI内部的多项胜负率测评，可灵2.0对比谷歌Veo 2的胜负比高达205%，而与OpenAI 的Sora相比，胜负比更是来到了367%，差距显著。简单来说，在谷歌未发布Veo 3的情况下，国产模型保持着大幅领先优势。

实际上，在视频生成类模型领域，快手可灵多次以综合实力Top1的成绩登顶权威测评榜单。这种国产势力的崛起在这一领域并不“孤独”，我们在分项榜单中依旧可以看到其他国产势力的影子。

例如，生数科技的Vidu Q1在国内外权威测评榜单VBench Leaderboard和SuperCLUE上也曾登顶文生视频和图生视频的分项榜首，超越Runway、Sora等一众国外模型，展现出国内模型强大且稳定的性能表现。

更早之前，在今年1月，VBench Leaderboar榜单上的Top 1则是来自阿里的通义万相2.1。相比当前的视频生成模型，通义万相2.1在复杂运动处理、现实物理还原、文字语义理解等方面都取得了相当不错的成绩，逐渐摆脱了AI感，趋于真实性。

总的来说，自OpenAI发布Sora，点燃视频生成领域以来，这一细分赛道的竞争就尤为激烈，国产模型的崛起在各种榜单上也在全面与国外模型掰手腕，今天我登顶榜首，明天你把我挤下去，形成“螺旋式”互殴的局面。

同时，也正是在这种情势下，AI视频生成取得了相当大的进步，从一开始的“鬼畜”画面到如今的音频、画面、人物、动作、背景等多重因素的高度协同集成与一致性保障，AI视频越来越真实且具有沉浸感。

视频生成类大模型的关键战役：流量为王，谁能加冕？

比起在各大权威测评榜单“跑分”，反复超越同行来取得行业话语权，视频生成类模型还有一场更关键的战役：基于当前网络用户对视频内容的消费热情，迅速在社交媒体平台完成创作“破圈”，以完成产品推广、用户教育以及商业探索等。

与Sora刚发布并不对外开放使用不同，谷歌在发布Veo 3当天即刻上线Flow平台，面向市场开放使用。这不仅有技术成熟度提升的原因，更重要的是——当前，厂商们深知，视频生成类大模型需要借助广大市场用户的创作、玩梗来造势、吸引流量，从而提升产品知名度，更快地抢占市场。

简单来说，视频生成类大模型要“跑分”，更要“跑量”。越来越多的市场数据表明，以AI视频为主导的内容消费正在加速形成，或将改善当前视频生成类大模型的商业困境。

如今，抖音AI特效相关话题播放量超36亿次，快手的AIGC广告收入规模提升12倍，单日消耗峰值突破2000万元。首部付费AI短剧《兴安岭诡事》已经在市场掀起热潮，以AI+萌娃、AI+宠物等为主题的视频创作大肆吸引用户注意和平台流量，广告植入和带货能力迅速膨胀。据业内人士称，该领域的单条广告报价已经来到了2000-8000元，吸金能力还在上升。

这不仅是视频生成类大模型的商业化探索，也是视频内容创作产业链的一场变革和升级。据快手2024年三季报披露，可灵AI单月流水已超千万元，并与伊利、vivo、联想等头部品牌达成深度合作。

这场围绕用户与市场注意力所展开的商业化竞争注定是一场“流量为王”的游戏。目前，抖音旗下的即梦AI正在复刻豆包的路径，稳居苹果App store的榜单前十，最高光时刻甚至一度登顶榜首。同时，根据QuestMobile的数据，从2024年12月底到2025年2月中旬，即梦的周活跃用户数由约76万增加到了近200万，实现了接近三倍的增长。比起其他大模型的“跑分”，即梦AI的“跑量”策略已经在市场上初见成效。

只看市场反馈，国内视频生成类大模型的商业化路径似乎比国外厂商走的更宽走快。这是为什么？

谷歌的Veo 3需要用户开通Ultra会员体系才能用，价格为125美元，相当于人民币902.52元。同时，Ultra会员也并非无限使用，需要消耗一定的AI点数，每月付费也仅仅能出85条视频左右。

尝试过AI视频生成的都知道，当前的大模型基本上很难一条“出片”，国外厂商的定价策略以及会员体系从根本上就限制了用户大规模出片的能力。

相反，国内厂商采用免费版与会员制结合的策略，不仅每天送积分，吸引普通用户尝鲜，且会员体系的定价平均低于国外厂商，量大管饱，更能推动用户大量出片，结合抖音、快手打通内容体系，实现高效刷屏，引发内容消费与高频互动。