AI视频边生成边播放！首帧延迟仅1.3秒，生成速度9.4帧/秒

摘要：CausVid团队投稿量子位 | 公众号 QbitAIAI生成视频，边生成边实时播放，再不用等了！Adobe与MIT联手推出自回归实时视频生成技术——CausVid。思路就像从下载整部电影到直接观看流媒体的转变，在模型生成首帧画面后，视频便可以即时播放，后续

CausVid团队投稿量子位 | 公众号 QbitAIAI生成视频，边生成边实时播放，再不用等了！Adobe与MIT联手推出自回归实时视频生成技术——CausVid。思路就像从下载整部电影到直接观看流媒体的转变，在模型生成首帧画面后，视频便可以即时播放，后续内容则动态生成并无缝衔接。如果你用过视频生成模型，一定对漫长的等待时间记忆深刻，生成一段10秒的视频，往往需要等待好几分钟才可以开始观看。研究团队表示，这一延迟的根本原因在于：传统视频生成模型普遍采用的双向注意力机制，每一帧都需要参考前后帧的信息。这就像写故事时必须先构思好整个剧情的所有细节才能动笔，在完整视频生成完毕前，你看不到任何画面。为此，他们提出了一种全新的解决方案，通过蒸馏预训练的双向扩散模型（DiT），构建自回归生成模型。实验中，CausVid基于自回归生成的特性，无需额外训练就能支持多种应用，生成速度和质量均显著超越现有方法。