摘要:Google 发布了其迄今为止最先进的视频生成模型——Veo 3。与前一代 Veo 2 相比,Veo 3 不仅在图像质量、物理一致性、提示词遵循性等方面实现质的飞跃,还引入了包括音频在内的新创作维度,标志着生成式视频技术迈入“电影级创作”时代。
兄弟们
好莱坞已死
看看 Veo 3 的这些集锦视频
Google Veo 3 真的是已经到了生产级别了,好莱坞岌岌可危...
Google 发布了其迄今为止最先进的视频生成模型—— Veo 3 。与前一代 Veo 2 相比,Veo 3 不仅在图像质量、物理一致性、提示词遵循性等方面实现质的飞跃,还引入了包括音频在内的新创作维度,标志着生成式视频技术迈入“电影级创作”时代。
先看看一个视频↓
演员诉说自己被困在Prompt里
Veo 3核心能力
1. 4K 高清输出与真实感增强
支持 原生 4K 分辨率输出 ,达到近似专业摄影机的视觉细节;
在运动物理、光照逻辑、材质质感等方面实现了对现实世界规则的高保真模拟;
场景间的物体一致性、透视准确性大幅提高,生成画面可无缝嵌入真实拍摄片段。
2. 更强的提示词理解能力
相较于 Veo 2,Veo 3 显著提升了 prompt adherence(提示遵循性) ;
支持更复杂的自然语言描述,包括镜头运动、情绪基调、构图细节;
允许用户用通俗语言表达专业导演指令(如“清晨,海边,手持镜头感,渐变色光”);
3. 创作控制能力提升
支持镜头间 连贯动作过渡 ,保持角色与背景逻辑一致;
可构建复杂场景结构(如多人互动、动态叙事节奏);
4. 自动为生成视频配音配乐
融合 音频生成功能 (Veo 3 独有),首次将“环境音、对白”等 音频生成 能力引入视频模型中,在生成视频的同时,会根据生成图像的画面自动为视频进行配音,支持生成环境声与对白、音乐、甚至各种音效。对应不同场景情绪氛围。
看看这些案例吧↓
一个微塑料宣传片
使用 Veo 3 制作的一个电影级的短片
生成第三人称游戏画面
各种音乐表演
一只狗狗从屋里跑到户外,镜头跟踪
舞蹈视频
完整做饭视频
午夜街头快问快答采访
从第三人称视角观看蜜蜂在后院烧烤架周围快速飞行
长颈鹿还会跳舞
书本上的画面竟然如此清晰
车展直播视频
一位大学教授正在上一堂关于 Z 世代俚语的课
一名男子对着镜头说唱,讲述如何使用 Veo 3 制作视频
镜头快速移动洞穴效果
特斯拉线圈风格的说唱(多个镜头画面交错)
脱口秀表演
还能生成游戏解说(包含游戏画面)
一位女士对着镜头唱着关于 Veo3 的歌
腊肠犬和迷你长颈鹿拳击比赛
.....
来源:晚晚的星河日记一点号