谷歌斯坦福资讯

谷歌斯坦福联合发布使用自回归视频扩散的大尺度一致街景生成

我们提出了一种生成街景的方法——通过动态合成的城市尺度场景生成长序列的视图。我们的生成受到语言输入（例如城市名称、天气）以及承载所需轨迹的底层地图/布局的限制。与最近的视频生成或3D视图合成模型相比，我们的方法可以扩展到更远距离的相机轨迹，跨越几个城市街区，同