谷歌斯坦福联合发布使用自回归视频扩散的大尺度一致街景生成 我们提出了一种生成街景的方法——通过动态合成的城市尺度场景生成长序列的视图。我们的生成受到语言输入(例如城市名称、天气)以及承载所需轨迹的底层地图/布局的限制。与最近的视频生成或3D视图合成模型相比,我们的方法可以扩展到更远距离的相机轨迹,跨越几个城市街区,同 视频 谷歌 斯坦福 街景 谷歌斯坦福 2025-03-10 10:09 3