世界实验室的人工智能可以从单张照片生成互动3D场景

摘要：世界实验室是由人工智能先驱李飞飞创办的一家初创公司，推出了一种能从单张图像生成互动3D场景的人工智能系统。该系统与市面上现有的3D模型转换工具不同，具备高度的互动性和可修改性。用户可以通过演示在网页浏览器中探索这些视觉上令人印象深刻的场景，尽管外观略显卡通化。

世界实验室是由人工智能先驱李飞飞创办的一家初创公司，推出了一种能从单张图像生成互动3D场景的人工智能系统。该系统与市面上现有的3D模型转换工具不同，具备高度的互动性和可修改性。用户可以通过演示在网页浏览器中探索这些视觉上令人印象深刻的场景，尽管外观略显卡通化。系统确保生成的场景保持一致性，并遵循基本物理法则，赋予场景深度感。尽管存在导航限制和偶尔的渲染错误，世界实验室仍在不断改进其技术。自推出以来，该公司已从知名投资者那里筹集了2.3亿美元，估值超过10亿美元，计划在2025年前推出首款产品，旨在为多样化客户提供创新工具。

世界实验室是一家由人工智能先驱李飞飞创办的初创公司，推出了其首个项目：一种能够从单张图像生成视频游戏般三维（3D）场景的人工智能系统。尽管市面上存在许多能够将照片转化为3D模型和环境的人工智能系统，但世界实验室的产品因其互动性和可修改性而独树一帜。根据世界实验室的一篇博客文章，“[我们的技术]让你可以走进任何图像，并在3D中探索。除了输入图像，其他一切都是生成的。”这一创新系统将静态图像转变为引人入胜的互动3D场景。

任何配备键盘和鼠标的人都可以通过世界实验室网站上的演示探索这些人工智能生成的场景。这些场景视觉上令人印象深刻，尽管外观略显卡通化。它们在网页浏览器中实时渲染，并配有可控的摄像头，以及可调的模拟景深（DoF）。景深效果越大，背景物体越模糊，从而增强沉浸体验。世界实验室的系统属于一种不断增长的人工智能类别，被称为“世界模型”。虽然许多此类模型能够模拟游戏和3D环境，但它们往往存在伪影和一致性问题。例如，初创公司Decart开发的模拟《我的世界》的世界模型Oasis，分辨率较低，并且容易“忘记”关卡布局。

相比之下，世界实验室的方法确保一旦场景生成，它将保持一致，并遵循基本的物理法则，赋予场景一种坚实和深度的感觉。此外，该系统能够为场景引入互动效果和动画，例如改变物体的颜色和动态照明背景。尽管功能令人印象深刻，但仍有提升空间。目前，世界实验室的场景并非完全可探索；用户只能在有限的区域内导航，试图超越此边界将导致阻碍。偶尔可能会出现渲染错误，导致物体的不自然融合。然而，世界实验室表示这仅仅是一个“早期预览”，并称：“我们正在努力改善生成世界的大小和保真度，并尝试新的用户互动方式。”

自今年早些时候推出以来，世界实验室已成功从知名投资者如安德森-霍洛维茨（a16z）、阿什顿·库彻、英特尔资本、AMD风险投资和埃里克·施密特那里筹集了2.3亿美元的风险投资。公司估值超过10亿美元，计划在2025年前推出首款产品。除了创建互动场景外，世界实验室还计划开发能够惠及艺术家、设计师、开发者、电影制片人和工程师等专业人士的工具。该公司瞄准了从视频游戏开发者到电影制片厂的多样化客户。正如世界实验室联合创始人贾斯廷·约翰逊在最近的一期a16z播客中所指出的：“我们已经具备创建虚拟互动世界的能力，但这需要数亿数亿美元和大量的开发时间。[世界模型]将让你不仅能获取一幅图像或一段视频，而是一个完全模拟、充满活力且互动的3D世界。”