摘要:以往,构建一个游戏世界需要繁琐的编程和复杂的设计,但Genie 2仅需一张图片即可实现。这个强大的模型能够基于初始图像生成一个完整的、可操作且充满趣味的3D环境。用户只需通过键盘和鼠标,便能在这个虚拟世界中自由探索。
在科技界的一次深夜震撼发布中,Google DeepMind 推出了其最新的基础世界模型——Genie 2,这一创新技术将游戏体验推向了新的维度。
以往,构建一个游戏世界需要繁琐的编程和复杂的设计,但Genie 2仅需一张图片即可实现。这个强大的模型能够基于初始图像生成一个完整的、可操作且充满趣味的3D环境。用户只需通过键盘和鼠标,便能在这个虚拟世界中自由探索。
Genie 2的发布不仅展示了其惊人的生成能力,更揭示了它对于世界运作规律的深刻理解。在虚拟环境中,无论是角色的跳跃、游泳,还是与其他物体的互动,Genie 2都能准确预测并实时生成连贯的画面。这种能力得益于它在海量视频数据集上的训练,以及涌现出的多项先进功能,如物体互动、复杂角色动画和真实物理效果的模拟。
与此同时,OpenAI也在凌晨时分宣布了一项为期十二天的圣诞惊喜活动。在这场AI巨头之间的年终对决中,OpenAI不甘示弱,计划通过每日直播展示一系列新发布的内容和演示,为观众带来连续的重磅惊喜。
然而,尽管OpenAI的活动备受期待,但DeepMind的Genie 2无疑抢占了头条。这一创新技术不仅让游戏开发者眼前一亮,更引发了关于未来游戏体验变革的广泛讨论。
Genie 2的演示视频展示了其强大的互动性和生成能力。系统首先使用Imagen 3根据文字描述生成初始图片,然后Genie 2基于这张图片创造出一个完整的互动世界。用户可以在这个世界中自由探索,而Genie 2会实时生成用户看到的每一帧画面。这种实时生成和互动的能力,让游戏体验变得前所未有的流畅和真实。
不仅如此,Genie 2还具备强大的“记忆力”和“创造力”。它能够记住用户看不到的地方是什么样的,并在用户重新看到时精确重现。这种能力使得虚拟世界更加真实和连贯,为用户提供了沉浸式的游戏体验。
Genie 2还支持多种视角切换和复杂的3D视觉场景呈现。无论是第一人称视角、等角视角还是第三人称驾驶视频,Genie 2都能轻松应对。同时,它还支持多样化的对象交互和物理现象的模拟,如气球爆炸、开门动作和炸药桶爆炸效果等。
对于艺术家和设计师来说,Genie 2无疑是一个强大的创作工具。他们只需简单地画出草图,Genie 2就能将其变成可以实际体验的3D环境。这不仅省去了大量复杂的制作过程,还为创作者提供了更多的想象空间和创作可能。
然而,DeepMind也承认,目前这项研究仍处于初期阶段,并在智能体和环境生成能力上有着很大的改进空间。尽管存在一些“翻车”的情况,如角色突然做出不符合逻辑的动作或物体突然消失等,但DeepMind相信,随着技术的不断进步和完善,Genie 2将成为解决训练具身智能体结构性问题的关键,并推动通用人工智能(AGI)的发展。
总的来说,Genie 2的发布标志着AI技术在游戏体验方面的重大突破。它不仅为用户提供了更加真实和沉浸式的游戏体验,还为创作者提供了更多的创作可能。随着技术的不断进步和完善,我们有理由相信,未来的游戏体验将会变得更加丰富和多样。
来源:ITBear科技资讯