RTX 5090和人形机器人,黄仁勋CES2025的「开场与压轴」

360影视 2025-01-10 10:55 2

摘要:本次发布的GeForce RTX 50系列采用Blackwell架构、第五代Tensor Cores和第四代RT Cores,包含RTX 5090、RTX 5080、RTX5070 Ti以及RTX 5070四款产品。

雷峰网消息,当地时间1月6日,英伟达CEO黄仁勋发表了CES2025第一个主题演讲,正式拉开这场“科技春晚”的帷幕。

长达一个半小时的主题演讲,黄仁勋带来了全新的RTX50系列显卡,并讲解了英伟达在AI、自动驾驶以及人形机器人等前沿科技领域的技术进展。

演讲开头,黄仁勋回顾了英伟达的发展历程,从NV1让主机游戏成为可能、第一款GPU GeForce 256的发布,到最新的RTX50系列,英伟达步履不停。

而图形和游戏之外,英伟达也持续在引领行业的发展,从AI到当下的人形机器人。

借AI之力,RTX 5090实现「双倍」效能提升

“简直就是怪兽。”这是黄仁勋对GeForce RTX 50系列GPU的形容。

本次发布的GeForce RTX 50系列采用Blackwell架构、第五代Tensor Cores和第四代RT Cores,包含RTX 5090、RTX 5080、RTX5070 Ti以及RTX 5070四款产品。

作为RTX 50系列的旗舰产品,在性能参数上,RTX 5090拥有920亿个晶体管,实现最高可达3352TOPS的AI算力,380 RT TFLOPS的光线追踪性能,以及125 Shader TFLOPS的着色器性能。

RTX5090拥有32GB GDDR7显存,显存位宽512位,CUDA核心数量为21760,功耗575W。高功耗对散热提出高要求,RTX 5090采用双槽、双风扇冷却方案,支持液态导热材料和三层PCB设计,高效散热确保显卡在高负荷运行时的稳定性。

Blackwell架构的创新和DLSS 4使得RTX 5090的性能是RTX 4090的两倍,黄仁勋表示:“Blackwell作为AI引擎为PC游戏玩家、开发者和创作者带来全新体验。Blackwell融合了AI驱动的神经网络渲染和光线追踪,是我们在25年前推出可编程着色技术以来最重要的计算机图形创新。

产品迭代的背后,是AI正在回归GeForce。

DLSS 4多帧生成技术首次亮相,借助AI可为每个渲染帧生成三帧以提高帧率,多帧生成技术与全套DLSS技术协同运行,与传统渲染技术相比,性能最高可提升8倍,发布之日就有超过75款游戏和应用支持这项技术。

DLSS 4还引入了图形行业首个Transformer模型实时应用,基于Transformer架构的DLSS超分辨率和光线重建模型具备2倍的参数量和4倍的计算量,可提高画面稳定性,减少伪影,增加细节并增强抗锯齿效果。

Blackwell架构将AI引入着色器,英伟达推出RTX神经网络着色器(RTX Neural Shaders),将小型AI网络融入可编程着色器,为实时游戏带来电影级的材质、光照等。

而RTX 50系列出色的AI算力,将实现在游戏渲染的同时为拥有自主意识的游戏角色提供动力,英伟达推出的ACE技术将使游戏角色能像真人玩家一样感知环境、制定计划并行动,这项技术将在《绝地求生》以及《永劫无间手游》等热门游戏中得到应用。

Isaac GR00T Blueprint,让人形机器人走向「ChatGPT时刻」

通用机器人的ChatGPT时刻即将到来,黄仁勋用这句话作为机器人主题的开场,站在他旁边的是14款来自不同厂商的人形机器人组成的“机器人军团”。

通用机器人之所以如此重要,是因为不需要像带有履带和轮子的机器人一样,需要特殊的环境和场景去适应机器。当下三类通用机器人包括AI Agent、自动驾驶汽车以及人形机器人。

AI Agent和自动驾驶之后,人形机器人时代即将到来,未来二十年,预计人形机器人市场将达到380亿美元。

人形机器人落地的关键在于“如何训练”,为此,英伟达拿出了一套人形机器人的标准训练流程“Isaac GR00T Blueprint”,通过一系列机器人基础模型、数据管线和仿真框架,加速下一代人形机器人的开发进程。

Isaac GR00T Blueprint可以帮助开发者生成海量的合成运动数据,以便通过模仿学习来训练人形机器人。

模仿学习是机器人学习的一个子集,它能让人形机器人通过观察和模仿人类专家的示范来获取新技能。在真实世界中收集这些广泛、高质量的数据集成本极高。通过用于合成运动生成的Isaac GR00T Blueprint,开发者只需少量人类示范,就能轻松生成海量的合成数据集。

Isaac GR00T Blueprint工作流主要包含3个部分。

首先通过GR00T-Teleop工作流,用户可以借助Apple Vision Pro在数字孪生环境中捕捉人类动作。这些人类动作会被记录下来作为金标准,并在仿真环境中由机器人模仿学习。

然后,GR00T-Mimic工作流会将捕捉到的人类示范扩展成更大的合成运动数据集。

最后,基于NVIDIA Omniverse和NVIDIA Cosmos平台构建的GR00T-Gen工作流,会通过域随机化和3D提升技术,指数级扩增这个数据集,该数据集可作为机器人策略的输入,在NVIDIA Isaac Lab(机器人学习开源模块化框架)中,教会机器人如何在其环境中高效且安全地移动和互动。

Cosmos平台拥有一系列开放的预训练世界基础模型,包含各种模型尺寸并适用于多种输入数据格式。这些模型基于1800万亿个数据单元进行训练,其中包括200万小时的自动驾驶、机器人、无人机拍摄的视频以及合成数据。除了帮助生成大型数据集外,Cosmos还能将图像从3D扩展到真实场景,缩小仿真与现实之间的差距。

黄仁勋表示:“与大语言模型一样,世界基础模型是推动机器人和自动驾驶汽车开发的基础,但并非所有开发者都拥有自主训练模型所需的专业知识和资源。我们创建Cosmos是为了普及物理AI,让每一位开发者都能接触到通用机器人技术。”

Cosmos的首批用户包括1X、Agile Robots、Figure AI、Foretellix、Galbot、Hillbot、IntBot、Neura Robotics、Uber和小鹏汽车等领先机器人和汽车公司。

Uber首席执行官Dara Khosrowshahi表示:“生成式AI将驱动未来的移动出行,而这需要丰富的数据和非常强大的算力。相信在英伟达的助力下,我们能够帮助行业更快开发出安全、可扩展的自动驾驶解决方案。”

Isaac GR00T、Omniverse和Cosmos正在助力物理AI和人形机器人创新,包括波士顿动力和Figure在内的主要机器人公司已开始采用Isaac GR00T,随着技术的成熟,英伟达将让机器人生态更加繁荣。

来源:雷峰网

相关推荐