万物皆可被AI重新发明,NVIDIA发布Blackwell RTX PRO、Omniverse操作系统、DGX Spark个人AI计算机、Cosmos世界基础模型等新品

360影视 欧美动漫 2025-03-20 10:53 2

摘要:自 2009 年首届举办以来,NVIDIA GTC(GPU Technology Conference)大会始终是 AI 与计算领域的风向标。这场被喻为「AI 界超级碗」的盛会,见证了黄仁勋从 GPU 加速计算到 AI 革命的技术预言,驱动着从深度学习到生成式

自 2009 年首届举办以来,NVIDIA GTC(GPU Technology Conference)大会始终是 AI 与计算领域的风向标。这场被喻为「AI 界超级碗」的盛会,见证了黄仁勋从 GPU 加速计算到 AI 革命的技术预言,驱动着从深度学习到生成式 AI 的范式跃迁。而 GTC 2025 以更宏大的叙事登场——在算力需求激增百倍的背景下,NVIDIA 不仅推出性能跃升的下一代芯片架构,更将 AI 技术向物理世界延伸:从支撑万亿级参数模型的推理引擎,到赋能人形机器人的感知与行动,从重构自动驾驶的决策核心,到光互联的突破性布局。这场发布会不仅延续了 NVIDIA「每年一代架构」的技术节奏,更以跨学科生态的野心,宣告 AI 正从数字工具演化为重塑现实的基石力量。

当地时间 2025 年 3 月 18 日,在 GTC 2025 的首日 NVIDIA 发布了 NVIDIA RTX PRO™ Blackwell 系列工作站和服务器 GPU、DGX Spark 个人 AI 计算机、全新的 NVIDIA Omniverse Blueprints、Cosmos 世界基础模型和物理 AI 数据工具更新版。

NVIDIA Blackwell RTX PRO:助力构建代理式 AI 并进行协作

NVIDIA RTX PRO™ Blackwell 系列工作站和服务器 GPU,通过加速计算、AI 推理、光线追踪和神经渲染技术,为 AI、技术、创意、工程和设计专业人士的工作流赋予了新定义。

从代理式 AI、仿真、扩展现实、3D 设计和复杂视觉效果,到开发驱动自主机器人、以及车辆和智能空间的物理 AI,RTX PRO Blackwell 系列能为多个行业的专业人士提供计算能力、显存容量和数据吞吐量,无论是在桌面端、移动工作站还是数据中心 GPU 都可轻松获取。

新产品系列包括:

在数据中心 GPU 方面,拥有 NVIDIA RTX PRO Blackwell 服务器版。

在桌面 GPU 方面,拥有 NVIDIA RTX PRO Blackwell 工作站版、NVIDIA RTX PRO Blackwell Max-Q 工作站版、NVIDIA RTX PRO 5000 Blackwell、NVIDIA RTX PRO 4500 Blackwell 和 NVIDIA RTX PRO 4000 Blackwell。

在笔记本 GPU 方面,拥有 NVIDIA RTX PRO 5000 Blackwell、NVIDIA RTX PRO 4000 Blackwell、NVIDIA RTX PRO 3000 Blackwell、NVIDIA RTX PRO 2000 Blackwell、NVIDIA RTX PRO 1000 Blackwell 和 NVIDIA RTX PRO 500 Blackwell。

NVIDIA 企业平台副总裁 Bob Pette 表示:「软件开发者、数据科学家、艺术家、设计师和工程师需要强大的 AI 和图形性能来突破视觉计算和仿真的边界,来帮助他们解决行业重大挑战。将 NVIDIA Blackwell 引入工作站和服务器能把生产力、性能和速度提升到新的高度,能够加速 AI 推理服务、数据科学、可视化和内容创作。」

据了解,NVIDIA RTX PRO Blackwell GPU 通过提供高性能、高效率和高扩展性,能够释放生成式 AI、代理式 AI 和物理 AI 的潜力。

NVIDIA RTX PRO Blackwell GPU 具有以下特点:

其一,拥有 NVIDIA 流式多处理器,这让其能提供高达 1.5 倍的更快吞吐量,新的神经着色器将 AI 集成到可编程着色器中,助力推动下一个十年的 AI 增强图形创新。

其二,拥有第四代 RT Core,相比上一代其性能提升 2 倍,可以创建照片级真实、物理精确的场景和复杂 3D 设计,并针对 NVIDIA RTX™ Mega Geometry 进行了优化。

其三,拥有第五代 Tensor Core,故能提供 4,000 AI TOPs 的性能,并增加了对于 FP4 精度和 NVIDIA DLSS 4 多帧生成的支持,能够更快地运行和原型化更大的 AI 模型。

其四,拥有更大、更快的 GDDR7 显存,故能提升带宽和容量,工作站和服务器最高可被提高 96GB,笔记本最高可被提高 24GB。这能使应用程序更快地运行,从而可以处理更大、更复杂的数据集,比如能从处理大型 3D 和 AI 项目迭代到能处理大规模虚拟现实环境。

其五,拥有第九代 NVIDIA NVENC,故能加快视频编码速度,提升专业视频应用的质量,并增加了对于 4:2:2 编码的支持。

其六,拥有第六代 NVIDIA NVDEC,能够提供高达两倍的 H.264 解码吞吐量,支持 4:2:2 H.264 和 HEVC 解码。借助高质量视频回放,专业人员可加速视频数据采集,并能使用高级 AI 来赋能视频编辑功能。

其七,拥有第五代 PCIe,能够支持第五代 PCI Express,可以提供比上一代双倍的带宽,从而能够提升 CPU 显存数据传输速度,进而能为数据密集型任务提供更快的性能。

其八,拥有 DisplayPort 2.1,能够驱动高分辨率的显示器,支持高达 4K 480Hz 和 8K 165Hz 的分辨率。所增加的带宽能够实现无缝多显示器设置。而高动态范围和更高的色深支持可以为视频编辑、3D 设计和直播等场景提供更精确的色彩准确度。

其九,拥有多实例 GPU(MIG),具体来说 RTX PRO 5000 系列桌面系列 GPU 具有 MIG 技术,能够将单个 GPU 安全分区为两个实例(5000 系列)。其能通过故障隔离防止工作负载干扰,从而为不同工作负载提供安全、高效的资源分配,进而实现性能和灵活性的最大化。

据了解,新的笔记本电脑 GPU 还支持最新 NVIDIA Blackwell Max-Q 技术,借助 AI 能够既智能又持续地优化笔记本电脑性能和功耗。

通过神经渲染和 AI 增强工具,NVIDIA RTX PRO Blackwell GPU 能以极高速度和效率创建视觉效果、基于真实环境的数字孪生以及沉浸式体验。这些 GPU 专为提升 3D 计算机辅助设计和建筑信息模型工作流而打造,能让设计师和工程师更好地进行复杂建模、渲染和可视化。

与此同时,RTX PRO GPU 在 NVIDIA AI 平台上运行,具有更大的显存容量和最新 Tensor Core,能为基于 NVIDIA CUDA® 和 RTX 技术构建的深层 AI 加速应用生态系统带来加速。比如,同样在本次大会上发布的 NVIDIA Llama Nemotron Reason 系列模型和 NIM™ 微服务,它们的推理速度将比以往更快。无论是在工作站、数据中心还是云端,凭借超过 400 个 NVIDIA CUDA-X™ 库,开发者都可以轻松构建、优化、部署和扩展新的 AI 应用。

企业则可以通过 NVIDIA RTX PRO GPU 以及 NVIDIA Omniverse™ 和 NVIDIA AI Enterprise 平台、NVIDIA Blueprints 和 NVIDIA NIM 在本地进行原型设计,加快 AI 开发和部署。其中,NVIDIA NIM 能够提供易于使用的推理微服务,并能提供企业级支持。

就供货情况来说:NVIDIA RTX PRO 5000、RTX PRO 4500 和 RTX PRO 4000 Blackwell GPU 将于 2025 年夏季通过 BOXX、戴尔、惠普和联想以及全球分销合作伙伴提供。

NVIDIA RTX PRO Blackwell 笔记本电脑 GPU 将于 2025 年晚些时候通过戴尔、惠普、联想和雷蛇提供。

图 | NVIDIA Blackwell RTX PRO

DGX Spark 个人 AI 计算机:让 AI 能从云服务扩展到台式电脑和边缘应用

同日,NVIDIA 发布了由 NVIDIA Grace Blackwell 平台驱动的 DGX™ 个人 AI 超级计算机。

DGX Spark 前身为 Project DIGITS,支持 AI 开发者、研究人员、数据科学家和学生,能帮助他们在台式电脑上针对大模型进行原型设计、微调和推理。用户也可以在本地运行这些模型,或将其部署在 NVIDIA DGX Cloud 以及任何其他加速云或数据中心基础设施之中。

据了解,DGX Spark 将以前仅在数据中心可用的 Grace Blackwell 架构的功能延伸到台式电脑。目前,开发 DGX Spark 的全球系统制造商包括华硕、Dell、HP Inc 和 联想。

NVIDIA 创始人兼 CEO 黄仁勋表示:「AI 改变了每一层计算堆栈。我们有理由相信将出现一类专为 AI 原生开发者而设计并用于运行 AI 原生应用的新型计算机。借助全新的 DGX 个人 AI 计算机,AI 能够从云服务扩展到台式电脑和边缘应用。」

作为一款小型 AI 超级计算机,DGX Spark 将为数以百万计的研究人员、数据从业者、机器人开发者和学生提供强大性能和功能,助力他们突破生成式 AI 和物理 AI 的边界。

DGX Spark 的核心是 NVIDIA GB10 Grace Blackwell 超级芯片,其已针对台式电脑外形规格进行了优化。GB10 配备 NVIDIA Blackwell GPU,支持第五代 Tensor Core 和 FP4,每秒计算次数达 1,000 万亿次,适用于借助前沿的 AI 推理模型(包括 NVIDIA Cosmos-Reason 世界基础模型和 NVIDIA GR00T N1 机器人基础模型)进行微调和推理。

GB10 超级芯片采用 NVIDIA NVLink™-C2C 互连技术,提供 CPU+GPU 相结合的一致性内存模型,带宽是第五代 PCIe 的五倍。因此,这一超级芯片能够访问 GPU 和 CPU 之间的数据,从而为内存密集型 AI 开发者工作负载优化性能。

对于 NVIDIA 的全栈 AI 平台来说,它支持 DGX Spark 用户将其模型从台式机无缝迁移到 DGX Cloud 以及任何加速云或数据中心基础设施之中,并且几乎无需更改代码,所以更容易对其工作流进行原型设计、微调和迭代。

图 | DGX Spark 个人 AI 计算机

NVIDIA Omniverse 物理 AI 操作系统,扩展至更多行业和伙伴

同日,NVIDIA 宣布 Ansys、Databricks、Dematic、Omron、SAP、Schneider Electric with ETAP 和西门子等公司正在将 NVIDIA Omniverse™ 平台集成到其解决方案之中,并正在利用物理 AI 加速工业数字化。

NVIDIA 现已推出与 NVIDIA Cosmos™ 世界基础模型相连接的新款 NVIDIA Omniverse Blueprints,可实现用于物理 AI 开发的机器人技术设施和大规模合成数据生成。

与此同时,NVIDIA 还推出四款全新蓝图,助力机器人设施和大规模合成数据生成。其中,Mega 是一个用于在工业数字孪生中大规模测试多机器人机群的 Omniverse Blueprint,现已在 build.nvidia.com 上发布预览版。另有一款由 NVIDIA Metropolis 平台提供支持的用于视频搜索和总结的 NVIDIA AI Blueprint,能够构建可以监控整个设施活动的 AI 智能体。

眼下,制造领域的企业正在使用这些蓝图,以及通过物理 AI 优化其工业运营。

在汽车制造领域,Schaeffler 和 Accenture 开始采用 Mega 来测试和模拟用于材料处理自动化的 Agility Robotics Digit 车队。现代汽车集团正使用该蓝图在装配线上模拟 Boston Dynamics® Atlas 机器人。梅赛德斯-奔驰正使用它来模拟 Apptronik 的 Apollo 人形机器人,进而实现优化车辆装配操作。

在电子制造业领域,Pegatron 正在使用 Mega 开发基于物理 AI 的 NVIDIA Metropolis 视频分析智能体,以改善工厂运营和工人安全性。Foxconn 正在使用该蓝图在其制造设施中针对工业机械手、人形机器人和移动机器人进行模拟。

在仓库和供应链解决方案方面,凯傲集团、Dematic 和 Accenture 宣布将集成 Mega 以推动新一代 AI 赋能自动化发展。idealworks 正在将 Mega 集成到其车队管理软件中,以用于模拟、测试和优化机器人机群。另据悉,NVIDIA 的 SAP 客户和合作伙伴已能使用 Omniverse 为仓库管理场景开发自己的虚拟环境。

借助面向 AI 工厂数字孪生的新 Omniverse Blueprint,数据中心工程师能够设计和模拟 AI 工厂布局、冷却和电气,从而最大限度地提高利用率和效率。比如,Cadence Reality 和 Schneider Electric with ETAP 是最先将其仿真软件与 Blueprint 集成的两家公司。

用于合成操作运动生成的 NVIDIA Isaac GR00T Blueprint 现已面向机器人开发者开放,其能实现 Omniverse 和 Cosmos 的大规模合成数据生成。该蓝图可以帮助真人开发者将数据采集时间从数小时缩短到数分钟,从而快速推进机器人的开发进度。

对于立足于物理世界的行业来说,实现数字化具有一定的挑战性。来自传统系统的海量数字和物理世界数据形成了多个孤岛。而基于 OpenUSD 构建的操作系统 Omniverse,可以帮助开发者针对物理世界的数据和应用加以统一。

目前,Ansys、Cadence、Hexagon、Omron、Rockwell Automation 和西门子正在将 Omniverse 数据互操作性和可视化技术,集成到其工业软件、仿真和自动化解决方案中。

在物理 AI 方面,Alphabet 旗下公司 Intrinsic 正在使用 Flowstate 助力 Omniverse 工作流和 NVIDIA 机器人基础模型从数字孪生过渡到硬件部署。Databricks 正在将 NVIDIA Omniverse 与 Databricks 数据智能平台集成,这将实现物理 AI 的大规模合成数据生成。

通用汽车宣布采用 Omniverse 来增强其工厂和培训平台,以用于材料处理、运输和精密焊接等运营。联合利华则宣布采用 Omniverse 和物理精确的数字孪生来简化和优化其产品的营销内容创作。

同日,NVIDIA 与 Destney Research 和 Intrinsic 联合推出了用于机器人的 OpenUSD 资产结构工作流。这种新结构和数据工作流使用 OpenUSD 内部的实践经验来统一机器人工作流,能为所有数据源提供通用语言。

为了简化基于 OpenUSD 的应用的开发、部署和横向扩展,NVIDIA Omniverse 现已在 AWS Marketplace 上的配备 NVIDIA GPU 的 EC2 G6e 实例中提供。Microsoft Azure Marketplace 现已在 NVIDIA A10 GPU 上提供预配置的 Omniverse 实例和 Omniverse Kit App Streaming,使开发者能够轻松地开发和流式传输自定义 Omniverse 应用。

这些基于云的 NVIDIA Omniverse 开发者工具和服务预计将在 2025 年晚些时候发布,这些工具将在配备 NVIDIA GPU 的 Oracle 云基础设施计算裸机实例上提供,以及基于 Google Cloud 发布的 NVIDIA RTX PRO™ Blackwell 服务器上。

图 | NVIDIA Omniverse 物理 AI 操作系统

Cosmos 世界基础模型和物理 AI 数据工具迎重大更新

同样在本届 GTC 的第一天,NVIDIA 宣布推出全新 NVIDIA Cosmos™ 世界基础模型 (WFM),目前该模型已经引入开放式、可完全定制的物理 AI 开发推理模型,让开发者能以前所未有的方式控制世界生成。

与此同时,NVIDIA 还推出两款由 NVIDIA Omniverse™ 和 Cosmos 平台提供支持的新蓝图,它们能为开发者提供用于机器人和自动驾驶汽车后训练的大规模可控合成数据生成引擎。

据了解,1X、Agility Robotics、Figure AI、Foretellix、Skild AI 和 Uber 是首批采用 Cosmos 的企业,它们已能实现以更快速度和更大规模为物理 AI 生成更丰富的训练数据。

「正如大语言模型改变了生成式和代理式 AI,Cosmos 世界基础模型是物理 AI 的一项重大突破,」NVIDIA 创始人兼 CEO 黄仁勋表示,「Cosmos 为物理 AI 带来了一个开放式、可完全定制的推理模型,为机器人和物理工业领域的突破性发展带来了机遇。」

据介绍,Cosmos Transfer WFM 能够吸收结构化视频输入,如分割图、深度图、激光雷达扫描、姿态估计图和轨迹图等,从而能够生成可控、逼真的视频输出。

Cosmos Transfer 则能简化感知 AI 训练,将 Omniverse 中创建的 3D 仿真或真值转换为逼真视频,从而用于大规模可控合成数据的生成。

另据悉,Agility Robotics 将最早采用 Cosmos Transfer 和 Omniverse 进行大规模合成数据生成,以用于训练其机器人模型。

Agility Robotics 的 CTO Pras Velagapudi 表示:「Cosmos 为我们提供了一个在真实世界可采集的数据之外去扩展逼真训练数据的机会。我们很期待看到使用新平台解锁的新性能,同时充分利用我们已有的基于物理学的仿真数据。」

用于自动驾驶汽车仿真的 NVIDIA® Omniverse Blueprint,则能借助 Cosmos Transfer 放大基于物理传感器数据的变化。借助这一蓝图,Foretellix 通过为不同驾驶数据集改变天气和光照等条件来丰富行为场景。Parallel Domain 也正在使用该蓝图将类似的变更用于其传感器仿真。

据介绍,用于合成操作运动生成的 NVIDIA GR00T Blueprint 结合了 Omniverse 和 Cosmos Transfer,可以大规模地生成多样化的数据集,通过利用 OpenUSD 驱动的仿真,能将数据采集时间和数据增强时间从数天缩短到数小时。

2025 年 1 月,NVIDIA 在国际消费类电子产品展览会(CES,International Consumer Electronics Show)上宣布的 Cosmos Predict WFM 能够通过文本、图像和视频等多模态输入生成虚拟世界状态。而新的 Cosmos Predict 模型可以支持多帧生成,在给定开始输入图像和结束输入图像的情况下,能够预测中间行为或运动轨迹。需要指出的是,这些模型专为后训练而打造,因此可以使用 NVIDIA 开放的物理 AI 数据集进行定制。

借助 NVIDIA Grace Blackwell® NVL72 系统及其 NVIDIA NVLink™ 域的推理计算能力,开发者可以实现实时的世界生成。

Cosmos Reason 则是一个开放式、可完全定制的 WFM,具有时空感知能力,它使用思维链推理来理解视频数据,并能够预测交互结果,比如它能预测一个人将走进人行道或预测一个盒子将从架子上掉下来。

对于开发者来说,其可以使用 Cosmos Reason 来提升物理 AI 数据的标注和管理,从而增强现有世界基础模型或创建新的视觉语言动作模型。其还可以对其进行后训练,构建高级规划器,以指导物理 AI 如何完成所需操作。

基于其下游任务,开发者可以在 NVIDIA DGX™ Cloud 上使用原生 PyTorch 脚本或 NVIDIA NeMo™ 框架针对 Cosmos WFM 进行后训练。

Cosmos 开发者还可以使用 DGX Cloud 上的 NVIDIA NeMo Curator 来加速数据处理和管理。

根据 NVIDIA 的可信 AI 原则,NVIDIA 在所有 Cosmos WFM 中都采用开放式护栏。此外,NVIDIA 正在与 Google DeepMind 合作,将 SynthID 集成到水印中,帮助识别 Cosmos WFM NVIDIA NIM™ 微服务的 AI 生成结果。

目前,Cosmos WFM 可在 NVIDIA API 目录中预览,现已列入 Google Cloud 上的 Vertex AI Model Garden 之中。Cosmos Predict 和 Cosmos Transfer 现已在 Hugging Face 和 GitHub 上公开提供。Cosmos Reason 则已开放抢先体验。

当前,Nexar 和 Oxa 正在使用 Cosmos Predict 来升级其自动驾驶系统。1X 正在使用 Cosmos Predict 和 Cosmos Transfer 来训练其新型人形机器人 NEO Gamma。Skild AI 正在利用 Cosmos Transfer 增强其机器人的合成数据集。

另外,Linker Vision 和 Milestone Systems 正将其用于管理海量视频数据,以用于训练用于视觉智能体的大视觉语言模型,这些智能体基于 NVIDIA AI Blueprint 进行视频搜索和总结。目前,Virtual Incision 正在探索将其部署在未来的手术机器人中。而 Uber 和 Waabi 正在借此推动自动驾驶汽车的开发。

图 | Cosmos 世界基础模型和物理 AI 数据工具

尾声:万物皆可被 AI 重新发明

从 GPU 加速计算到物理 AI 的史诗跨越,在 NVIDIA GTC 2025 上,黄仁勋用算力为墨、生态为纸,将 AI 从虚拟代码浇铸为撬动现实的支点。这场盛会不仅延续了「每年一代架构」的技术狂飙,更以跨学科融合的野心,将 AI 的触角延伸至量子计算、机器人感知、工业数字孪生等疆域。当生成式 AI 突破参数桎梏,当物理世界与比特世界共舞,NVIDIA 正以底层架构之力,在全球科技图谱中刻下新坐标。未来十年,万物皆可被 AI 重新发明。

来源:DeepTech深科技

相关推荐