Cosmos世界基础模型落地,英伟达以AI推进自动驾驶迭代

360影视 2025-01-11 19:36 2

摘要:黄仁勋认为,AI的发展经历了三个阶段:初始阶段是感知式AI,即理解图像、文字和声音;之后是生成式AI,可以创造文本、图像和声音;现在,我们正在进入物理AI的时代,即能够运行、推理、计划和行动的AI。这为包括自动驾驶汽车、游戏、机器人在内的多个行业带来了突破性发

在CES 2025上,英伟达创始人兼CEO黄仁勋表示:“AI正以‘惊人的速度’发展。”

理想汽车创始人李想也在2024年底做出过相同的判断——AI会让人类发生根本性的改变,AI意味着未来的全部,将推动理想汽车向一家人工智能公司演进。

不过,理想与英伟达不同。理想作为整车企业,是AI技术的应用者;而英伟达作为科技企业,是AI技术软硬件两个方面的缔造者。

黄仁勋认为,AI的发展经历了三个阶段:初始阶段是感知式AI,即理解图像、文字和声音;之后是生成式AI,可以创造文本、图像和声音;现在,我们正在进入物理AI的时代,即能够运行、推理、计划和行动的AI。这为包括自动驾驶汽车、游戏、机器人在内的多个行业带来了突破性发展。

谈到2025年的技术创新时,黄仁勋表示,未来所有的交通工具都会具备自动驾驶能力,或者至少能够实现自动化操作。五年前,关于技术的成熟度我们还不确定。但现在可以非常肯定,传感器技术、计算机技术和软件技术已经非常成熟,我们将能够实现这一目标。

在黄仁勋公布的几项英伟达实现的突破创新中,与自动驾驶汽车相关的主要包括两个,一个是NVIDIA Cosmos平台通过针对自动驾驶汽车的新模型和视频数据处理管线推动物理AI发展;另一个,是使用NVIDIA DRIVE AGX车载计算平台开发下一代智能汽车。

1月6日,英伟达宣布推出NVIDIA Cosmos,该平台由先进的生成式世界基础模型、高级 tokenizer、护栏和加速视频处理管线组成。官方表示,它将推动自动驾驶汽车(AV)和机器人等物理AI系统的发展。

在 CES 主题演讲中,黄仁勋介绍了Cosmos模型的用处,主要包括三点:

第一,视频搜索和理解。开发者能够从视频数据中轻松找到特定的训练场景,例如雪天、拥堵等。

第二,物理AI模型开发和评估。在基础模型上构建自定义模型,使用Cosmos进行强化学习以改进模型,或者测试模型在特定仿真场景中的表现。

第三,预测与“多元宇宙”模拟。使用Cosmos和Omniverse生成AI模型所有未来可能实现的结果,以便帮助其选择最佳和最准确的路径。

为什么要打造Cosmos世界基础模型?

首先,基础模型是自动驾驶系统认知现实世界、与现实场景交互的基础。

第二,是因为物理AI模型的开发成本很高,构建物理AI模型需要数PB(petabytes)的视频数据以及数万小时的计算来处理、整理和标记这些数据。

而Cosmos世界基础模型使开发者能够轻松生成大量基于物理学的逼真合成数据,以用于训练和评估其现有的模型,他们还可以通过微调Cosmos WFM构建自定义模型。

这意味着Cosmos世界基础模型的应用,一方面可以节省大量时间,提升研发效率;另一方可以明显减少经济成本的投入,有助于新技术的落地普及。

官方数据显示,开发者能够使用NVIDIA Blackwell平台在14 天内处理、整理和标记2000万小时的视频。如果单纯使用CPU,则需要3年以上。

英伟达全球副总裁Norm Marks表示:“物理AI模型的开发者需要获取真实世界的数据集,并对其进行筛选、整理和准备,以便用于训练。Cosmos 通过生成式 AI 加速了这一过程,使自动驾驶汽车和机器人领域的 AI 模型开发变得更智能、更快速、更精确。”

据悉,为了加速机器人和自动驾驶汽车行业的工作,Cosmos模型将以开放模型许可证的方式提供。开发者可以预览首批模型,也可以从NVIDIA NGC目录或Hugging Face下载整个系列的模型和微调框架。

目前,Cosmos的首批用户包括Agile Robots、Agility、Figure AI、Galbot、Hillbot、Skild AI、Uber、小鹏汽车等机器人公司、共享出行公司以及汽车公司。

Uber首席执行官Dara Khosrowshahi表示:“生成式AI将驱动未来的移动出行,而这需要丰富的数据和非常强大的算力。相信在英伟达的助力下,我们能够帮助行业更快开发出安全、可扩展的自动驾驶解决方案。”

通过Cosmos世界基础模型的推动,还强化了面向自动驾驶的三个关键计算平台。其中,NVIDIA DGX平台用于在数据中心训练基于AI的堆栈;NVIDIA Omniverse平台用于仿真和合成数据的生成;车载计算平台 NVIDIA AGX用于处理实时传感器数据以实现安全驾驶。

这三个专为特定用途打造的全栈平台,共同实现了软件开发的持续改进提升。

在拥有了这一系列的技术支持之后,NVIDIA DRIVE端到端自动驾驶汽车开发平台已经成为自动驾驶技术研发领域的天花板级的平台之一。

官方表示,NVIDIA DRIVE AGX Orin车载芯片和NVIDIA DRIVE AGX Thor集中式车载平台的计算性能,可以满足自动驾驶汽车对复杂环境感知和决策的需求。

而 NVIDIA DriveOS软件平台包含了构建、调试、分析和部署自动驾驶汽车和自动驾驶汽车应用程序所需的所有软件、库和工具,能够令车企快速推进自动驾驶技术的研发与应用。

NVIDIA DRIVE OS专为在基于DRIVE AGX的硬件上开发和部署自动驾驶汽车应用程序而设计,可以为安全关键型应用程序提供执行环境,并提供安全启动、安全服务、防火墙和OTA更新等服务。

1月6日,英伟达在CES 2025上宣布,丰田、Aurora 和大陆集团已加入合作伙伴行列,利用 NVIDIA 加速计算和 AI 开发构建乘用与商用车型。

其中,丰田将在NVIDIA DRIVE AGX Orin上构建其下一代车型,并进一步运行经过安全认证的NVIDIA DriveOS操作系统,新车型将提供具有功能安全保障的高级辅助驾驶功能。

而官宣采用NVIDIA DRIVE AGX平台用于下一代高级驾驶辅助系统和自动驾驶汽车产品的品牌,还包括:比亚迪、捷豹路虎、理想汽车、Lucid、梅赛德斯-奔驰、蔚来、Nuro、Rivian、沃尔沃汽车、Waabi、Wayve、小米、极氪、Zoox 等。

英伟达的“朋友圈”正在进一步拓宽,这意味着其自动驾驶研发技术的价值也越来越显著。

在安全方面,英伟达近期获得了来自权威第三方的多项安全认证和评估证明。其中,TÜV SÜD授予NVIDIA汽车系统级芯片、平台与软件开发流程 ISO 21434 网络安全认证,NVIDIA DriveOS 6.0也被认证为符合ISO 26262汽车安全完整性等级(ASIL)中最高的D级标准;TÜV Rheinland对NVIDIA DRIVE自动驾驶汽车平台进行了独立的联合国欧洲经济委员会(UNECE)安全法规评估,该评估涉及复杂电子系统的安全要求。

此外,NVIDIA推出的安全检测实验室也已获得美国国家标准学会国家认可委员会(ANAB)的认证,该认证的安全检测实验室能够为NVIDIA DRIVE生态系统合作伙伴进行功能安全和网络安全检测。

至此,英伟达成为首家获得第三方对其汽车技术进行全面评估的平台公司,包括NVIDIA DRIVE端到端自动驾驶平台,涵盖了系统级芯片、操作系统、传感器架构、L2+ 应用软件,同时获得了汽车市场AI系统安全和网络安全检测实验室的独立认证。

随着新技术的落地、安全认证的达成以及诸多整车制造商、自动驾驶车辆运营商的加入,NVIDIA DRIVE正在被全球汽车生态系统越来越广泛地采用,英伟达在软硬件两个方面的技术价值也在更多地释放出来。

刚刚过去的2024年,业界将其称之为城区智驾的爆发之年;而刚刚开始的2025年,AI新技术的落地让自动驾驶领域有了更多的想象空间。

从驾驶辅助到完全自动驾驶,这一迭代过程能在AI技术的推动下如何加速,英伟达正在给出答案。

来源:AutoR智驾

相关推荐