英伟达(NVIDIA )Ada Lovelace GPU架构

360影视 2025-02-04 13:02 2

摘要:NVIDIA的Ada Lovelace架构是其在2022年推出的一种先进的GPU架构,以纪念被认为是世界上第一位计算机程序员的数学家Ada Lovelace。这一架构在多个方面进行了重大创新,显著提升了图形、AI和计算工作负载的性能,以下是其主要特点:

NVIDIA的Ada Lovelace架构是其在2022年推出的一种先进的GPU架构,以纪念被认为是世界上第一位计算机程序员的数学家Ada Lovelace。这一架构在多个方面进行了重大创新,显著提升了图形、AI和计算工作负载的性能,以下是其主要特点:

核心架构与性能

• CUDA核心与流多处理器(SM):Ada Lovelace架构的GPU拥有大量CUDA核心,例如RTX 4090的AD102芯片包含18,432个CUDA核心。此外,其SM进行了显著增强,尤其是在光线追踪工作负载方面,提供了更高的性能。

• 第三代RT核心:光线追踪性能大幅提升,与上一代Ampere架构相比,Ada的第三代RT核心在光线与三角形的交点计算上速度提高了2倍。此外,Ada RT核心还引入了两个新硬件单元:Opacity Micromap Engine和Displaced Micro-Mesh Engine,分别用于加速透明度处理和减少复杂几何对象的BVH构建时间和存储需求。

• 第四代Tensor核心:Tensor核心的AI计算性能相比上一代提高了4倍。这些核心支持FP8精度数据类型,并提供独立的浮点和整数数据路径,以加速混合浮点和整数计算。

• 缓存与内存:Ada架构GPU拥有更大的缓存,如96MB的L2缓存,是Ampere架构的16倍。此外,RTX 5000 Ada显卡配备了32GB的GDDR6显存。

AI与深度学习

• DLSS 3:Ada Lovelace架构支持DLSS 3,通过生成额外的高质量帧来提高性能。与DLSS 2.0相比,DLSS 3的帧率提高了2倍。

• 神经网络处理单元(NPU):RTX 500和1000 Ada显卡内置NPU,用于轻型本地AI计算,有效提高了计算和图形处理的效率。

视频与编码

• AV1编码器:Ada架构的第八代硬件编码器(NVENC)支持AV1编码,相比H.264效率提高了40%。这为广播、流媒体和视频通话带来了更好的体验。

虚拟化与数据中心

• 数据中心GPU:基于Ada Lovelace架构的NVIDIA L40和L4 GPU为数据中心和边缘服务器部署提供了强大的图形和计算能力。例如,L40 GPU在FP32计算性能上是上一代A40 GPU的2倍。

• 虚拟工作站支持:支持NVIDIA RTX Virtual Workstation软件,允许将个人工作站转换为多个高性能虚拟工作站实例。

制程与能效

• 4N制程:Ada Lovelace架构采用了TSMC的4N制程,专为NVIDIA GPU设计,允许在芯片中集成更多的处理单元和内存。尽管RTX 4090的Boost Clock频率比上一代RTX 3090 Ti高出660MHz,但其功耗保持不变,整体能效提高了2倍。

代表产品

• GeForce RTX 4090:作为Ada Lovelace架构的旗舰产品,RTX 4090在4K分辨率下能够以超过100帧/秒的速度运行许多游戏。

• NVIDIA RTX 5000 Ada Generation:适用于专业工作站,支持生成式AI和3D图形工作负载。

• NVIDIA L40和L4:分别为数据中心和边缘服务器设计的高性能GPU。

Ada Lovelace架构是NVIDIA在GPU设计上的一个重要里程碑,它不仅在图形和AI性能上实现了巨大的飞跃,还通过创新的硬件设计和制程技术,为数据中心和专业工作站提供了强大的支持。

来源:开心的野韭菜

相关推荐