GeForce RTX 5090终于有了高4K FPS

360影视 2025-01-24 17:42 2

摘要:GeForce RTX 5090采用了基于Blackwell架构的GB 202 GPU。GPU包含92,2亿个晶体管。这比GeForce RTX 4090的核心AD 102还要大,它拥有76,3亿个晶体管。然而,GB 202的增长并不是由于新工艺的转变,GB

GeForce RTX 5090将于1月30日发售。英伟达允许媒体和博主今天以2000美元的价格发布基准版Founders Edition的评论。

图片来源:TechPowerUp

GeForce RTX 5090采用了基于Blackwell架构的GB 202 GPU。GPU包含92,2亿个晶体管。这比GeForce RTX 4090的核心AD 102还要大,它拥有76,3亿个晶体管。然而,GB 202的增长并不是由于新工艺的转变,GB 202与其他Blackwell游戏GPU一样,使用相同的5 nm TSMC工艺,与GeForce RTX 40系列显卡一样。

图片来源:TechPowerUp

晶体管数量的增加更多地可以用 GPU 本身面积的简单增加来解释。AD102 (Ada Lovelace) 的 GPU 为 609 mm²,而 GB202 的面积为 744 mm²,是仅次于 TU102 代图灵的第二大消费类显卡 GPU,面积为 754 mm²。同时,新款 GB202 GPU 的晶体管密度甚至低于其前身 - 1.239 亿/mm²,而 AD102 为 1.253 亿/mm²。

图片来源:TechPowerUp

GB202 GPU 包含 21,760 个 CUDA 核心(比 RTX 4090 多 33%)、680 个纹理单元、192 个光栅化单元、170 个 SM 单元、680 个第五代 Tensor 核心和 170 个第四代 RT 核心。GPU 的基本频率为 2017 MHz,最高频率为 2407 MHz。但是,正如实践表明的那样,在游戏中,新奇性提供了更高的频率。GeForce RTX 4090 产生 2750 MHz,尽管声称为 2520 MHz。Blackwell 系列的旗舰配备了 32 GB 的新 GDDR7 内存,每针速度为 28 Gbps,并支持 512 位接口。得益于此,RTX 5090 的内存带宽比其前身高 78%,为 1.79 TB/s。

该卡声称的功耗为 575 瓦,比 RTX 27 高出 125%(4090 瓦)。Nvidia 建议使用至少 1000 瓦的电源。GeForce RTX 5090 配备一个 16 针辅助电源连接器、PCI Express 5.0 x16 接口,以及外部 DisplayPort 2.1b 和 HDMI 2.1a 连接器。

GeForce RTX 50 系列显卡的主要特点之一是对多帧生成 (MFG) 的独家支持。与随 GeForce RTX 40 系列显卡发布而出现的第一代帧生成器不同,新的生成器为每个传统渲染的帧创建不是一个,而是三个额外的帧,以提高 FPS。但更多内容见下文。

GeForce RTX 5090 在 1080p、1440p 和 4K 下的相对性能

GeForce RTX 5090 无疑是一款专为 4K 游戏设计的卡,具有最高质量和光线追踪设置。因此,这款显卡的大多数评论都更侧重于这种分辨率。因此,TechPowerUp 门户的游戏测试表明,在纯光栅性能(不包括 RT 和 DLSS)方面,GeForce RTX 5090 提供的性能比 GeForce RTX 35 高出 4090%。当然,这令人印象深刻,因为传统上,不同代的 Nvidia 旗舰之间的性能提升约为 25%。然而,这种增长比从 GeForce RTX 3090 Ti 切换到 GeForce RTX 4090 时要少。根据 TechPowerUp 的测试,各代之间的性能差异约为 51%,根据其他评论者的说法,差异甚至更大。全新 GeForce RTX 5090 的速度是 RTX 3090 Ti 的两倍。视频卡没有竞争对手,因此不是预期的。最接近的 Radeon RX 7900 XTX 落后高达 75%。想想看。

4K 性能

查看全部16 张图片

由于 AMD 基于 RDNA 9070 架构的新 Radeon RX 4 系列卡有望提供介于 Radeon RX 7900 XT 和 RX 7900 GRE 之间的性能,因此新款 RTX 5090 的速度至少是 AMD 最强大的下一代卡的两倍。与 Nvidia 第二快的显卡 Ada Lovelace 的一代 GeForce RTX 4080 相比,RTX 5090 具有 72% 的优势。所有这些都是栅格性能。

以下是 1440p 和 1080p 分辨率的游戏测试结果,其中新卡也是无可争议的领导者。但值得重复的是,GeForce RTX 5090 对于使用分辨率低于 4K 的显示器的人来说不是必需的。在这种情况下,最好的解决方案是先更新显示器,或者更好的是 - 整个 PC,然后才仔细看看新的 Nvidia 旗舰。

1440p 性能

查看全部18 张图片

1080p 性能

查看全部17 张图片

Nvidia 在 Blackwell 的光线追踪方面做了大量工作。开启这项技术时的性能损失水平低于 Ada Lovelace 显卡。

1080p、1440p 和 4K 下的光线追踪 (RT) 性能

查看全部27 张图片

该公司还添加了几种可供游戏开发者使用的新优化方法。其中最有趣的是神经渲染,通过 Microsoft DirectX API(合作向量)实现。这确保了该功能将可供所有显卡制造商使用,并且其使用将仅取决于游戏开发人员的动机。RTX 5090 的 4K 光线追踪性能比 RTX 4090 快 32%。AMD 最快的显卡 Radeon RX 7900 XTX 在这方面慢了 2.5 倍。

DLSS 4性能(带光线跟踪/路径跟踪)

图片(4)4 张图片

自2018年首次亮相以来,NVIDIA的深度学习扩展技术(DLSS)已经发展到第四个版本。它的最新迭代采用了变形金刚AI模型,这使得许多新功能得以实现,包括多帧生成(MultiFrame Generation,MFG)。后者允许每个传统绘制的帧创建最多三个额外帧,以提高FPS。MFG是Blackwell的独家显卡,就像GeForce RTX 40系列显卡的第一代帧生成器一样。关于这项技术的详细信息-需要单独的文章。在这里,我们注意到,目前只有5款游戏支持此功能。这是Cyberpunk 2077。

在不同显卡上操作光线追踪、缩放、帧生成器(仅限 Nvidia)以及《赛博朋克 2077》中消耗的视频内存量

在 RTX 5090 开始销售时,Nvidia 承诺将推出 75 款支持该技术的游戏。这里需要注意的是,多帧生成并不是某种奇迹。是的,它显着提高了游戏中的 FPS(该函数提供了要渲染的额外帧数的多个级别),但同时它增加了输入延迟,因为支持 MFG 的游戏每帧最多绘制三个额外的帧由视频卡实际渲染。因此,如果显卡产生其本机每秒 60 帧,但游戏在屏幕上显示每秒 200 帧,则输入延迟将感觉为每秒 60 帧,而不是每秒 200 帧。与其他 DLSS 4 功能不同,此功能很可能不会出现在前几代的显卡上。

从DLSS 3中的卷积神经网络(CNN)转变为DLSS 4中的变形金刚AI模型,也影响了图像缩放功能。最重要的是,与CNN相比,Transformer型AI模型提供了更高的输出图像质量。根据TechPowerUp的评论家,它真的可以用肉眼看到。DLSS“质量”模式下的图像质量变得如此清晰,在某些情况下,它甚至超过了原始分辨率。在地平线上不再有闪烁或模糊的低分辨率纹理。图像中的细导线会变得清晰,即使原始分辨率低于4K。然而,这一切都有其自身的成本-使用Transformer型AI模型的DLSS性能比使用CNN时低约10%。但最终的规模是值得的。

功耗

谈论2000美元以上的视频卡的功耗,并宣布TDP为575瓦,这有意义吗?本产品的目标受众不太可能注意到这样的“小事”。然而,游戏中的地图消耗了所有声称的能量。在某些情况下,功耗甚至更高,峰值达到644瓦(TechPowerUp数据)。在空闲模式下,单显示器功耗为30瓦,双显示器功耗为39瓦。播放视频需要54W。游戏的功耗约为587瓦(启用RT时为561瓦)。TechPowerUp测试的最大功耗为601瓦。这只是一个图形卡,不考虑CPU、主板和其他PC元素的消耗。

GeForce RTX 5090 Founders Edition 的温度和噪点参考

在参考版本中,根据测试,GeForce RTX 5090 GPU 温度为 77 摄氏度,GDDR7 内存升温至 94 度。同时,风扇噪音为 40.1 dBA,比参考 GeForce RTX 4090 (35.1 dBA) 和 Radeon RX 7900 XTX (39.2 dBA) 还要大。来自 Nvidia 合作伙伴的 RTX 5090 定制版本,配备专有散热器,将提供更低的温度和噪音。回想一下,RTX 5090 参考版的厚度只有两个扩展槽,而卡只配备了两个散热风扇。冷却系统还使用了一个新的三维均温板和液态金属形式的热界面。您可以在此处阅读更多相关信息。

图片来源:Nvidia

GeForce RTX 5090 真的没有替代品。作为新一代显卡的一部分,AMD 甚至决定不试图追赶竞争对手,实际上完全放弃了 Nvidia 解决方案的高级游戏加速器部分。AMD 卡缺乏纯粹的性能,与 DLSS 多帧生成和 transformer 型 AI 缩放模型等功能没有什么可对抗的。目前对 AMD FSR 4 及其功能一无所知。另一方面,RTX 2000 的价格非常高 5090 美元。这比 RTX 400 的建议价格高出 4090 美元。尽管如此,毫无疑问,这些卡的全部库存将完全售罄 - 没有比这更好的了。

来源:A7a369

相关推荐