摘要:前不久我们才刚刚首发评测了NVIDIA GeForce RTX 50系GPU的旗舰RTX 5090 D,系列首发的第二弹产品RTX 5080又来到了MC评测室。有别于RTX 5090 D全是AIC设计生产制造,RTX 5080却是有着NVIDIA自家推出的 F
前不久我们才刚刚首发评测了NVIDIA GeForce RTX 50系GPU的旗舰RTX 5090 D,系列首发的第二弹产品RTX 5080又来到了MC评测室。有别于RTX 5090 D全是AIC设计生产制造,RTX 5080却是有着NVIDIA自家推出的 Founders Edition公版设计产品,而且这次的Founders Edition设计非常精湛,称其为工业艺术品也毫不为过。再加上DLSS 4加持下的超强性能表现,着实让我们“爱惨”了这一款产品。
作为系列第二款上市的产品,GeForce RTX 5080自然是继承了Blackwell架构RTX 50系GPU的一切新特性和特色技术。关于Blackwell架构的详细技术解析我们已经在GeForce RTX 5090 D的首发评测和专门的2万字技术解析文章中进行了最细致的讲解(进入全面AI化的图形时代:NVIDIA RTX 50系列Blackwell架构深入解读),有兴趣的玩家请参考之前发布的文章详细了解。在这里我们只对Blackwell架构的RTX 5080 GPU的特色技术与功能做一个简单总结,供大家参考。
1. RTX 50系GPU带来了DLSS 4多帧生成技术,采用了先进的新模型,相较于先前的模型,帧生成速度提升了40%,同时显存占用量减少了30%。这一技术极大地提升了游戏性能和3D实时渲染性能的表现,为RTX 50系GPU带来了巨大的性能增幅。
2. CUDA Core部分,现在已全面升级为全功能单元。在Blackwell架构的每个SM单元中,计算单元能够执行FP32或INT32计算任务,这种改变显著提升了INT32计算能力的上限,对于那些涉及大量INT计算的应用来说,在Blackwell架构上将获得更优的性能表现。
3. 在Blackwell架构的RTX 50系列显卡上,NVIDIA选择了GDDR 7显存来进一步拓宽显存带宽。在RTX 5080上,在256bit显存位宽和16Gbps GDDR7显存的帮助下,显存带宽峰值来到了960GB/s,相比同容量配置的使用GDDR6X前代产品RTX 4080 SUPER提升了30%。
4. Blackwell引入了神经网络渲染,并公布部分目前比较成熟的应用了神经网络的着色器案例,包括RTX Neural Materials(神经网络材质)RTX Neural Texture Compression(RTX神经网络纹理压缩)、RTX Neural Radiance Cache(RTX神经网络辐射缓存)RTX神经网络辐射缓存、RTX Skin(RTX表皮材质)RTX表皮材质以及RTX Neural Faces(RTX神经网络面孔)等。
5. 核心配置第五代Tensor Core和第四代RT Core,新增了针对FP4、FP6的支持以及第二代FP8 Transformer模型的支持,并支持RTX Mega Geometry (“几何巨块”)处理技术,在处理几乎无限细分的三角形细节时,显著提升了光线追踪的效率。
此外,GeForce RTX 50系GPU还带来了NVIDIA Reflex 2系统延迟降低技术的更新以及新增虚拟补光和录音棚音效的Broadcast进化,并支持4:2:2@10bit视频格式的硬件编解码加速。一系列新技术和新特性的加持也为玩家带来了全新的使用体验。
GeForce RTX 5080 Founders Edition赏析GeForce RTX 5080采用的是次旗舰核心GB203,从目前的资料来看应该是GB 203核心的完整版,包含了7个GPC、42个TPC和84个SM单元,对应10752个CUDA Core。RT Core和Tensor Core的配置分别为84个和336个,显存则和RTX 5090 D一样搭配了最新的GDDR7显存,容量为16GB,位宽从RTX 5090 D的512bit降低到256bit,总显存峰值带宽为960GB/s。从纸面规格上可以看出,相比RTX 5090 D,RTX 5080的硬件规格基本上缩减了50%,理论上它的性能相比RTX 5090 D应该有一倍的差距,也就是说RTX 5080的理论性能大约为RTX 5090 D的50%,这倒也完全符合二者的价格差异。另外就是在编解码器的配置上,RTX 5080相比RTX 5090 D在NVENC编码器上减少了一个,形成了2 NVENC+2 NVDEC的配置。
和前一代的相同定位还略高一档的对位产品RTX 4080 SUPER相比,RTX 5080的硬件规格配置与前者基本相差不大,纸面来看是五五开的局面。不过RTX 5080有DLSS 4这一利器的支持,在DLSS 4游戏或应用中肯定是完胜RTX 4080 SUPER。即使不算DLSS 4,在全新的Blackwell架构更新的CUDA Core和进化的Tensor Core以及RT Core的支持下,RTX 5080的整体性能应该相比RTX 4080 SUPER要强一些,到底强多少,有待我们的实际测试验证。
接下来看看本次测试主角——NVIDIA GeForce RTX 5080 Founders Edition(后文简称RTX 5080 FE)。坦白讲,在我们拿到它开箱的第一个瞬间,就被它给迷住了。真的,一点都不夸张。如果说以往的NVIDIA Founders Edition公版产品设计是十足的科技感——无论是RTX 20系的“煤气灶”还是RTX 30和40系的正反风道设计,那么这次RTX 50系的Founders Edition显卡给我们的感受则是——一款融合科技与美学的艺术品!
首先,在包装方面,RTX 5080 FE采用了100%环保的方式,环保外纸箱和明显一看就是由环保材料制成的内包装纸盒非常好地切合了当下关注度非常高的环保主题,而且也展现了NVIDIA作为IT产业内领军人物的责任与担当。而且这种包装方式非常简洁,取放显卡也非常方便,赢得了编辑部的一致赞誉和认可。
虽然一眼就能看出这是NVIDIA的Founders Edition 公版显卡,但是这次的Founders Edition却带给了我们许多全新的感受与体验。NVIDIA在RTX 5080 FE显卡的细节上进行了许多用心的打磨和调节,首先是整体显卡设计更加圆润和纤细,在厚度方面仅有40mm左右,相比RTX 4080 SUPER FE减少了约三分之一,从三槽卡变为了令我大爱的双槽卡。其次,在外框的设计上,NVIDIA对RTX 5080 FE进行更加精细和圆润化的打磨,尤其是在棱角部分打磨得更加细致,并移除了正面的散热片设计全部后置,让RTX 5080 FE整体呈现出了珠圆玉润的碧玉之风。同时,正面和背面的X装饰条仍然被完整地保留了下来并加以进一步的美化设计,整体形象更加精致且和谐。而且RTX 5080 FE 304mm×137mm×40mm的尺寸是完全符合SFF-Ready规范的,说明玩家可以轻易将其塞进SFF-Ready的小型机箱内。
NVIDIA此次摒弃了RTX 40高端FE显卡的正反双风扇设计,改为正面双风扇的散热结构,搭配背面X装饰条双侧的散热切口以及顶部的散热开孔,能起到非常不错的散热效果。
除了顶部的GeForce RTX Logo带有传统的白色LED灯效之外,RTX 5080 FE在正面和反面的X装饰条周围也添加了白色LED灯效,让显卡整体的氛围更加优雅,相信会深得爱好“光污染”的玩家的喜爱。不过和之前的FE显卡一样,灯效并不能自定义或自主开关。
应该是为保持外观整体的美感与一致性,RTX 5080 FE将电源接口设计在了顶部,并采用了隐藏式的斜插设计。接口是12VHPWR的改进版——12V-2×6接口。
视频输出部分则是和RTX 5090 D一样的3×DP2.1b+1×HDMI 2.1b的组合。DP2.1b接口支持UHBR20,当启用DSC之后,RTX 5080 FE的单个DP接口可以输出4K@480Hz 12bit的HDR视频或8K@165Hz的12位HDR视频,最大支持4个显示设备的连接。
▲RTX 5080 FE的基础频率为2295MHz,Boost频率为2617MHz,显存为16GB GDDR7,等效显存带宽960GB/s,显卡支持PCIe x16 5.0规范。
NVIDIA GeForce RTX 5080 Founders Edition产品资料
核心架构:Blackwell
核心代号:GB203-400
制程工艺:TSMC 4N
CUDA Core:10752
RT Core:84(第四代)
Tensor Core:336(第五代)
核心基础频率:2295MHz
核心Boost频率:2617MHz
显存容量:16GB GDDR7
显存位宽:256bit
显存带宽:960GB/s
NVENC:2个(第九代)
NVDEC:2个(第六代)
输出接口:3×DP2.1b+1×HDMI 2.1b
TDP:360W
首发指导价格:8299元
好,知道大家都有些急不可耐了。那我们也不再废话,进入大家最想看的评测环节吧。在实际测试体验部分,我们主要考察RTX 5080 FE在游戏性能、AI性能和设计创作能力三方面的综合表现。同时为了有一个相对清晰的性能参考线,我们也将上一代的高端产品RTX 4080 SUPER FE加入了对比(RTX 4080 SUPER性能稍稍略强于RTX 4080,且RTX 4080基本已经退市,并且RTX 4080 SUPER也是现在显卡市场上的热门产品,基本可以看作是RTX 5080的前后换代对位产品)。
测试平台
GPU:NVIDIA GeForce RTX 5080 FE、NVIDIA GeForce RTX 4080 SUPER FE
处理器:AMD锐龙7 9800X3D
主板:ROG STRIX X870-A GAMING Wi-Fi吹雪
内存:七彩虹影DDR5 6000 16GB×2
硬盘:长江存储致态TiPro9000 SSD 2TB
电源:ROG THOR 1200W
显示器:戴尔UP3218K(7680×4320@60Hz)
操作系统:Windows 11 24H2
驱动程序:NVIDIA Game Ready Driver 572.12
DLSS 4站C位
性能八倍提升
首先来看RTX 50系GPU的最大黑科技DLSS 4在游戏中的实际性能表现。在这部分测试中我们仍然和RTX 5090 D首发评测时一样,使用了《赛博朋克2077》《心灵杀手2》《星球大战:亡命之徒》和《霍格沃茨之遗》这四款原生DLSS 4游戏以及《龙腾世纪:影障守护者》和《漫威争锋》这两款通过DLSS优设(Override)模式支持DLSS 4的游戏。
▲要开启DLSS优设(Override)模式,首先要进入NVIDIA app,定位到相关游戏或应用程序,在“驱动程序设置”选项下,点击“DLSS优设-模型设置”中选择“最新”,并点击“应用”。
▲此时“帧生成”和“超分辨率”皆显示为“最新”
▲在“DLSS优设-帧生成”选项中,可以设置DLSS多帧生成的挡位,多数游戏和应用中都有3X和4X可选,部分游戏或应用中是2X和4X。
最后回到游戏中开启DLSS帧生成,就能享受到DLSS多帧生成带来的巨大性能提升了。
首先我们用RTX 5080 FE在六款支持DLSS 4多帧生成的游戏中和开启DLSS 3帧生成的RTX 4080 SUPER FE进行了横向比较。从测试结果可以看到,在4K分辨率,DLSS关闭的原生游戏状态下,RTX 5080 FE整体性能平均领先RTX 4080 SUPER FE约11%。但是在DLSS超分辨率平衡模式下,RTX 5080 FE开启DLSS 4之后相比RTX 4080 SUPER FE开启DLSS 3的情况,整体性能领先65%~137%,平均性能领先接近100%,性能增幅十分明显。RTX 5080 FE同比原生帧率,开启DLSS 4平衡模式之后,《星球大战:亡命之徒》的游戏性能提升了7.7倍,《赛博朋克2077》的游戏性能提升也达到了5.5倍左右,性能表现可以说是卓越。1440p分辨率下,开启DLSS 4多帧生成的RTX 5080 FE相比开启DLSS 3的RTX 4080 SUPER FE性能领先也达到了80%以上,相比原生帧率平均性能领先也在4倍以上。DLSS 4的威力得到了充分地体现,可以说它就是RTX 50系GPU的游戏性能的最大核心价值。
我们在《赛博朋克2077》《心灵杀手2》和《霍格沃茨之遗》这三款游戏中详细地测试了DLSS 4多帧生成在不同DLSS超分辨率挡位下的性能表现。从测试结果中可以看到,从DLSS超分辨率质量模式到超级性能模式,DLSS 4开启之后相对原生帧率的性能提升在3.1倍到11.7倍不等。以最常用的平衡模式和性能模式来看,《赛博朋克2077》和《心灵杀手2》的4K分辨率下DLSS 4开启后性能提升分别是6倍和8倍,《霍格沃茨之遗》中的性能提升也达到了3倍以上。
在3DMark DLSS TEST中情况也是如此,开启DLSS 4之后,RTX 5080 FE的游戏帧率在质量模式下提升了5倍以上,在性能模式下的增幅则达到了8倍。对比RTX 4080 SUPER,开启DLSS 4的RTX 5080 FE相比开启DLSS 3的RTX 4080 SUPER FE,性能提升幅度也达到了100%以上。
1440p分辨率下的DLSS 4各挡位画质对比,从左到右依次为原生画质,DLSS 4质量、DLSS 4平衡、DLSS 4性能和DLSS 4超级性能,从截图对比可以看到质量模式和平衡模式下画质几乎没有变化,性能模式也与原生画质相差不大,放大观察有轻微细节损失。超级性能模式下则细节损失相对较多,不建议开启。
同比DLSS 4性能(左)、DLSS 3性能(中)和DLSS 2性能(右),也可以看到在DLSS 4性能模式下,帧率得到了极大幅度提升,但游戏画质几乎没受到影响。
传统游戏性能测试在18款传统游戏性能测试中,我们在同一设置下对比了RTX 5080 FE和RTX 4080 SUPER FE的性能表现。游戏统一设置为最高画质、最高光追效果(路径追踪开)和DLSS 2或DLSS 3的平衡模式,不开启DLSS 4。4K和1440p分辨率下RTX 5080 FE相比RTX 4080 SUPER的平均性能领先在3%~18%之间,平均约在10%左右。
▲3DMark理论性能测试,RTX 5080 FE相比RTX 4080 SUPER FE平均性能领先约为15%。
AI性能测试和RTX 5090 D首发评测一样,我们仍然用UL Procyon对RTX 5080 FE进行文生图AIGC性能和文本生成性能进行测试,同时也用ML Perf对其进行了AI应答文本生成性能的测试。
在ML Perf的四个AI文本生成测试中,RTX 5080 FE在文本生成速度上性能领先RTX 4080 SUPER约16%,在第一文本单元响应时间上领先RTX 4080 SUPER FE达33%。
UL Procyon AI TEXT Generation是一项针对AI文本生成计算测试的内容,也隶属于UL Procyon测试套件中的一部分。在本次测试中,我们将使用大小不一的四个模型进行AI文本生成测试,它们有不同的架构,同时也代表了不同类型的应用场景。
Phi-3.5-mini-3.8B (约2.3GB): 微软推出的这一模型,在本次基准测试中是被测试模型中最小巧的,可被视为SLM(小型语言模型)性能的典范。这些模型旨在快速响应、占用内存少,并且能够在入门级消费硬件上本地运行。尽管体积小巧,该模型依然展现出强大的性能,通常适用于硬件资源有限的计算环境。
Mistral-7B-v0.2 7B (约3.8GB):源自Mistral AI的这一模型属于大型模型之列,其模型架构和推理过程都相对复杂。相较于其他流行的大型语言模型(LLMs),它展现出独特的性能特点,通常反映了那些与主流模型架构略有偏差的大语言模型的性能水平。
Llama -3.1 8B (约5.6GB): 该模型由Meta于2024年7月推出,是本次测试套件中最新推出的大型语言模型。它融合了众多前沿的优化技术和架构创新,模型共有三种不同规模可供选择:8B、70B和405B。受限于硬件资源的约束,8B模型因其较高的普及度而成为最受欢迎的版本。对于那些使用普通消费级硬件的用户而言,若期望获得卓越的AI计算性能,此模型无疑是一个极佳的选择。
Llama-2 13B (约7.4GB): Llama 2于2023年7月推出,是该基准测试中测试过的最老旧且规模最大的模型。自发布以来,Llama 2广受欢迎,基于Llma-2模型的多种变体已成为过去一年中构建的大多数流行模型的基础。可以说,Llma-2是上述列出模型中最广泛部署的,对于各种基准测试而言,它极具吸引力。模型13B的规模接近于大多数消费级GPU能够处理的极限,它也能够充分展示资源密集型模型在强大硬件支持下的性能潜力。
在测试过程中,UL Procyon将依据这四个模型执行一系列AI计算任务,包括创意写作、代码审查与优化、情感识别、文档摘要、文档分析总结以及创建信息文本等,并据此得出性能评估得分。性能展示的最终结果将主要依据总得分、第一个文本单元的响应时间(秒)以及文本单元的平均输出速度(文本单元/秒)来进行衡量。
在UL Procyon AI TEXT Generation测试中,Phi 3.5小模型测试RTX 5080 FE领先RTX 4080 SUPER约为5%,但在Mistral 7B、Llama-3.1 7B和Llama-2 13B大模型测试中,RTX 5080 FE性能领先RTX 4080 FE达到了20%以上。
再来看UL Procyon AI Image Generation文生图的AIGC性能测试。测试中我们选取了传统的SD 1.5和SD 1.5-XL模型,在FP16和IN8两种精度格式下的测试,另外还选择了FLUX.1 DEV的FP8和FP4精度格式模型进行了FP8和FP4算力的测试。
从测试结果可以看到,在传统的FP16精度格式的SD 1.5和SD 1.5-XL模型下,RTX 5080 FE的性能平均领先RTX 4080 SUPER FE约11%,在SD 1.5 IN8精度格式模型下,RTX 5080 FE的性能领先RTX 4080 SUPER FE达到了35%左右。RTX 5080 FE在INT8精度格式的计算能力上优势更加明显,性能远胜RTX 4080 SUPER。
在基于FP8和FP4精度格式下的FLUX.1 DEV模型测试中,FP8精度格式计算RTX 5080 FE领先RTX 4080 SUPER FE约11%,但在FP4精度格式计算性能上,RTX 5080 FE的整体性能领先RTX 4080 SUPER FE 3倍以上。这也很好地再次验证了RTX 50系GPU的CUDA架构在FP4精度格式的AI推理计算上有着无与伦比的巨大优势,而且在今后应该也会成为业内的主流。
设计创作性能测试在设计创作性能测试部分,我们用Davinci Resolve 19进行视频编解码性能测试,主要测试RTX 50系新支持的4:2:2源视频的编解码性能,同时也和RTX 4080 SUPER做对比测试了传统的视频转码性能。在3D渲染性能测试上,则选择了Blender Opendata Benchmark、V-Ray 6和D5渲染器进行了3D渲染性能的测试。
首先看视频编解码性能测试。在4:2:2视频的编解码性能测试中,RTX 5080 FE在4:2:2@10bit视频编码转码H.265格式输出测试中性能达到了传统Voukoder软件编解码方式的15倍,即使在4:2:2视频转码H.264输出的测试中,RTX 5080 FE的性能也是Voukoder软件编解码的3倍以上。
在和RTX 4080 SUPER FE的转码性能对比测试中,RTX 5080 FE的性能领先也达到了25%~100%,平均领先幅度在70%左右。可见进化后的第九代NVENC和第六代NVDEC拥有更强的、强势领先的性能表现。
在D5渲染器的测试中,我们先选择了一个非常复杂的场景——日式花园和一个相对简单一些但也有复杂地貌渲染的场景下雨的庭院进行了测试。
测试结果表明,在默认的渲染状态下,RTX 5080 FE在性能上相比RTX 4080 SUPER FE有8%左右的性能领先幅度。不过我们通过Override模式开启DLSS 4之后,同比DLSS 3状态下的RTX 4080 SUPER FE,性能领先程度则飙升到了80%以上。开启DLSS 4之后,另外一个可以明显看到的情况是1%Low fps的巨大提升,两个场景下的1%Low fps从21fps和36fps分别提升到了74fps和120fps的程度,使得开启DLSS 4之后的渲染过程非常流畅,没有任何卡顿的情况发生。(关于1%Low fps我们在RTX 5090 D的首发评测中已经有了详细讲解,请大家参考新皇诞生,显卡步入全面AI图形时代——NVIDIA GeForce RTX 5090 D首发评测)
Blender Opendata Benchmark测试中的平均性能RTX 5080 FE领先RTX 4080 SUPER FE约8%,在V-Ray 6.0.0.1的测试中,RTX 5080 FE性能领先RTX 4080 SUPER FE则达到了23%。
温度与功耗最后来看RTX 5080 FE的散热控制和功耗表现。在满载烤机的状态下,RTX 5080 FE的功耗拉到了360W的TDP设计规范还略有超出,不过在游戏状态下,功耗为325W,尤其是开启DLSS 4之后,游戏内功耗仅为275W,可见RTX 5080 FE的能耗比还是相当不错的。
在散热部分,尽管RTX 5080 FE设计为较为轻薄的双槽卡,但它的散热性能还是很不错,满载烤机状态下,GPU的温度也不过68℃,结合360W的TDP以及轻薄的外形,我们认为这算是一份比较优秀的答卷了。
测试完毕,给想偷懒的同学做个简单总结吧。
1. DLSS 4仍然是RTX 5080 FE的最大倚仗。在DLSS 4开启状态下,RTX 5080 FE能够在最高光追效果甚至开启路径追踪,最高画质的设置下,打开4K分辨率畅玩一切3A级游戏大作,而且可以将帧率保持在100fps以上,成绩十分耀眼。在3D渲染设计创作中打开DLSS 4,更是能让渲染工作和任务取得事倍功半的效果。
2. 在传统游戏性能方面,同比前一代产品RTX 4080 SUPER,RTX 5080 FE的性能领先程度约为10%上下。尽管这不能说是一个让人非常兴奋的性能提升幅度,但别忘了RTX 5080 FE额外还有DLSS 4的加成,同比DLSS 3状态下的RTX 4080 SUPER FE,开启DLSS 4之后RTX 5080 FE的游戏性能可以领先RTX 4080 SUPER FE高达80%甚至100%以上。
3. Blackwell架构的FP4精度格式模型推理计算能力大幅强化,让RTX 5080在面对类似AI计算时表现出了非常强悍的性能体现,性能领先RTX 4080 SUPER可以达到3倍以上。
4. 最后必须再次“吹捧”RTX 5080 FE的外观设计。是的,它太帅了!就个人情绪宣泄表达而言,它是我见过的设计最完美、最能戳中内心柔软处的一款公版显卡。轻薄的双槽设计、完美的曲线、改进后的正反面框架乃至隐藏式的电源接口都让RTX 5080 FE不管是在整体还是细节上的表现,都非常优秀。
如果RTX 5080显卡大量上市,那么毫无疑问,它所面对的换代目标肯定是RTX 4080 SUPER。前面也讲过,RTX 5080 FE虽然纸面性能相比RTX 4080 SUPER FE的提升在10%左右,谈不上让人喜出望外。但考虑到RTX 5080的首发价格为8299元,仅比RTX 4080 SUPER的首发价格高200元,价差甚至只有2.5%,光是这一点而言,RTX 5080毫无疑问就是更有性价比的选择。何况在DLSS 4的加持之下,RTX 5080随时都能变身性能怪兽,直接碾压RTX 4080 SUPER。从游戏市场的生态发展来看,DLSS 4绝对是未来一两年内游戏行业的主旋律,而且在Override模式的“外挂式”支持下,更多游戏也必然会陆续加入DLSS 4的阵营,未来已经是肉眼可见的可期。
所以,我们认为,RTX 5080上市之后,必然会成为高端消费级显卡市场上的热门产品——性能更强,价格相差不大,而且还手握DLSS 4、FP4精度格式AI推理计算、4:2:2视频硬件解码等通向未来的密码,我实在想不到有什么理由还要考虑RTX 4080 SUPER,它很可能会成为当前高端游戏显卡市场的最好选择。
最后说点题外话,相信玩家们也注意到了RTX 5080和RTX 5090 D之间在硬件规格上存在50%左右的较大差异,而且8299元和16499元之间也存在巨大的价格断层空间。所以基本可以肯定,RTX 5080和RTX 5090 D之间肯定还存在至少两款细分产品,至于是RTX 5080 SUPER、RTX 5080 Ti还是RTX 5080 Ti SUPER,就不得而知了,静待后续市场反馈吧!
来源:微型计算机