摘要:凭借着足够的性能和更亲民的定价策略,每一代的 60 系列显卡都是万众期待的甜点卡,60Ti 系列作为进阶版的 60 也备受关注,全新一代 RTX 5060Ti 今天正式解禁,英伟达为其带来了多达 16GB GDDR7 显存,不管你是想通过 DLSS4 畅玩 4
凭借着足够的性能和更亲民的定价策略,每一代的 60 系列显卡都是万众期待的甜点卡,60Ti 系列作为进阶版的 60 也备受关注,全新一代 RTX 5060Ti 今天正式解禁,英伟达为其带来了多达 16GB GDDR7 显存,不管你是想通过 DLSS4 畅玩 4K 游戏,还是希望用更低的价格运行 AI 任务,RTX 5060Ti 都会是你无法忽略的选择,本期《内行评测》,我们一起来看看七彩虹 iGame GeForce RTX 5060 Ti Ultra W OC 16GB 的表现如何。
硬件与技术升级首先来看看 RTX 5060Ti 的主要规格,相对于上一代 RTX 4060Ti 的 AD106 核心,RTX 5060Ti 的 GB206 在 CUDA 数量、频率、Tensor Core、RT Core 以及 ROPs 等硬件规格上其实没有特别多的提升,单纯看这张规格表,GDDR7 显存带来的改善反而更加可观,在显存位宽不变的前提下,显存速率从 18Gbps 提升到了 28Gbps,显存带宽从 288GB/s 冲到了 448GB/s。在表格之外,RTX 4060Ti 16GB 版本上市时候的价格是 3899 元,同样显存容量的 RTX 5060Ti 甚至降价了 300 元。
相较于RTX 40 系列显卡Ada Lovelace架构下的SM单元,RTX 50 系列显卡Blackwell架构下的SM单元在CUDA、Tensor Core、RT Core上都有不小的提升。首先是CUDA核心,虽然对比RTX 40 系列显卡来看,RTX 50 系列显卡一个SM单元内的CUDA数量并未发生改变都是128个,但RTX 50 系列显卡的每一颗CUDA核心均具备处理FP32和INT32的能力。
其次是升级至第五代Tensor Core,这一代的Tensor Core引入了对FP4和第二代FP8等低精度数据格式的支持。一方面低精度数据在运算速度上有天然优势,另一方面低精度数据的应用也有效降低了各类模型对于显存空间的占用。并且,在RTX 50 系列显卡上,着色器可以同时调用CUDA和Tensor Core的数据处理能力。
正因如此RTX 50 系列显卡上的着色器也迎来了升级,英伟达把它称为神经网络着色器(Neural Shaders)。在神经网络着色器的帮助下,图形渲染管线上的数据将被重新排列并分类,然后交由CUDA和Tensor Core同时处理,这当然也大幅提升了图形渲染的效率。
同时英伟达还赋予了神经网络着色器AI学习的能力。相较此前基于固定光照模型的渲染,神经网络着色器可以通过训练AI模型来学习复杂的渲染过程,最终实现动态调整、实时优化画面渲染效果。
最后RT Core也在RTX 50 系列显卡上升级至了第四代。第四代RT Core引入了三角形集群求交引擎、三角形集群解压引擎、线性扫描球体三个全新的引擎。
其中两个三角形集群引擎主要服务于Mega Geometry功能,线性扫描球体则是为了优化动物毛发、植物枝叶等曲线形态的光照效果,而它们的共性均在于用更少的算力来实现更加顺滑且真实的光照效果。这里我们举个运用Mega Geometry功能的例子,如果你以第一人称视角游玩游戏,第四代RT Core会将你眼前的容易发现细节变化的部分画面用高精度模型来还原光照效果,而在远处不容易发现细节变化的部分画面则用低精度模型来还原光照效果,这样整个画面的光照变化就会更加迅速且符合人眼逻辑,同时也降低了算力上的损耗。
了解完硬件架构上的提升,是时候展开分析一下英伟达为RTX 50 系列显卡量身定制的重磅技术,相信也是大家最关注的重点——DLSS 4是如何实现的?
相较于DLSS 3,DLSS 4的底层模型发生了巨大转变,由传统的卷积神经网络(CNN)升级成了现如今在AI大模型领域被广泛应用的Transformer架构模型。Transformer模型的自注意力机制可以提升显卡对图像全局结构和画面细节的掌控能力;更好的上下文理解可以提升显卡对动态场景(运动模糊)和复杂光线场景(高对比度区域)的处理能力,减少画面伪影;Transformer模型还能通过分析低分辨率图像的特征,更加精准的重建出高分辨率图像中的细节。简单点说,就是RTX 50 系列显卡在Transformer模型的助力下,运用AI技术实现了多帧合成、细节增强且具备运动补偿能力的新一代超分辨率技术。
DLSS 4中另一个感知更强的技术是Multi Frame Generation,也就是多帧生成。与DLSS 3上的帧生成相同的是,DLSS 4上的多帧生成仍需要收集帧与帧之间运动、深度、信号偏移、曝光、光流等海量信息。与DLSS 3上的帧生成不同的是,DLSS 4上的多帧生成不再需要额外的光流加速器硬件,而是直接通过AI计算生成。在RTX 50 系列显卡强大AI算力的支持下,现如今的多帧生成最多可在两个原生帧之间补充三帧。并且由于补充帧不再经由光流加速器,而是直接进入渲染管线,也有效降低了补帧带来的延迟。
至此想要让玩家更加放心的使用DLSS 4功能,英伟达还需解决两个问题,一个是补帧不规律带来的卡顿,另一个则是补充多帧带来的操作延迟。
为了减少补帧不规律带来的卡顿问题,英伟达在Blackwell架构中引入了Flip Metering硬件。DLSS 3中生成帧的控制逻辑其实是先由CPU处理后再反馈给GPU,Flip Metering的出现让RTX 50 系列显卡自身就可以处理生成帧的控制逻辑,这样就避免了CPU与GPU间传输信息所产生的通信延迟。同时,Flip Metering还能优化生成帧的显示时序,确保生成帧以更平滑的方式呈现,减少视觉上的卡顿和撕裂。
前面我们讲到过DLSS 4的多帧生成从底层逻辑上就比DLSS 3的帧生成延迟要低,但补帧,尤其是补多帧,总归避免不了延迟增加,于是英伟达将Reflex也升级至了第二代。Reflex 2不仅优化了上一代的GPU渲染队列管理,根据输入的紧急程度动态调整GPU任务的优先级,还引入了Frame Warp技术。如何简单理解Frame Warp技术,就是在多帧生成的过程中优先参考鼠标等外设的移动信息去生成下一帧,以达到减小延迟的目的。
技术解析到这,想必大家已经能看出来英伟达在设计RTX 50 系列显卡时的思路转变,没错,这就是全面拥抱AI的一代显卡。DLSS 4各项功能的AI提升,让RTX 50 系列显卡更加拥有战未来的可能性。在RTX 50 系列显卡发售的当天就会有75款主流游戏、应用支持DLSS 4功能。我也相信像DLSS 4这种其实是帮厂商减负的功能,在英伟达的大力推动下,未来会有越来越多的游戏和应用加入进来。
七彩虹 iGame Ultra 系列这套设计我们已经在之前的 50 系列显卡上看过多次了,RTX 5060Ti 继承了这套“HIP-HOP”艺术风格设计,纯白色的装甲上勾勒了大量的粉色线条,粉色和白色的浮雕穿插于装甲表面,在卡身上还运用了透明的亚克力材料,让整套设计看起来更为灵动、更加年轻,与众多采用单一色调外观设计的显卡形成鲜明对比。
显卡正面采用了三枚 90mm 环形扇叶,配合内部大面积鳍片和 4 根 6mm 回流焊热管组成了整体散热模块,这样的规模压制 RTX 5060Ti 还是绰绰有余的。
显卡背面同样以白色作为主色调,运用粉色的夸张字体将“Ultra”字样镌刻在背板表面,右侧的镂空使显卡最外侧风扇实现了贯穿风道,能够进一步提升显卡的散热表现。
显卡侧面同样设计了大量的 Ultra 元素,运用不同色彩、不同类型的字体突出显卡的嘻哈设计风格。另外,在 iGame GeForce RTX 5060 Ti Ultra W OC 16GB 上采用了传统的 8pin 供电接口,老平台可以无忧升级。
显卡侧面支持 ARGB 灯光联动,侧面的灯光亮起来后显卡看起来更加灵动多姿。
显卡尾部同样是浮雕+粉色字体的设计,七彩虹这一套设计的细节非常到位,显卡的各个角落都能看到嘻哈的设计元素,把嘻哈律动的风格贯穿到了设计始终。
接口方面是熟悉的 3 个 DP 2.1b+1 个 HDMI 2.1b,以及七彩虹独有的一键超频按钮,超频后显卡功耗将从 180W 来到 200W,最高频率从 2572MHz 冲到 2632MHz。
测试平台介绍为了更好地展示七彩虹 iGame Ultra 的设计文化,我们这一次也是搭建了一套 iGame Ultra 全家桶主机,CPU 选用了 Intel 最新的旗舰处理器酷睿 Ultra 9 285K,配合七彩虹 iGame Z890 ULTRA V20 DDR5 主板、2×24GB 8000MHz DDR5 内存,在宽敞明亮的 iGame C25H Ultra Z 海景房机箱里面进行测试,下面来详细了解一下本次测试平台的硬件。
七彩虹 iGame Z890 ULTRA V20 DDR5 主板在外观上有很明显的 iGame Ultra 家族设计风格,主板上覆盖了大面积幻彩散热马甲,在不同光线角度下会有不同色彩表现,供电规模升级至 20+1+1+1 相,轻松驾驭 Ultra 9 规格的顶级处理器,通过加厚镀金触点和线路优化等方式,增强了板条之间信号传输的完整性,让内存超频空间有了大幅提升,主板支持至多 5 个 M.2 硬盘位,存储能力拉满。
内存采用了两条 iGame 影 DDR5 8000 C40 24G,水墨设计风格在市场上独树一帜,采用特挑海力士颗粒,10 层 PCB 设计提升了兼容性和稳定性,8000MHz 的频率可以充分发挥 CPU 的性能,进一步提升游戏帧率。
半封闭的铝合金装甲设计控制了灯光方向,不与 CPU 散热器的灯光产生纠缠,更方便海景房机箱的整体灯效调整。
SSD 选择 COLORFUL CN700 Pro 1TB,作为七彩虹的当家旗舰 SSD,CN700 Pro 基于 PCIe 4.0 规格,采用联芸 1602 主控、长江存储 X3-9070 颗粒,读速超过了 7000MB/s,至高可选 4TB 版本。SSD 正面包裹了四层堆叠石墨烯散热贴,为持续高性能运行提供了有效的散热保障。
CPU 散热器采用 iGame LQ360 Ultra W 2025,360mm 的冷排规模,配备三颗 120mm ARGB 风扇。
水冷头支持无限镜效果,内部延续了 iGame Ultra 系列的字体设计,风格统一性极高。
机箱风扇采用三反叶+四正叶的组合。
机箱风道主要由三把 iGame F12025 ARGB Ultra LITE 正叶+三把 iGame F12025D ARGB Ultra LITE 反叶组成,反叶扇置于机箱底部,负责进风,正叶扇置于机箱侧面,与顶部冷排风扇和侧面的 120 风扇一起负责出风,扣上侧板之后,形成一套垂直的散热风道。风扇支持 PWM 调速,正叶扇可在 400-1800RPM±20% 之间调节,平衡噪音与散热效果,最大风量 62.3CFM,最大噪音 29.12dB,反叶扇的转速区间是 500-1800RPM±20%,风量 49.72CFM,噪音 34.79dB。
后置排风扇采用 iGame F12025 ARGB Ultra W,相比 Lite 版本,它的外观设计更加符合 iGame Ultra 家族的调性,风扇四个角采用渐变色彩设计,同样支持 ARGB 灯效,安装方式是更加友好无损的精致螺杆+螺帽。它的性能也更好一些,调速范围从 700 到 2000RPM±20%,最大风量 63.31CFM,最大噪音 34.12dB。
电源方面采用了定位中端市场性价比突出的鑫谷无界 M650W 金牌电源,650W 额定功率可以充分满足 RTX 5060Ti 显卡的供电需要,采用高规格 105℃/420 主电容,支持主动式 PFC 保护,配备成熟多重保护策略,内置 120mm 液压轴承风扇,运行噪音低于 31.84dB(A),还支持 Al Cooler 智能温控电路,持久稳定运行无压力。40000Hrs 超长风扇寿命配合 5 年无忧售后支持,金牌主流电源性价比之选。
机箱是构建整个平台最关键的选择之一,iGame C25H Ultra Z 海景房机箱在外观上传承了 iGame Ultra 的设计风格,将活泼跳跃的嘻哈元素巧妙地融合在海景房机箱的玻璃面板之上,无 A 柱设计大大提升了通透感,内部硬件一览无余。
机箱的侧板均支持快拆设计,装机过程更简单,不必担心空间局促影响操作。
这些配件都可以通过 iGame 自在星球软件进行统一的灯光调整,iGame 自在星球软件还可以监控电脑状态,进行显卡超频等操作,是一套非常完善的全家桶装机方案。
这一套七彩虹 iGame Ultra Family 在外观颜值上非常突出,无 A 柱设计的机箱让内部硬件一览无遗,同家族系列设计一脉相承,喜欢海景房,注重桌搭效果的玩家可以考虑直接抄作业。
本次测试依然使用来自 HKC 的 QG32UK 31.5英寸 WOLED 旗舰双模电竞显示器,采用 LG 原厂 WOLED 面板,支持 4K 240Hz 或 1080P 480Hz 双模显示,WOLED 面板天生的高速高对比优势,让其拥有了 0.03ms 响应时间和 HDR True Black 400 影像体验。机身纤薄,背部配备环形 RGB 灯带,兼顾性能和颜值。
性能测试本次测试我们以上一代 RTX 4060Ti 8GB 版本作为对比项目,相对于 16GB 版本,二者仅在显存容量上存在差异,其它的核心规格可以视为相同。测试显卡开启超频模式,频率为 2632MHz。在游戏测试环节中,以游戏提供的默认最高画质为测试设置;在光栅测试中关闭光追、DLSS 选项;在光追测试中开启最高等级光追,关闭 DLSS 设置;DLSS 测试中开启最高等级光追特效。
理论性能在常用的显卡性能评估工具 3DMark 套件中,RTX 5060Ti 16GB 相对上代的平均性能提升达到了 26.3%,提升幅度最大的是 4K 分辨率 DX11 和最新的 DX12U 测试项目,可以看做这是全新的 GDDR7 显存在核心规格提升之外带来的更多福利。
生产力性能RTX 5060Ti 16GB 在开启 GPU 加速后的视频基准性能提升幅度高达 58%,在不开启 GPU 加速的情况下也有 25% 的提升,这是全新的编解码器带来的性能进步。
渲染性能方面的平均性能提升达到了 23.6%,在考验光追能力的 Vray RTX 测试中,提升幅度高达 32.59%,新一代 RT Core 的能力我们在后面的游戏测试中还会见识到。
AI 性能AI 性能我们从 AI 视觉、AI 文生文和 AI 文生图三个方面展开,在基于 Windows ML 的三项测试中,RTX 5060Ti 16GB 平均提升 10.4%,文生文的提升幅度最高达 54.59,由于 RTX 4060Ti 8GB 的显存限制,LLAMA 2-13B 文生文测试盒 FLUX 文生图测试直接无法运行,这也直接说明了 16GB 大显存在 AI 方面的优势。
光栅游戏性能理论上说,定位主流的 RTX 5060Ti 16GB 不是一块面向 4K 游戏的显卡,但是从实测来看,如果你可以接受 4K@60fps 的性能表现,RTX 5060Ti 16GB 在没有 DLSS 的帮助下,也可以满足大量的 4K 游戏运行需要。
在 2K 和 1080P 游戏测试中,RTX 5060Ti 16GB 的平均性能提升分别为 30.7% 和 28.9%,平均帧数分别是 59.7fps 和 145.8fps,提升幅度相对于更高阶的 5070Ti/4070Ti Super 更加可观。
光追游戏性能来到光追游戏环节可以更直观地看到新一代 RT Core 带来的性能改善,像《F1 24》这样在 RTX 4060Ti 8GB 上无法正常玩儿的 4K 游戏,在 RTX 5060Ti 16GB 上能跑到 42fps,常年玩儿 30fps 主机游戏的玩家或许能够接受这样的表现。而在 2K 分辨率下,除了《黑神话悟空》《赛博朋克2077》这样的光追杀手游戏之外,RTX 5060Ti 16GB 都能够保证基础的游戏体验,分辨率进一步降低到 1080P 后,甚至能够达到 80-100fps,是绝对可玩儿的范围。
DLSS 4 性能测试DLSS4 奇迹我们在之前的每一块 RTX 50 系列显卡上都在强调,来到 RTX 5060Ti 16GB 这里,DLSS4 能够直接将 4K 分辨率、最高等级光追的《赛博朋克2077》从 8.33fps 直线拉升到 127.05fps,《霍格沃茨之遗》则可以从 31fps 提高到 208fps,对于不喜欢抠画面细节的玩家来说,DLSS4 直接实现了 3A 游戏的 4K 自由,如果你追求更多的细节,那么在 DLSS 质量+ 4X 补帧的档位上,一样能有不错的游戏画质。简而言之,在 DLSS4 的加持下,RTX 5060Ti 16GB 的定位甚至可以实现一定程度的跃升,从 2K 游戏卡升级为 4K 游戏卡。
总结与之前的几块 RTX 50 系列显卡相比,RTX 5060Ti 16GB 带给我的惊喜值可以说是除了 5090D 之外最大的,其它的显卡我们能够从价格、定位大致猜测出它的性能实力,而定位于 2K 游戏卡的 RTX 5060Ti 16GB,却能够在光栅游戏中实现稳定的 4K@60fps 以上运行画面帧数,在开启 DLSS4 之后,甚至可以实现光追特效下的高帧率 4K 游戏,加上 3599 元的起售价,让主流价位的玩家也能够实现 3A 游戏 4K 分辨率高帧畅玩的梦想,从这个角度来说,DLSS4 对于中端卡的意义甚至高于顶级显卡。
RTX 5060Ti 16GB 的显存容量甚至比定位更高的 5070 还要多,这样赋予了它成为消费级玩家部署 AI 环境显卡的潜力,更大的显存、足够的算力让普通玩家运行本地 AI 大模型也变得更加容易。
而七彩虹 iGame GeForce RTX 5060 Ti Ultra W OC 16GB 在本次测试中的表现也非常出色,显卡运行稳定,一键超频按钮使用方便,iGame Ultra 家族特点鲜明的律动外观设计也在这张显卡上得到了很好地延续,与散热器、机箱、风扇等家族配件放在一起构建出了完整的七彩虹 iGame Ultra Family,配合七彩虹 iGame Center 控制中心配合,既能够快速调整外观灯效,也可以实现电脑状态监控、显卡超频等任务,是非常完善的全家桶软硬件解决方案,喜欢海景房、注重桌搭效果的玩家可以着重考虑 iGame Ultra 家族的系列产品。
最后的最后,从 RTX 5090D 到现在的 RTX 5060Ti,第一批 RTX 50 系列显卡只剩下 RTX 5060 以及 RTX 5050 两款产品没有上市,我们以 RTX 5070 作为基准,通过 3DMark Time Spy 的成绩对已经发布的五款 RTX 50 系列显卡和值得拿出来对比的 RTX 40 显卡做了一个简要天梯图,希望能够对你的购买有所帮助。
以上就是本期《内行评测》的全部内容了,你对这一次的 RTX 5060Ti 16GB 是否满意呢,欢迎在评论区留下你的看法。
来源:什么值得买APP