Xe2核心杀入1440p游戏市场!英特尔新一代Battlemage Xe2架构Arc B580显卡首发评测

摘要:在Alchemist核心的英特尔Arc锐炫独显面世两年之后,新一代基于Battlemage核心的英特尔独立显卡也正式上市。和Alchemist核心相比,全新的Battlemage核心不但采用了更新的Xe2微架构,而且在性能、执行效率以及能耗比等方面相比Alch

在Alchemist核心的英特尔Arc锐炫独显面世两年之后,新一代基于Battlemage核心的英特尔独立显卡也正式上市。和Alchemist核心相比,全新的Battlemage核心不但采用了更新的Xe2微架构,而且在性能、执行效率以及能耗比等方面相比Alchemist核心都有明显的提升,同时Intel XeSS等软件功能也伴随新核心显卡的推出得到了进化。今天,我们就来深入了解一下新的Battlemage核心以及对应的ARC B系列显卡的相关信息,同时也带来了全新一代Arc B580的详细测试。

▲英特尔发布了基于Battlemage核心的ARC B系列独立显卡。

随着AI计算的兴起,GPU已经成为全球最重要的半导体产品之一。作为AI计算的技术基座,GPU得到了AMD、英伟达和英特尔在内的企业的重视。作为大规模独立GPU的后来者,英特尔之前发布基于Xe架构和Alchemist核心的ARC A系列GPU在市场上也得到了不错的反馈。在ARC A系列产品上市2年后,根据之前的路线图,英特尔又发布了Xe 2架构的、基于Battlemage核心的新一代ARC B系列产品。

首发产品包括ARC B580和ARC B570两款,定位中高端市场,提供了比前代产品更出色的游戏性能、光线追踪性能、AI性能以及XeSS 2、XeLL等新功能,同时带来了更好的驱动适配、软件易用性等。

拥抱1440p游戏时代

英特尔ARC B系列GPU正式发布

英特尔的独立大规模GPU芯片在发布后还是得到了消费者的青睐,其ARC A系列GPU产品被广泛用于制造独立显卡、应用在笔记本电脑市场,甚至作为掌机的图形性能来源。经过2年的发展,ARC系列GPU成长为市面上继英伟达和AMD之后的第三股力量。作为现代高性能计算基座产品,GPU的重要性不言而喻,相对应的英特尔也在不断推进GPU的发展。

▲B系列产品主要带来了三大方向的改进。

▲游戏市场也发生了比较显著的变化。

▲使用1440p分辨率也就是2560×1440显示器的游戏玩家已经提升至整个显示器市场的22%。

新的B系列GPU正是基于A系列GPU的市场优势而来。B系列产品主要带来了三大方向的改进,一是全面加强的新一代游戏功能,比如更深入利用了AI计算的XeSS 2。二是带来了最好的单位价格性能,在性价比方面B系列GPU相比竞争对手产品都更有优势。三是结合英特尔在AI加速方面的技术积累,B系列GPU的XMX模块架构得以进化,AI算力和效能都得到了提升。

对广受关注的游戏市场而言,英特尔认为目前游戏市场发生了三个方面的变化,一方面是更逼真的光照效果,比如全景光线追踪、多次反射、材质反射等技术的应用,使得游戏画面的光影效果更为真实。第二个方面是更多细节的图形,比如UE5引擎的广泛使用,带来了细节更多、内容更丰富的游戏图形和娱乐体验。第三个方面则是整体游戏市场,玩家使用的显示器的分辨率在不断提升,2024年,使用1440p分辨率也就是2560×1440显示器的游戏玩家已经提升至整个显示器市场的22%,相对应的,留在1080p分辨率的用户正在逐渐减少。

因此,英特尔的新一代B系列GPU,通过更新架构、扩大规模、提升性能,在带来了三方面的改进的同时,也通过顺应当前市场的发展和变化,为游戏玩家提供符合技术趋势和游戏演进的GPU产品。

全方位更新的Xe 2架构

内部架构大幅度优化,光线追踪性能显著提升

新的ARC B系列GPU的最大变化在于采用了新的Xe 2架构。

▲Xe 2架构带来了很多重要的改进。

▲Xe 2渲染片和架构优化一览。

▲第二代Xe 2核心结构和规格一览。

▲新的XVE核心和上代产品存在显著不同。

▲Xe 2架构的光线追踪单元规模和性能大幅度提升。

▲相比AD架构的SM结构,Xe 2的结构在显示方式上存在很大差异。

Xe 2架构相比前代的Xe架构,主要的改变在于整体拥有更高的架构利用率、内部工作分配机制进行了优化,同时还降低了软件部分的开销。

在发布会上,英特尔展示了Xe 2一个完整的渲染片(Render Slice)架构图。渲染片是B系列GPU的构成基础,类似于英伟达GPU中的GPC。英特尔通过增加或者减少不同的渲染片方案,能够实现针对GPU不同档次产品的缩放配置。比如本次发布的 BMG-G21包含了5个渲染片,ARC B580和B570全部都基于BMG-21芯片。未来英特尔可能还会发布拥有更多渲染片的其他产品。

继续深入渲染片设计。更具英特尔的数据,1个渲染片内,包含了4个Xe 2核心。每个Xe 2核心,又包含了8个XVE和8个XMX。其中前者可以看作包含了INT和FP计算能力的计算核心集群,后者可以看作为AI优化的AI计算核心集群。英特尔在这里做了和英伟达不一样的设计,在英伟达的SM中,每个SM除了包含传统的INT、FP计算能力以及张量AI加速核心外,还包含了光线追踪模块。但是英特尔将Xe 2核心和光线追踪模块至少在架构图上显示为解耦设计,但是依旧采用了1:1的配置方案。也就是1个Xe 2核心配备了1个新的光线追踪单元。除了上述内容外,渲染片外部还配置了指令前端,用于分配所有的计算指令给渲染片中的大规模计算核心。此外海报包括后端的采样、HiZ也就是Z轴剔除以及像素后端等内容。

具体到功能改进方面,英特尔在发布会和架构图上提到了很多细节内容。总的来说,英特尔针对Xe 2的渲染片,主要是整体图形加速方面,从宏观到微观的深入优化,这句话意味着Xe 2至少在效率和性能呈现上应该显著优于前代Xe,其次英特尔还提到整体优化的方法包括减少了内部延迟、减少流水线的卡顿以及大幅度提升了软硬件的协同效应。其实我们也可以看出,同等英特尔和英伟达的GPU,在纸面数据上,英特尔产品甚至更强,但是实际性能则完全不是这样,对于现代的超大规模、动辄十几亿的芯片来说,问题最后呈现的内容,往往不是硬件方面如何设计(当然这也很重要),而是如何让这些硬件都能够发挥出应有的效能。显然在这一点上,AMD和英伟达都具有极为深厚的积累。英特尔在集成显卡、小规模GPU上做得很好,一旦规模放大则问题就会暴露出来,因此这也是英特尔未来需要不断改进的方向。

具体来看的话,Xe 2渲染片层级可以看到的改进包括:

1. 显著增加了每个Xe 2核心的性能,这部分可以从规模、频率上进行提升。

2. 整体Xe 2核心提供了对SIMD 16的支持,这在很大程度上提高了指令使用的灵活性。毕竟再强的编译器和前端,也很难让所有指令都合并为SIMD 32并送入计算单元并行处理,如果不能充分填满整个并行流水线,部分空置的单元会造成比较明显的浪费,SIMD 16能够增加灵活性,提高效率。

3. 整体光线追踪单元的规模显著扩大,算力增加。

4. 几何单元部分带来了3倍的顶点拾取吞吐能力以及3倍 Mesh细分能力,这可能是前代产品的瓶颈之一。

5. 在采样阶段带来了新的2倍吞吐能力,不再依赖于可编程偏移滤波器(Filtering Programmable Offsets)。

6. 后端部分带来了2倍的Blending过程的吞吐能力,同时像素色彩缓存增大了33%,还加入了渲染目标预取等功能。

7. Z轴剔除和压缩相关能力方面,现在Z轴相关缓存增加了50%,并且可以在更早期就开始Z轴剔除,提高了效率。

8. L2缓存部分带来了最高8倍压缩,并且可以执行快速sub-resources的清除功能。

上述改进的综合应用,带来了Xe 2渲染片整体规模、性能以及效率的提升,此外很显然英特尔还在不断增加一些有效的技术来提高整体GPU内部的效率,比如带宽增加、部分结构缓存提升等,这些改进都会带来GPU内部短板、瓶颈的缓解,对外展现出更好的性能。

我们进一步深入Xe 2的计算核心。正如前文所说,英特尔在GPU计算核心的设计上是和英伟达存在显著差异(但并不大)。比如Xe 2核心内部没有光线追踪部分。具体到设计上,Xe 2核心展现出的算力指标是可以并行的8个512bit矢量单元,8个2014bit的XMX单元,以及支持64bit长度的atomic ops。另外,除了原有的读取/加载单元外,英特尔还为每个Xe 2核心增加了256KB的共享L1缓存/SLM缓存,这也能显著带来效能的提升。

英特尔还展示了XVE的内部架构简图。之前的XVE也就是Xe第一代产品设计中,XVE内部有2组单元,每一组包含了寄存器、8个FP单元、8个INT单元、2个扩展数学单元(EM)以及FP64,这两组单元都由1个线程控制器(ThreadeControl)对应的分支单元、指令分派单元空置。但是在Xe 2中,XVE的架构变化很大,原来的2组单元现在合并为1组,整个第二代XVE中包含了寄存器、16个FP单元、16个INT单元、4个EM单元以及2个FP64,此外线程控制器、分支单元、分派单元等均为1个配置。这里的变化在于,之前的Xe虽然支持SIMD 32,但是这些指令进入XVE后,需要在4个模块、2个XVE中并行完成,这带来了一定的延迟和效率降低。现在原生支持SIMD 16并且硬件架构也进行了调整,因此数据流直接选择2个XVE进行计算,XVE内部不再需要分配。

这里的改进可能是涉及了英特尔在内部设计思路上的变化。在第一代产品中,英特尔可能考虑到内部效率的问题,在XVE层面采用了SMID 8的并行方式,两个单元合起来对外表现SIMD 16,2个XVE对外可以实现SIMD 32。虽然理论上来说,并行宽度越窄、利用率越高,但是其中的分派开销也是需要考虑的。英伟达在很早之前就将自己的前端warp宽度设计为32宽,并且到现在也没有变化,可能是考虑到32宽度对现代GPU以及应用环境来说是最合适的,现在英特尔也相应加宽了宽度,理论上会更为适应现代应用的发展。

最后,在Xe 2的XVE方面,英特尔还提到,自己支持3路并行的设计,也就是FP、INT/EM和XMX的数据可以并行计算,并不互相干扰。这在很大程度上也增加了整个单元的灵活性,也是整个计算结构在解耦合耦合之间重新平衡的方法之一。我们也期待测试中能够展示出更好的性能表现。

接下来是光线追踪部分,Xe 2的光线追踪硬件规格得到了大幅度提升。比如3倍的traversal pipeline、18个Box intersections,2个Triangle intersections以及16KB的BVH缓存,这些数据分别是上代产品的1.5倍、1.5倍、2倍、2倍,资源显然更为丰富,整体性能肯定也会得到显著改善。对很多GPU的部分来说,如果整体执行效率不存在瓶颈的话,提升速度的最佳方式,就是堆规模,规模上去了,自然性能就好了,这也是集成电路发展需要更先进制程支持的核心原因。

BMG-G21芯片

Xe 2架构小试牛刀

英特尔还展示了一个完整的BMG-G21的芯片图,可以看到包含了5个完整的渲染片,拥有20个第二代Xe核心、160个XMX单元、20个光线追踪单元、20个纹理单元、10个后端像素单元、18MB的L2缓存以及192bit GDDR6支持等内容。

▲BMG-G21芯片的完整结构图。

▲BMG-G21芯片相比上代产品性能大幅度提升。

▲英特尔给出的Xe 2性能功耗比的提升情况。

▲Xe 2在1440p分辨率下大幅度降低了渲染延迟。

▲Xe 2为支持现代游戏而设计。

英特尔没有在这里提到BMG-G21的工艺和晶体管情况。我们查询资料后得到的信息是,采用了TSMC N5 EUV工艺制造,包含了196亿晶体管,整体核心面积为272平方毫米。使用英伟达的AD106和AD107来进行对比的话:AD106的市售产品为RTX 4060 Ti,拥有229亿晶体管和196平方毫米,AD107的市售产品为RTX 4060,拥有189亿晶体和156平方毫米,工艺都是TSMC N4 EUV(TSMC N5 EUV的改进版,官方数据为N4比N5密度提高6%)。如果这里的晶体管数量和面积均为正确数值的话,那么英特尔BMG-G21的每平方毫米晶体管数量为7205万,RTX 4060Ti和RTX 4060为1.168亿和1.211亿。相比之下,英特尔产品的晶体管密度只有英伟达产品的60%。实际上我们看到,BMG-G21的晶体管数量位于AD106和AD107之间,其最终性能呈现英特尔给出的数据是比RTX 4060更快,但应该低于RTX 4060Ti,从晶体管数量来看假设其设计水平和最终计算效率相当的话,这样的性能表现也是合理的。唯一的问题就是芯片面积。不知道为何BMG-G21的单位晶体管数量如此稀疏,是否和整体架构、频率相关才不得不如此作为?抑或是其他原因等?这个问题就不得而知了。

性能方面,英特尔给出了架构相关的性能提升情况。BMG-G21相比前代产品也就是Xe,带来了70%的性能提升和50%的每瓦特性能提升。

性能方面,英特尔也给出了一些展示。在多种类型的测试中,Xe 2的GPU最多带来了12.5倍性能提升,最少也有1.2倍(曲面细分)。

另外在整体游戏提升方面,英特尔以1440p也就是1440p分辨率下1帧画面的渲染时间为例,可以看出B580对比A750,从一开始的渲染本地数据的预传递到执行、计算、体积雾、照明等,全部都带来了更少的计算时间以及更优秀的性能表现,最终差距极为明显,B580只耗费了A750的68%,显示出卓越的性能表现。

总的来看,BMG-G21展示出来的性能和特性还是值得期待的。不过,BMG-G21的规模依旧比较小,在一些传言中,英特尔也规划了更大规模的芯片。我们也很期待更大规模Xe 2架构相关产品的表现,是否存在设计或者应用上的瓶颈。

XeSS 2

全面进入AI驱动图形时代

在之前针对英伟达GPU的介绍中,尤其是DLSS 3、DLSS RR等技术的应用,本刊曾经分析过它的意义,那就是DLSS 3这类AI技术的引入,将之前的图形计算从光栅化算力时代进入了AI算力时代,GPU和画面上的像素并不再是一一对应计算的关系,而是可以通过AI模型大面积整体呈现,实现另一个层面的图形计算。目前,DLSS 3相关的技术依旧是英伟达在图形计算和游戏方面的竞争壁垒,AMD即使带来了FSR 3等技术也无法对其有丝毫撼动,根本原因就是针对AI的使用深度和幅度没有那么大。现在,英特尔带来了XeSS 2以及相应的XeLL等技术,我们也很期待它能够实现对英伟达DLSS 3的真正竞争。

▲XeSS-SR基本原理简图。

▲XeSS带来了非常显著的性能提升。

▲光线追踪游戏也可以使用XeSS来提升性能了。

▲XeSS-SR的基础架构提升,应用范围更宽。

▲XeSS 2带来了三大方面的技术提升,分别是性能、平滑和响应时间。

▲XeSS-FG功能的基本原理简介。

▲XeSS-SR和XeSS-FG功能联合应用提升游戏性能、画质表现。

▲XeSS 2的性能提升幅度相当显著。

▲XeLL技术带来了整体延迟的降低。

▲英特尔专门为媒体带来了XeLL的延迟测试硬件。

▲XeLL的实测延迟降低效果,还是很有意义的。

▲XeLL可以在驱动中直接打开。

▲目前支持XeSS 2技术的游戏。

XeSS 2包含了三项技术在内,包括XeSS-SR、XeSS-FG以及XeLL。XeSS-SR也就是之前的XeSS Super Resolution超分辨率。新的XeSS-SR目前可以支持光线追踪游戏了。之前的XeSS-SR不支持的原因可能是计算流程设置的问题。英特尔提到XeSS-SR针对游戏的计算优化过程,包括渲染低分辨率帧、提取有关运动矢量后,再进行AI相关的超分辨率放大并生成高分辨率的图像。

性能方面,英特尔给出的数据显示,XeSS 2带来了平均47%的帧率提升,表现不错,并且游戏画面越复杂,整体改进越明显。

在整体技术覆盖面上,英特尔介绍新的XeSS-SR会带来更广泛的游戏兼容性,包括API将兼容DirectX 11以及Vulkan,另外在支持的核心技术方面,支持独立GPU、内置GPU以及DP4a格式的应用,并且利用HLSL SM6.4实现了针对其他厂商GPU的兼容。不过,如果是非英特尔GPU或者使用集成显卡、DP4a模式,那么只能实现XeSS-SR的简易(Lite)模式,只有英特尔独立GPU才能实现完整模式。目前英特尔没有说明简易模式和完整模式的区别,应该是模型和实现的最终画质存在差异。

除了新版的XeSS-SR技术,本次XeSS 2的另一个重大升级就是加入了XeSS-FG,也就是XeSS的Frame Generation帧生成技术。XeSS-FG在技术应用中主要是在第一帧和第三帧之间,通过光流投影技术结合运动矢量技术混合,带来结合两帧信息的中间帧。英特尔在这里的创新之处主要是结合AI技术对插帧进行了相应的处理。在整体应用中,XeSS 2技术会先利用XeSS-SR放大原始画面,然后通过XeSS-FG插帧,最后再输出到玩家屏幕上。

英特尔数据显示,XeSS 2帧生成技术在质量模式下,可以带来至少2.8倍的性能提升,如果是超级性能模式,更是可以带来3.9倍性能提升,极大地改善了游戏的流畅性。

在游戏延迟降低方面,新一代GPU支持XeLL技术,可以为游戏带来更低的延迟。英特尔给出的案例显示,传统状态下,游戏从玩家点击,到游戏逻辑判断、游戏渲染等过程都存在延迟,其中,玩家输入信号后,处理器进入处理队列排队,然后根据排序将指令发送给GPU、最后再将GPU显示缓存中的内容发送给显示器。这整个过程,尤其是CPU队列排序,延迟都比较显著。XeLL技术直接消除了CPU等待队列的延迟,从而降低了整个系统的延迟。另外,XeSS-SR和XeSS-FG都会在一定程度上增加系统延迟,搭配XeLL技术使用也是应有之义。

为了清晰地证明XeLL技术带来的延迟降低,英特尔还提供了工具来测试延迟降低的情况,同时还给出了整体延迟降低的测试数据。英特尔数据显示,XeLL至少带来了45%的延迟降低,这对激烈的FPS游戏来说是极有帮助的。尤其是开启XeSS 2的XeSS-SR和XeSS-FG后,XeLL还能带来额外的延迟降低,效果还是很显著的。

AI性能大提升,驱动软件更好用

在前文我们提到过Xe 2架构在XMX以及AI相关单元方面的改进。硬件架构上的改进英特尔没有过多提及,主要是软件部分,英特尔带来了一整套流程的内容,从最基础的框架支持到优化支持、性能调优以及Runtime、硬件加速等,英特尔准备了一整套方案和工具,来实现对目前市面上几乎所有主流AI的全覆盖。

▲英特尔优化了整个AI工作流。

▲ARC B580在LLM的测试中,显示出比RTX 4060更好的性能。

▲AI未来的应用将无处不在,ARC B系列能够提供非常好的支持。

▲英特尔的新版驱动也进行了大幅度的易用性调整。

▲用户可以调整电压、功耗、显存频率等,自由度极高。

▲英特尔直接将超频界面集成在了驱动面板中。

▲超频带来了相当显著的频率提升。

性能方面,借助于更大的规模、更高的算力等,LLM相关性能方面,B系列GPU相比RTX 4060有更为出色的性能表现,英特尔也给出了一些测试的数据以供参考。

在显卡驱动方面,英特尔算是三家独立显卡厂商中更新整个驱动模块最积极的企业了。英特尔新的驱动界面,带来了包括超频、电压控制、电源控制、显存速率在内的调节和控制功能。

其中电压调节、超频等功能使得玩家不需要借助第三方工具,就能够在相对比较安全的范围内,提升GPU的性能,增强GPU的可玩性。这在很大程度上方便了DIY玩家。

英特尔给出的案例显示,用户可以很轻松地通过增加频率、增加功耗限额等,使得GPU的整体频率从之前的大约2700MHz提升到接近3200MHz,幅度相当惊人了。

ARC B580和ARC B570

中高端市场的有力挑战者

▲ARC B580和B570两款显卡的规格一览。

▲ARC B580公版显卡拆解爆炸图,整体设计用料还是相当出色的。

▲性能方面,英特尔的数据显示B580领先A750大约24%。

▲定价,ARC B580比RTX 4060要低不少,性价不错。

▲ARC B580的12GB显存配置在1440p游戏中更有优势。

▲ARC B570上市时间要稍晚一些,价格更便宜。

英特尔本次发布的ARC B580和B570两款显卡的规格如上,这两款显卡都定位中端市场,B580稍高一些,使用了完整的5个Xe渲染片核心,ARC B570则略有削减,显存位宽也低一些,价格应该更具有吸引力。功耗方面,两款显卡都低于200W,采用了单8pin接口即可满足需求。

在显卡本体的设计上,英特尔的公版整体设计非常扎实,无论是背板、加固中框还是双风扇散热、大面积鳍片,都展示出公版显卡设计和生产一贯的优秀品质。

性能方面,英特尔数据显示B580相比RTX 4060整体性能平均快了大约10%,美元价格相比RTX 4060首发价格便宜了50美元,整体性价比还是不错。另外,ARC B570要晚一点,在2025年1月16日上市,定价更低一些。而我们今天的评测对象,正是英特尔Arc B580。

英特尔Arc B580显卡简析

从包装外观上来看,英特尔锐炫B580的整体风格跟此前的A770、A750还算一脉相承,经典的“英特尔蓝”外盒搭配深黑幽邃的显卡配色具有极高的产品辨识度。

显卡外表仍然采用了类肤的涂层工艺,触感非常舒服且不易在显卡表面留下指纹。同时这种类肤的黑色涂层也更能将Arc B580的深邃感得到极好的升华

B580仍然是经典的双风扇设计,毕竟对于不到200W的TDP设计而言,双风扇也足以驾驭散热控制了。

锐炫B580显卡在正面开有通风散热槽用于加强散热,注意,从解剖示意图中可以看到它采用的是短PCB设计,整体电路设计十分紧凑。

▲供电部分采用了单8Pin设计,对于200W以下TDP的显卡而言,单8pin供电也是最经济实惠的配置。

▲输出接口部分是3DP 1.4a+1 HDMI 2.1的组合

▲驱动控制面板内可以进行GPU、显存和风扇的细致超频调节。

关于Arc B580的外观我们就不再过多讲解了,想必大家最期待的还是它的实际性能表现吧!接下来就让我们用实际的评测,来检验一下Battlemage核心的全新一代Arc显卡的这位“先锋”,究竟有着怎样的实力。

性能实测

光追性能大进步,能耗比表现不错,1440p游戏无忧畅玩

作为一款定位于2000元级市场的显卡,英特尔Arc B580很明显面向的是1440p和1080p分辨率下的主流级游戏市场,也是当前主流游戏玩家最聚集的一块领域。在这块领域内,面对RTX 4060和RX 6750 GRE这两款2000元级市场的常青树,Arc B580能否展现出足够的竞争实力?让我们一起来看下!

测试平台

CPU:英特尔酷睿i5-13490F

显卡:英特尔Arc A750、英特尔Arc B580

主板:ROG MAXIMUS Z790 DARK HERO

内存:DDR5 6400 48GB(双通道)

显示器:DELL UP3218K(7680×4320@60Hz)

操作系统:Windows 11 Pro 24H2

驱动程序:Intel GFX独显驱动32.0.101.6319(Arc A750)

Intel GFX独显驱动 32.0.101.6249(Arc B580)

在游戏性能的测试部分,我们主要选择了近20款游戏在1440p和1080p分辨率下对Arc B580进行了全面的性能测试。这些游戏包括《最终幻想ⅩⅥ》《F1 24》《龙之信条2》《刺客信条:幻景》等比较热门的新3A大作,也包括《CS2》《绝地求生:大逃杀》《幽灵线:东京》《古墓丽影:暗影》等至今仍比较热门的老游戏,以便最真实客观地展示Arc B580的实际游戏性能。同时,针对支持实时光线追踪的部分游戏,我们也在开启光追的情况下对Arc B580进行了光追游戏性能方面的测试,以便检验Arc B580的Battlemage Xe2架构光追游戏性能是否也有了长足的进步。当然,作为伴随Arc B580的发布而推出的XeSS 2中的帧生成功能,我们也专门进行了相关测试。作为对比,我们将前一代的对位产品Arc A750列为了参考对照的测试对象。

3DMark理论性能测试

3DMark理论3D性能测试部分可以看到,相比上一代的Arc A750,Battlemage核心和Xe2架构打造的Arc B580在整体性能上相比前者有了极为明显的进步,FireStrike DirectX 11理论3D性能上领先30%左右,TimeSpy DirectX 12理论3D性能领先也超过了15%,同样PortRoyal的光追性能测试方面也领先约16%。整体而言,从理论3D性能测试结果来看,B580在性能上已经远远超越了Arc A750,平均性能领先超过20%,相比RTX 4060在理论性能上也有不小的领先幅度。

光栅游戏性能

再来看游戏性能的实际表现。由于Arc B580定位于1440p和1080p游戏市场,因此我们也重点测试了这两种分辨率下Arc B580的实际性能表现。从测试成绩可以明显看出,Arc B580在1440p分辨率下的整体游戏性能相比Arc A750有了非常明显的进步,整体领先15%~55%不等,平均领先幅度也超过了25%。

1080p分辨率下的情况也大致相当,Arc B580的整体游戏性能表现相对Arc A750仍然有20%以上的平均性能领先,尤其是在《刺客信条:幻景》等新游戏中的性能领先甚至超过了30%。可以看出新一代Battlemage Xe2核心已经将上一代Alchemist Xe架构核心远远甩在了身后。

光追游戏及XeSS性能测试

从前一代Arc A系列的游戏性能表现来看,其实在光追性能方面的表现并不能算太好。从英特尔公布的技术资料来看,Battlemage Xe2架构核心在光追性能方面有了较大的加强,而且随着支持XeSS技术的游戏不断增多,因此我们也想看看新一代的Arc B580显卡是否在光追游戏上有着让人眼前一亮的表现。

在这部分的测试中,我们总共选择了12款光追游戏进行了详细测试。在1440p分辨率下,可以明显看到伴随XeSS的开启,Arc B580已经能在绝大多数的3A级光追游戏大作中实现接近或超过60fps的游戏流畅度。比如在《赛博朋克2077》游戏中,开启超级画质+超级光追效果之后,1440p分辨率下的游戏帧率能从25fps这种基本无法游玩的状态提升到79fps非常流畅的程度,帧率提升幅度高达140%。而在《幽灵线:东京》《消逝的光芒2:人于仁之战》等光追游戏中也是如此。从整体测试结果来看,在1440p分辨率下,开启XeSS平衡模式后,游戏帧率的提升幅度平均达到了66%左右,十分可观。相比上一代Arc A750在同样分辨率和设置下的光追游戏情况,可以明显看出在1440p分辨率下Arc B580在XeSS的辅助下已经有了相当不错的游戏性能表现,光追游戏性能的进步是肉眼可见的,这必须值得赞一个!

1080p分辨率下,Arc B580在XeSS平衡挡位下已经可以完美地驾驭全部参测光追游戏,且游戏帧率都能达到60fps及更高。从测试数据来看,开启XeSS平衡模式之后,相对原生帧率的提升幅度也达到了18%~110%,平均增幅为55%。由此也能看出,Battlemage Xe2核心的Arc B580凭借更高性能的光追核心加成以及XeSS超分辨率技术的支持,在光追游戏性能上已经有了巨大的进步。

XeSS 2带来帧生成,游戏性能巨幅提升

如前文所述,伴随Arc B系列显卡的发布,英特尔的超分辨率技术XeSS也进化到了第二代——XeSS 2。对XeSS 2来说,其最核心变动无疑就是加入了XeSS Frame Generation,也就是帧生成功能。在NVIDIA DLSS帧生成和AMD FSR帧生成之后,XeSS也总算迎来了自己的帧生成功能。对XeSS帧生成功能来说,它在实际游戏中的表现能否足够惊艳?让我们用目前已经实装支持XeSS帧生成功能的游戏《F1 24》来一探究竟吧。

我们在《F1 24》游戏中对XeSS帧生成功能进行了详细测试,从测试数据的反馈来看,在各挡位XeSS超分辨率模式下,开启帧生成之后,游戏帧率都有60%以上的增幅。如果与原生帧率相比,开启帧生成之后,XeSS超分辨率各模式下的帧率增幅更是达到了170%~219%。测试结果显示,XeSS帧生成功能确实带来了非常显著的游戏性能提升,也算是追赶上了DLSS帧生成和FSR帧生成,而剩下的,就是期待着更多的游戏实装对XeSS帧生成的支持。

功耗与温度,表现不错

最后来看下Arc B580的功耗与散热表现。

针对Arc B580的功耗表现部分,我们分别测试了待机状态、光栅游戏状态、光追游戏状态以及满载烤机状态四种情况下的功耗表现。其中待机状态为自然开机进入系统桌面待机,光栅游戏为运行《赛博朋克2077》,在超级画质以及关闭光追效果的设置下,进行1440p分辨率游戏,光追游戏同样是《赛博朋克2077》,在开启超级画质+超级光追效果的设置下,运行1440p分辨率的游戏,而满载功耗则是在系统下运行Furmark拉满GPU负载烤机20分钟后记录显卡整体功耗。从测试数据来看,在待机状态下,Arc B580的功耗约为30W左右(包含功耗监控软件的运行),而光栅游戏下的平均功耗约为138W,光追游戏下的平均功耗则为163W左右。在满载状态下,Arc B580也完全释放了自己的潜能,平均功耗也达到了192W左右,基本与Arc B580显卡的TDP设计相符。

再说说散热情况。Arc B580对散热的控制还是比较到位的,在满载情况下烤机20分钟后,GPU核心温度也堪堪64℃左右,而同为双风扇的Arc A750则达到了70℃,显然更先进的制程工艺也让Arc B580有了更好的能耗比。

Arc B580,必然是1440p游戏市场的有力竞争者

从整体测试结果来看,我们认为Arc B580的首秀是合格的。作为一款定位于2000元级游戏显卡市场的产品,Arc B580在1440p分辨率和1080p分辨率下都有非常不错的表现。不但能够在1440p分辨率下畅玩几乎所有的3A游戏大作,而且还能在开启XeSS之后,在1440p分辨率下于大部分光追游戏中实现超高画质、高光追效果的60fps+流畅游戏体验。和前一代相同定位的Arc A750相比,游戏性能提升明显,尤其是在光追游戏性能上更有极大的进步,这也让它有了比较出色的性价比。即使与目前这一价位段的热门产品RTX 4060、RX 6750 GRE等相比,Arc B580也丝毫不逊色,绝对称得上是强有力的竞争者。如果正在为升级1440p或1080p分辨率游戏体验而犯愁,那么我们认为Arc B580将会是一个非常不错的选择。2000元级的游戏显卡市场,或许真会迎来一匹大黑马,让我们拭目以待。

编者注:Arc B580的全面体验也不仅限于游戏,这款产品在设计创作、AI性能等方面相对上一代产品也有不小的提升。限于篇幅我们今天就不为大家一一解析了,接下来我们也将针对Arc B580的设计创作及AI性能进行测试,并将在第一时间与大家分享测试结果。敬请期待。

来源:微型计算机一点号

相关推荐