2024 IT产业市场回顾:消费级处理器

360影视 2025-01-23 09:33 2

摘要:2024年对于处理器来说是非常重要的一年,在这一年,AMD与英特尔两大处理器厂商都先后发布了新架构、新产品。先是在2024年8月,AMD推出基于Zen 5处理器架构的锐龙9000系列处理器。Zen 5架构通过8宽度解码器,提升分支预测性能、更大的一级数据缓存、

2024年对于处理器来说是非常重要的一年,在这一年,AMD与英特尔两大处理器厂商都先后发布了新架构、新产品。先是在2024年8月,AMD推出基于Zen 5处理器架构的锐龙9000系列处理器。Zen 5架构通过8宽度解码器,提升分支预测性能、更大的一级数据缓存、规模更大的执行单元,更高的缓存与浮点单元带宽,再加上TSMC 4nm生产工艺的助力,让Zen 5微架构的IPC性能相对前一代Zen 4提升了16%。此外Zen 5架构还带来了新的48KB L1 12-way数据缓存,延迟为4周期,L1缓存总容量达到了每核心80KB。而Zen 4架构处理器每颗核心的L1数据缓存容量只有32KB,且采用8-way设计,L1缓存总容量仅64KB。同时Zen 5架构下的L1缓存带宽翻倍,浮点单元带宽翻倍(对应浮点执行部分的调整),数据预取性能也得到加强。

▲Zen 5消费级处理器内部架构图,最多可配置16颗核心。每8颗核心共享32MB缓存,通过IF总线连接IO芯片,IO芯片内置图形显示核心、PCIe 5.0控制器等功能模块。

与英特尔消费级处理器相比,Zen 5处理器还有一个巨大的优势,那就是支持AVX-512指令集。它内置了一个SIMD 512bit单元,队列深度为384,拥有6个2周期延迟的FADD单元,在运行相关支持AVX-512指令集的运算中,速度要快很多。以上改进不仅让主流的锐龙5 9600X、锐龙7 9700X处理器拥有优于竞争对手酷睿i5-14600K、酷睿i7-14700K的游戏性能,更赋予16核心、32线程设计的锐龙9 9950X处理器强大的多核心性能。在默认状态下,其CINEBENCH R23处理器多核心渲染性能就能突破45000pts,成为消费级处理器中的生产力王者。

▲锐龙9 9950X是目前消费级处理器中,生产力性能最强的产品之一。

而在2024年11月,AMD再接再厉,推出了万众期待、使用3D堆叠缓存的新一代锐龙9800X3D处理器。与上一代锐龙7 7800X3D相比,锐龙7 9800X3D不仅采用了IPC性能较Zen 4处理器提升16%的Zen 5架构,还将64MB 3D堆叠缓存从处理器CCD的正上方移到了处理器CCD的下方,有效降低了热阻值与处理器的工作温度。正是由于工作温度可以得到有效控制,锐龙7 9800X3D的最高加速频率从锐龙7 7800X3D的5.0GHz提升到了5.2GHz,基准频率则从4.2GHz大幅提升500MHz到4.7GHz。而且AMD还为它开放了倍频超频,第一次让X3D处理器拥有了完全的超频能力。再加上处理器的8MB二级缓存、CCD上的32MB三级缓存以及64MB 3D堆叠缓存,锐龙7 9800X3D总计拥有多达104MB的二、三级缓存,结合其较高的工作频率,可谓是一款技术规格非常强劲的产品。根据评测来看,锐龙7 9800X3D在大部分游戏测试中都可以战胜包括AMD、英特尔在内的各款旗舰处理器,成为目前市场上最受欢迎的产品,这也导致它在市场上长时间出现缺货、涨价的情形。

▲锐龙7 9800X3D是目前市场上最受欢迎的处理器之一,经常处于缺货、涨价的状态。

同样,英特尔处理器也在2024年1月推出架构大幅改进的新一代酷睿Ultra 200S台式机处理器。酷睿Ultra 200S的内部与英特尔在2024年发布的Lunar Lake移动处理器非常相似。那就是首次在桌面处理器上采用了Chiplet设计,让不同的核心比如计算核心、GPU核心、IO核心以及SoC核心采用不同的工艺制造,并通过Foveros 3D高级封装技术将其整合在一起。处理器的计算核心采用台积电的N3B工艺,内置GPU用的是台积电N5P工艺,SoC和I/O模块用的是台积电的N6工艺。

▲酷睿Ultra 200S内部通过Foveros 3D高级封装技术,集成了计算核心、GPU核心、IO核心以及SoC核心。

计算核心上的重大改进就在于酷睿Ultra 200S台式机处理器P核(性能核)的微架构从Raptor Cove进化至Lion Cove,E核(能效核)微架构进化至Skymont,相对上一代微架构性能大幅度提升。其中Lion Cove的主要改进是增大规模、提高内部执行能力、增加更多执行端口并针对缓存进行大规模革新。比如整个分支预测宽度增加至之前的8倍,VEC和INT的乱序执行部分进行分离调度,并带来更宽的调度单元、增强的内存子系统,提升了缓存容量。其中每核心一级缓存容量从80KB提升到112KB,每核心的二级缓存容量从2MB提升到3MB。Lion Cove还取消了超线程技术以及相关的晶体管资源,以降低功耗、发热量以及成本。根据英特尔官方数据,Lion Cove的性能相对于上一代Raptor Cove的IPC性能提升了9%。

▲酷睿Ultra 200S内部采用的性能核与能效核全部升级为新的核心,并带来了IPC性能的大幅提升。

性能核心的改进如果说是显著提高的话,那么能效核心的改进就可以说是翻天覆地了。整体来看,Skymont能效核心的分支预测大幅度加强,前端指令解码来到了3×3也就是9宽度设计,整个架构规模、调度端口、缓存以及队列深度等都进行了极大幅度的扩充。在矢量计算方面,SIMD增加到4×128位,这意味着吞吐能力相比上代产品翻倍,对AVX-2、VNNI指令的支持也更为出色。同时,Skymont的缓存也有大幅升级,不仅二级缓存的带宽提升了两倍,而且能效核可以和性能核一起共享三级缓存,实现36MB三级缓存全CPU核心共享。经过以上改进,Skymont架构E Core的IPC性能相对于上一代GraceMont提升了高达32%。

▲酷睿Ultra 9 285K的多核与单核性能都得到了明显提升,是英特尔消费级处理器中,生产力最强的产品之一。

在实际测试中,尽管没有超线程技术、但借助更先进的核心架构与工艺,旗舰产品酷睿Ultra 9 285K在大部分单核性能与多核性能测试中都以明显的优势战胜了酷睿i9-14900K。比如酷睿Ultra 9 285K的3DMark单线程与多线程性能分别领先14900K达4.73%、12.53%;在CINEBENCH R23渲染测试中,酷睿Ultra 9 285K的单核心与多核心性能优势分别为3.42%、4.72%;在PerformanceTest 11.0处理器测试中,酷睿Ultra 9 285K更创造了两项第一:它是《微型计算机》评测室中第一款总分突破71万的消费级处理器,也是第一款单线程性能达到5300分以上的消费级处理器。唯一的遗憾就在于酷睿Ultra 200S 处理器虽然采用了Chiplet小芯片设计,但由于内存控制器在SoC这块芯片上,与处理器计算核心不在同一块芯片,因此会增加内存访问延迟,造成酷睿Ultra 200S处理器的内存性能、游戏性能出现降低。

0x12B

看到这几个奇怪的字符,可能不少读者是丈二和尚摸不着头脑,不过对使用第14代酷睿K系列处理器的读者来说,却可能是再也熟悉不过的“救命稻草”。在2024年,不少支持处理器超频的第13代、第14代K系列酷睿处理器都遭遇了稳定性问题。具体表现为在执行高负载工作时蓝屏、死机,安装显卡驱动失败,运行游戏时发生着色器编译出错。特别是在运行2024年的热门游戏《黑神话:悟空》时,出现着色器编译出错是英特尔K系列处理器不稳定的一个典型特征。原因在于为了让处理器达到更高的频率,英特尔为处理器设定了较高的工作电压。而高电压带来的后果就是高温,导致处理器内的时钟树电路容易受到可靠性老化的影响,从而发生时钟的占空比偏移和系统不稳定。

▲运行《黑神话:悟空》时,出现着色器编译出错是英特尔K系列处理器不稳定的一个典型特征。

因此在2024年英特尔的一大任务就是与主板厂商合作,接连推出数个更新了微代码的主板BIOS致力于解决这一问题。在2024年6月,内置英特尔0x125微代码的主板BIOS可以避免第13代、第14代K系列酷睿处理器在高温下,仍以高性能状态工作。在2024年8月推出、内置英特尔0x129微代码的主板BIOS则对微代码SVID算法进行了优化,解决了处理器请求更高电压的问题。而2024年9月底推出、内置0x12B微代码的主板BIOS除了包含0x125、0x129微代码的功能外,还解决了处理器在空闲或轻载时的电压升高问题。通过对主板BIOS的不断升级,英特尔似乎解决了第13代、第14代K系列酷睿处理器的不稳定问题。

▲根据英特尔官方指南,升级内置0X12B微码的主板BIOS可避免处理器工作在高电压状态。

不过内置这些微代码的BIOS仅对没有出现过任何故障现象的产品有用,如果处理器已经发生过安装显卡驱动失败、着色器编译出错的现象,那么这就意味着处理器内部的硬件可能已经出现损坏。好在英特尔最终决定为受不稳定问题影响的英特尔酷睿第13代和第14代台式机处理器延长2年保修期间,也就是说购买这些处理器的用户可以享受时间长达五年的免费质保。此次事件的发生对英特尔产品的口碑、消费者的信任度来说是一个重大打击。但其实也在《微型计算机》的意料之中,酷睿i9-14900K、酷睿i9-14900KS在使用360水冷散热器时,满载温度快速达到100℃温度墙的表现,让我们很早就在怀疑这样的产品寿命能有多久?根本原因在于英特尔自己的生产工艺并不支持处理器在超高的频率下稳定工作。这也宣告英特尔会暂时结束对高频率的追求,特别是像酷睿i9-14900KS这类最高睿频频率达到6.2GHz的产品,在很长时间内可能再难看到有比它的频率还要高的产品,毕竟稳定压倒一切。

▲以上型号处理器的质保时间都延期到了5年

NPU

正是因为在对频率的追求上遇到挫折,所以英特尔在新一代酷睿Ultra 200S台式机处理器上另辟蹊径,在新处理器中内置了NPU神经网络处理器用于AI应用的加速。它集成的NPU与Meteor Lake处理器中的NPU技术水准相当,都是基于NPU3架构。其包含了2个神经计算引擎,每个神经计算引擎都拥有矩阵乘法和卷积单元,支持数据转换和激活函数等,能够支持包括生成式AI、计算机视觉、图像增强和协作AI方面的内容。之前大量需要CPU和GPU参与运算的内容,都可以转移至NPU上来,NPU可以提供最高13 TOPS的INT8算力。因此按计算核心、核芯显卡和NPU可提供的最高算力计算,酷睿Ultra 200S处理器最多可提供36 TOPS的算力。

▲酷睿Ultra 200S成为英特尔首次引入NPU的台式机处理器,其算力为13 TOPS,处理器的总算力达到最高36 TOPS。

根据《微型计算机》评测室的测试来看,新一代酷睿Ultra 200S台式机处理器主要支持FP16浮点数、INT8整形数两种数据类型计算加速。NPU在使用这两类数据计算时的性能均小幅优于其内置的核芯显卡。不论是定位相对较低的酷睿Ultra 5还是极致的酷睿Ultra 9,它们集成的都是相同算力、相同规格的NPU。我们认为台式机处理器集成NPU的主要意义在于,如果用户没有购买价格高昂的独立显卡,处理器核心算力也不高,那么就可以借助处理器内置的NPU进行AI加速。当然处理器内置NPU的算力与高性能独立显卡的算力相比还是差距甚远,我们认为NPU最应该出现在那些价格低廉的非K系列处理器中,那些用户才最有可能不会搭配独立显卡。

而AMD就率先考虑到了特定用户的需求,在今年年初推出了内置NPU的锐龙8000G系列台式机处理器。更关键的是,它还同时集成了规格强大,基于RDNA3架构的显示核心。其旗舰产品锐龙5 8600G、锐龙7 8700G具备在1080p画质下流畅运行3A大作的能力。而其内置的NPU支持Int8/16/32、BFloat16等各种高级数据类型计算加速,拥有最大16 TOPS的算力。其NPU可以驱动超过100多个AI功能,包括微软、Adobe、Blackmagic Design和Topaz Labs,以及非凡无限科技等众多合作伙伴的应用软件。

比如在Windows相机中,目前操作系统可以调用NPU来识别前景、人物和背景,并进行背景虚化、自动取景和眼神交流,可以有效增强用户在视频会议上的体验。AMD NPU还适配了主流的生产力应用,比如Adobe全家桶中的PS图片编辑、PR视频剪辑、LR批量图片编辑以及BlackMagic的达芬奇视频调色和编辑软件,同时Topaz Photo AI和Video AI也支持使用AMD NPU加速,无需联网即可本地运行AI修复模型,对低分辨率的老照片和老视频进行超分辨率、降噪、抖动消除、人物面部修复、插帧等一系列操作。而非凡无限科技的《游戏加加》则会使用NPU自动录制玩家在网游如《无畏契约》中击杀敌人时这几秒的画面,也叫超能时刻,让玩家在游玩后可以尽情欣赏,更加开心。显然,通过为处理器采用高规格的内置显示核心、NPU,可以让预算有限,无法购买独立显卡的台式机处理器用户在使用体验上获得全方位提升。

KX-7000

在今年,国产处理器也获得了很大的发展,特别是在x86处理器上。由兆芯研发的开先KX-7000系列产品高性能桌面处理器得到了紫光、联想和同方等多家整机厂商的采用。开先KX-7000系列处理器采用8核心、8线程设计,最高加速频率为3.7GHz。其在国内大受欢迎的原因就在于它持续兼容主流生态,支持国际主流的x86指令集,支持自主研发的SM2/SM3/SM4国密算法加速指令,支持处理器和IO虚拟化技术,支持Windows和Linux等主流操作系统,具备优异软硬件兼容性,可轻松适配市场上绝大多数的应用软件、云平台、开发工具以及外设等产品。

其内部采用全新的“世纪大道”自主内核微架构和先进的Chiplet互连架构—ZPI 4.0,将CPU Die和IO Die整合在一颗处理器芯片中,每8颗核心共享32MB缓存,可实现一Die多用,加速兆芯自主处理器的迭代速度,并有效降低研发成本,处理器内部的结构设计非常类似我们前面提到的Zen 5处理器。根据兆芯官方数据,与上一代兆芯产品相比,其计算性能提升2倍。同时,兆芯还对开先KX-7000系列处理器的I/O接口进行了全面升级,最高支持双通道DDR5内存,容量可达128GB,并能提供24条PCIe 4.0通道、两个USB4接口。开先KX-7000系列处理器还集成了高性能显卡,根据兆芯官方数据,它的图形性能提升4倍,支持H.265硬件编解码,最高支持双路4K显示。

▲从图片上可以看到,在一颗芯片上,兆芯开先K X-7000有C PU D i e和IODie两颗Die,可以让处理器拥有更多的核心配置和更强大的扩展能力。

从实际测试来看,开先KX-7000系列处理器的性能已经非常接近AMD Zen架构锐龙处理器的性能。在使用中,开先KX-7000系列处理器不仅能正常运行PS、PR、达芬奇和剪映等生产力软件,也具备流畅运行《赛博朋克2077》《原神》《战争雷普》和CS2等热门游戏大作的能力,标志着国产x86处理器取得了一个重大进步。

来源:微型计算机

相关推荐