摘要:在本届的CES,黄仁勋又一如既往地成为了明星。凭借着一系列全新的新产品,这家最炙手可热的公司成为了大家讨论的热点。那些能够与英伟达扯上关系的厂商,也希望借着这个机会大展所长。
在本届的CES,黄仁勋又一如既往地成为了明星。凭借着一系列全新的新产品,这家最炙手可热的公司成为了大家讨论的热点。那些能够与英伟达扯上关系的厂商,也希望借着这个机会大展所长。
其中,来自韩国的三星和SK海力士无疑是最紧张之一。这一方面与他们作为存储龙头,所提供的HBM会否被黄仁勋所领导的英伟达采用,会成为影响他们公司未来发展的关键因素;另一方面,公司能否在英伟达新产品中获得机会,也会影响未来的走势。
本届CES上,就发生了一个“小波折”。
黄仁勋在介绍新款显卡(GPU)RTX 50 系列时提到“采用了美光 GDDR”。由于包括英伟达在内的半导体公司在推出新芯片组时通常不会指定内存供应商,这一不寻常的举动引发了极大的兴趣和争议。
随后,在一场新闻发布会上,一名韩国记者向黄询问为何专门选择美光科技。黄回应称,“据我了解,三星电子和SK海力士不生产图形内存。”(原文:"I understand that Samsung Electronics and SK Hynix do not manufacture graphic memory,"),这引起了轩然大波,因为三星电子是全球第一家开发 GDDR7 的公司。
随后,黄仁勋发布官方声明澄清情况:“GeForce RTX 50 系列配备了各个合作伙伴制造的 GDDR7 显存,首先是三星。”(原文:The GeForce RTX 50 series is equipped with GDDR7 memory manufactured by various partners, starting with Samsung。)这一更正解决了最初的说法,即美光科技(而不是三星电子)将提供最初的数量。
那么,这个GDDR ,又是什么呢?
GDDR,是什么?
GDDR是Graphics Double Data Rate的简称,也就是双倍数据速率 (DDR) 内存。
作为一种专门用于图形卡 (GPU) 上的快速渲染技术。GDDR 于 2000 年推出,是目前使用的主要图形 RAM。GDDR 在技术上是“GDDR SDRAM”,取代了 VRAM 和 WRAM。每一代 GDDR 都速度更快,并包含增强功能;但是,尽管基于 DDR 内存,但 GDDR 版本在数字上并不与 DDR 相对应。例如,GDDR3 基于 DDR2 芯片;GDDR5 基于 DDR3 等等。
虽然GDDR借鉴自DDR,但它与 DDR 的主要区别在于内存总线大小和带宽。GDDR 是针对现代显卡使用的带宽进行优化的内存,例如 GDDR6 和 GDDR6X,仅在高端消费级 NVIDIA GPU(如 4090)中发现。GPU 处理大量重复和线性工作负载(如数学计算)并并行传输数据;需要更大的位总线和更高的带宽来防止出现瓶颈。否则,我们的视觉资产将无法加载,或者依赖数据的 AI 训练必须等待模型参数更新。
DDR内存广泛用于传统计算系统,主要用于支持 CPU。它针对通用计算进行了优化,可执行需要快速访问时间和最低延迟的任务,是运行应用程序和操作系统进程等活动的理想选择。
另一方面,GDDR内存专门用于图形处理单元 (GPU)。GDDR 主要关注带宽而非延迟,专注于由 GPU 管理的并行任务,这些任务使用精简指令集计算 (RISC)。RISC 架构通过管理重复的线性工作负载来简化处理,非常适合图形渲染和 3D 模型计算。这种设计使 GDDR 能够处理大量数据传输,这通常是图形密集型应用程序所必需的。
总而言之,GDDR 的优势在于其更宽的内存总线和更高的带宽:
内存总线大小和带宽: GDDR 更宽的内存总线可容纳 GPU 操作所需的大量数据传输,处理游戏图形、高分辨率视频渲染和深度学习模型等工作负载。NVIDIA RTX 4090 等 GPU 中的高级 GDDR 版本(如GDDR6 和 GDDR6X)通过扩大带宽来实现这一点,从而在视觉计算任务中提供更流畅、更强大的体验。
并行处理能力: 由于 GPU 擅长并行处理(同时在多个内核上执行大量计算),因此 GDDR 经过优化以支持这一点。如果带宽不足,GPU 可能会面临瓶颈,从而降低帧速率并延长渲染时间。GDDR 的高带宽使 GPU 能够满足 3D 渲染、图像处理等数据需求,从而避免这些瓶颈。
高端应用: 在 AAA 游戏和 VR 等高性能图形应用中,对高带宽的需求非常巨大。GDDR 的高速数据访问和宽内存总线可满足这一需求,使其成为保持高帧率和精细视觉效果的关键。
GDDR 7,则是2024年三月发布的最新版本规格标准。
GDDR 7,新一代标准
据介绍,最新一代 GDDR 带来了内存容量和内存带宽的结合,后者主要由内存总线上切换到 PAM3 信号驱动。最新的图形 RAM 标准还增加了每个 DRAM 芯片的通道数量,增加了新的接口训练模式,并引入了片上 ECC 以保持内存的有效可靠性。
如前所述,GDDR7 最大的技术变化在于内存总线从 2 位不归零 (NRZ) 编码转换为3 位脉冲幅度调制 (PAM3) 编码。这一变化使 GDDR7 能够在两个周期内传输 3 位数据,比以相同时钟速度运行的 GDDR6 多传输 50% 的数据。因此,GDDR7 可以支持更高的整体数据传输速率,这是使每一代 GDDR 都比其前代产品更快的关键因素。
第一代 GDDR7 预计以每针 32 Gbps 左右的数据速率运行,内存制造商之前曾表示,高达 36 Gbps/针的速率很容易实现。然而,GDDR7 标准本身为更高的数据速率留出了空间——高达 48 Gbps/针——JEDEC 甚至在其新闻稿中宣称 GDDR7 内存芯片“每台设备高达 192 GB/s [32b @ 48Gbps]”。值得注意的是,这比 PAM3 信号本身带来的带宽增加要高得多,这意味着 GDDR7 的设计有多个级别的增强。
深入研究规范,JEDEC 还再次将单个 32 位 GDDR 内存芯片细分为更多通道。GDDR6 提供两个 16 位通道,而 GDDR7 将其扩展为四个 8 位通道。从最终用户的角度来看,这种区别有点随意——无论如何,它仍然是一个以 32Gbps/pin 运行的 32 位芯片——但它对芯片内部的工作方式有很大影响。特别是因为 JEDEC 保留了 GDDR5 和 GDDR6 每通道 256 位的预取,使 GDDR7 成为 32n 预取设计。
所有这些的净影响是,通过将通道宽度减半但保持预取大小不变,JEDEC 有效地将 DRAM 单元每个周期预取的数据量增加了一倍。这是扩展 DRAM 内存带宽的一个相当标准的技巧,基本上与 JEDEC 在 2018 年对 GDDR6 所做的一样。但它提醒我们,DRAM 单元仍然非常慢(大约数百 MHz),并且不会变得更快。因此,为更快的内存总线提供数据的唯一方法是一次性获取越来越多的数据。
每个内存芯片的通道数变化对多通道“clamshell”模式在更高容量内存配置中的工作方式也有轻微影响。在翻盖式配置中,GDDR6 从每个芯片访问单个内存通道,而 GDDR7 将访问两个通道 - JEDEC 称之为双通道模式。具体来说,此模式从每个芯片读取通道 A 和 C。它实际上与翻盖式模式对 GDDR6 的行为方式相同,这意味着虽然最新一代内存仍然支持翻盖式配置,但除了不断增加内存芯片密度之外,没有任何其他技巧可以提高内存容量。
就此而言,GDDR7 标准正式增加了对 64Gbit DRAM 设备的支持,是 GDDR6/GDDR6X 32Gbit 最大容量的两倍。非 2 的幂容量也继续得到支持,允许使用 24Gbit 和 48Gbit 芯片。对更大内存芯片的支持进一步将具有 384 位内存总线的理论高端显卡的最大内存容量推高至 192GB 内存——这一发展无疑会受到大型语言 AI 模型时代的数据中心运营商的欢迎。
对于其最新一代内存技术,JEDEC 还加入了几项新的 GDDR 内存可靠性功能。最值得注意的是片上 ECC 功能,类似于我们在推出 DDR5 时看到的功能。虽然我们无法从 JEDEC 获得关于他们为什么现在选择加入 ECC 支持的官方评论,但考虑到 DDR5 的可靠性要求,加入 ECC 并不令人意外。简而言之,随着内存芯片密度的增加,生产出没有瑕疵的“完美”芯片变得越来越困难;因此,添加片上 ECC 可让内存制造商在不可避免的错误面前保持芯片可靠运行。
在新标准发布之后,传统DRAM三巨头也发布了相应的产品。
DRAM三巨头角逐
因为GDDR7的需求大增,在2024年7月,全球先进内存技术领导者三星电子宣布,已开发出业界首款 24 千兆位 (Gb) GDDR7 1 DRAM。除了业界最高的容量外,GDDR7 还具有最快的速度,将其定位为下一代应用的最佳解决方案。
三星电子内存产品规划执行副总裁 YongCheol Bae 表示:“继2023年开发出业界首款 16Gb GDDR7 之后,三星凭借这一最新成果巩固了其在图形 DRAM 市场的技术领先地位。我们将继续引领图形 DRAM 市场,推出符合 AI 市场日益增长的需求的下一代产品。” 24Gb GDDR7 采用第五代 10 纳米 (nm) 级 DRAM,使单元密度增加 50%,同时保持与前代相同的封装尺寸。
除了先进的工艺节点外,三级脉冲幅度调制 (PAM3) 信号有助于实现业界领先的 40 千兆位每秒 (Gbps) 图形 DRAM 速度,比上一代提升 25%。根据使用环境的不同,GDDR7 的性能可进一步提升至 42.5Gbps。
通过将以前用于移动产品的技术首次应用于图形 DRAM,电源效率也得到了提高。通过实施时钟控制管理和双 VDD 设计等方法,可以显著减少不必要的功耗,从而使电源效率提高 30% 以上。
为了提高高速运行时的运行稳定性,24Gb GDDR7 采用电源门控设计技术来最大限度地减少电流泄漏。
三星表示,24Gb GDDR7 凭借其高容量和强大性能,将广泛应用于数据中心、AI工作站等需要高性能内存解决方案的各个领域,超越显卡、游戏机和自动驾驶等图形 DRAM 的传统应用。
在2024年六月,美光公司本月初开始提供 GDDR7 芯片样品,并表示这种新型先进内存将显著提升下一代图形处理器的性能。新幻灯片提供了有关预期性能提升的更多细节。
美光的GDDR7 内存预计将取代目前用于现代 GPU 游戏和 AI 工作负载的 GDDR6 和非标准 GDDR6X 芯片。这家总部位于爱达荷州的公司声称,采用 GDDR7 构建的显卡将在三种最常见的游戏分辨率(1080p、1440p 和 4K)下为光线追踪和光栅化渲染提供每秒超过 30% 的帧数。
根据美光的一份官方幻灯片(见上文),玩家可以期待下一代游戏的“无缝视觉效果”和显著更好的性能。幻灯片显示,GDDR7 内存芯片的性能比 GDDR6 应用程序高出 3.1 倍,比“同类最佳”的 GDDR6X 应用程序高出 1.5 倍。
美光还提供了一些“标准化 FPS”游戏基准测试,将当今的视频内存技术与 1080p Ultra、1440p Ultra 和 4K Ultra 设置下的 GDDR7 与未命名的游戏标题进行比较。
GDDR7 硬件似乎在光线追踪渲染场景中表现出色,与 GDDR6 相比,1080p Ultra 分辨率下 FPS 提升了 2.3 倍,4K 分辨率下提升了 3.1 倍。光栅图形的标准化 FPS 性能也得到了改善,1080p Ultra 分辨率下提升了 1.2 倍,4K Ultra 分辨率下提升了 1.7 倍(我们假设此类游戏中的设置是 Ultra,内存速度可能是一个更重要的因素)。
同样在2024年,SK 海力士宣布推出 GDDR7 图形内存,并声称这是“业界最好的 GDDR7”。它提供 32 Gbps 的运行速度,比当前一代 GDDR6 内存(限制在 24 Gbps 左右)快 60%。它还承诺将电源效率提高 50%,从而有可能降低使用这种新内存的下一代显卡的功率要求和产生的热量。
该公司通过使用新的封装技术实现了功率效率的飞跃。例如,它将散热基板层数增加了 50%(从四层增加到六层),使芯片能够更快地释放其累积的热能,而无需增加其使用的 PCB 面积。
除了游戏之外,SK 海力士还预计 GDDR7 内存将应用于其他行业,如 3D 图形、AI 加速任务、高性能计算、自动驾驶等。SK 海力士 DRAM 产品规划与支持负责人 Sangkwon Lee 表示:“我们将继续努力,进一步加强高端产品线,提升我们作为最值得信赖的 AI 内存解决方案提供商的地位。”
写在最后
其实,韩国芯片行业对于黄仁勋说话表示的担忧,是非常容易理解的。毕竟在他说了一句量子计算还可以需要20年以后,与之相关的概念股IonQ 的股价一夜之间在纽约证券交易所下跌了 39%。其他量子计算机相关股票,如QuantumComputing下跌43.34%、RigettiComputing下跌45.41%、D-Wave Quantum下跌36.13%。
但是,从另一个角度看,整个行业都如此依赖一个厂商,我们是否需要思考一下原因和寻找更多的机会呢?
来源:智慧芯片