摘要:与标准固态硬盘不同,AI SSD专为处理深度学习、神经网络训练和实时数据分析等人工智能应用的巨大数据吞吐量、低延迟和高 IOPS(每秒输入/输出操作数)需求而设计。
这两天,存储行业热闹非凡。
8 月 5 日,美光一口气推出了三款基于美光 G9 NAND 打造的数据中心 SSD,号称能满足多样化 AI 工作负载需求。
无独有偶,铠侠也推出了专为生成式AI 需求打造的 245.76TB NVMe SSD;此外,闪迪发布最新的256TB AI专用SSD。
存储大厂们接连放大招,发布SSD产品,并且特意强调“赋能 AI”。
01
谁在呼唤AI SSD?
在AI 发展进程中,训练与推理两大核心环节对存储的特殊需求,直接推动了 AI SSD 的快速崛起。
与标准固态硬盘不同,AI SSD专为处理深度学习、神经网络训练和实时数据分析等人工智能应用的巨大数据吞吐量、低延迟和高 IOPS(每秒输入/输出操作数)需求而设计。
AI训练:高要求的存储需求
大模型迭代速度迅猛,每一次升级都伴随着训练数据量的指数级增长,PB 级数据已成为 AI 训练的基本门槛 。训练环节涉及GPU、HBM 及承担快照、日志功能的 SSD 等组件,且对存储的要求远高于推理环节。
在训练过程中,系统需要反复读取和写入巨量数据,包括训练语料、模型参数、日志文件和中间结果等。数据流动的频率极高、负载持续,IO密度远超日常应用。
在AI模型训练过程中,SSD不仅负责储存模型参数,包含不断更新的权重和偏差,而且可以创建检查点(check point),以定期保存AI模型训练进度,即使训练中断也能从特定点恢复。上述功能都相当依赖高速传输以及写入耐用度,因此客户主要选择使用4TB/8TB TLC SSD产品,以满足严苛的训练过程需求。
AI 推理环节:SSD的核心支撑作用
AI推理环节中,SSD可在推理过程中协助调整、优化AI模型,尤其SSD可以实时更新数据,以便微调推理模型结果。AI推理主要提供检索增强生成(RAG, Retrieval-Augmented Generation)和大型语言模型(LLM, Large Language Model)服务,而SSD可以储存RAG和LLM参考的相关文档和知识库,以生成含有更丰富信息的响应。目前TLC/QLC 16TB以上等大容量SSD便成为AI推理主要采用的产品。
AI 对存储“高性能、大容量、高能效”的三重刚需,让SSD成为AI场景下的最优解。
TrendForce数据显示,全球范围内,2024年AI相关的SSD采购容量将超过45EB,未来几年,AI服务器有望推动SSD需求年增率平均超过60%,而AI SSD需求在整个NAND Flash(闪存)的占比有机会自2024年的5%,上升至2025年的9%。
02
大厂AI SSD比拼,各有神通
铠侠:AI SSD,两方面入手
铠侠在今年公布了AI时代中长期增长战略。重点围绕AI驱动的存储技术创新、SSD业务拓展及资本效率优化,以巩固其在NAND闪存市场的竞争力。
对于AI SSD有两类产品线:
第一类是高性能SSD。铠侠的CM9系列,专为AI系统设计,搭载针对数据中心优化的PCIe 5.0,最大限度地发挥需要高性能和高可靠性的GPU功能。
第二类是容量型SSD。铠侠的LC9系列,适用于推理中使用的大型数据库等用例,当时容量为122.88 TB,未来计划推出更大容量产品。
前两天,铠侠推出了新的容量——245.76TB。据了解铠侠LC9系列SSD采用的也是QLC 3D闪存,但是特点是结合了CBA(CMOS直接键合到阵列)技术,这就能够实现在154球栅阵列(BGA)小型封装中达到8 TB的容量。铠侠称这是业界首创。
来源:铠侠
对于未来的AI SSD,铠侠也提出了自己的设想,主要从两个方面突破。第一是速度更快。现在的SSD每秒能处理200万-300万次小文件读写,多采用TLC和QLC ,而新产品将采用XL-FLASH的SLC闪存,速度提升到每秒1000万次以上,特别适合AI需要频繁读取零碎数据的场景。
这里解释一下,XL-FLASH是铠侠开发的具有极低延迟、高性能NAND,用于填补易失性存储器(如DRAM)和当前闪存之间存在的性能缺口。最开始铠侠把XL-FLASH定位为英特尔已停产的 Optane 内存的竞争对手。目前,铠侠的第二代 XL-Flash 采用 MLC(多层单元)架构,密度翻倍,芯片容量从 128Gb 提升至 256Gb。
第二是更智能。目前AI检索数据要依赖内存,2026年铠侠将推出AiSAQ软件,让SSD自己就能处理AI的检索任务。这样不仅能减轻内存负担,还能让AI应用运行更高效,尤其适合智能终端和边缘计算设备。
美光:AI SSD三剑客
美光最新发的AI SSD是三款。
第一款是美光9650 SSD,全球首款PCIe 6.0的SSD,主要用在数据中心领域。能够提供28 GB/s的性能。据美光测试,相较于PCIe 5.0 SSD,9650 SSD的随机写入与随机读取的存储能效分别提升高达25%和67%。
第二款是美光6600 ION SSD,单盘容量最高达245TB,主要应用在超大规模部署与企业级数据中心整合服务器基础设施、构建大型AI数据湖。相较于竞品,该产品的存储密度提升高达67%,单机架存储容量突破88PB,大幅降低总体拥有成本(TCO)。
第三款是美光7600 SSD,主要用于AI推理与混合工作负载。据称,能够在高度复杂的RocksDB工作负载下实现业界领先的亚毫秒级延迟。
从美光推出的产品来看,瞄准的正是:速度、容量、性价比。从美光最新的财报来看,截至2025年5月29日,美光Q3财季营收93亿美元,同比增长37%;净利润21.81亿美元,同比增长210.7%。其中,美光的NAND收入21.55亿美元,占总收入的23%,环比增长16.2%。NAND Bit出货量环比增长约25%。美光表示,2025财年有望实现创纪录的营收。
Solidigm:优化AI效率的存储产品组合
Solidigm将AI 存储方案大致分为两类。
一类是,直连式存储(DAS),针对训练等对性能极度敏感的场景,它更关注单位功耗下的IOPS;另一类是网络存储(包括NAS文件/对象存储),针对数据摄取、归档和RAG(检索增强生成)等大容量场景,对读性能要求较高,同时也追求最低成本存储海量数据。
目前,Solidigm构建了覆盖SLC、TLC和QLC的完整SSD产品序列。从高性能的D7系列到高密度的D5系列,Solidigm能够为数据摄取、准备、训练、检查点、推理和归档等AI全流程的各个环节,提供最合适的产品。这其中包括了D7-PS1010、D7-PS1030PCIe 5.0 SSD,大容量D5-P5336QLC SSD等。
Solidigm在AI SSD中的另一个亮点是QLC SSD。自2018年发布首款QLC SSD以来,Solidigm已累计出货超过100EB的 QLC,并为全球70%的领先OEM AI解决方案提供商提供服务。
Solidigm不仅推动QLC技术的普及与应用,还在液冷SSD技术领域进行大胆尝试。2025年3月,Solidigm展示其首款采用SolidigmD7-PS1010 E1.S 9.5mm外形规格的冷板液冷SSD,该方案显著提升了散热效率。
03
一路向上
尽管大多数AI SSD预计是在2026年推出,但从前文的对比来看,AI SSD已经有了雏形。
从颗粒的选择上,AI SSD会朝着QLC颗粒方向走。铠侠CEO柳茂知也表示,QLC SSD是AI行业最好的选择。尽管从SLC到MLC,再到TLC,最终到QLC,SSD的性能一直在下降,但随着技术的演变,2025年QLC SSD的速度已经比2017年的TLC SSD快很多了。如今QLC SSD的顺序读写速度可达7000MB/s左右,性能十分强大,能够满足AI大模型数据存储和调用的要求。
基于100 兆瓦数据中心的AI基础设施规模 来源:Solidigm
从实际测试中,Solidigm构建了一个新100兆瓦AI数据中心的模型,评估 QLC 固态硬盘、TLC 固态硬盘和基于机械硬盘的混合部署的影响。 其中发现,QLC 固态硬盘的能效比 TLC 固态硬盘高19.5%;比混合TLC 固态硬盘和机械硬盘高 79.5%,同一数据中心内,使用QLC 固态硬盘时可部署的全套 AI 基础设施数量更高。
从传输接口与协议层面来看,采用PCIe接口并支持NVMe协议,未来大概率会成为 AI SSD 的标准配置。PCIe 接口凭借不断升级的带宽能力,从 PCIe 3.0 发展到如今的 PCIe 5.0,目前业内已经推进到了PCIe 7.0(6月份发布了)。
可以从前文看到,目前推出的SSD大多是支持PCIe 5.0的,美光已经推出了PCIe 6.0的产品,顺序读取速率高达 28GB/s,到明年有竞争力的AI SSD应该都用上PCIe 6.0。
不过,PCIe目前在成本上还是比较昂贵,首批PCIe 6.0 SSD产品价格高达500-800美元(1TB),是普通PCIe 4.0 SSD的3倍-5倍。同时,产品需搭配支持PCIe 6.0的CPU及主板。
此外,NVMe 协议专门针对闪存存储进行优化,为SSD提供了极高的I/O吞吐量和低延迟,这对于减少数据访问瓶颈非常重要。在PCIe 接口之上构建了高效的数据访问机制,极大地降低了延迟,提升了 IOPS 性能,能充分发挥闪存的快速读写特性。随着技术发展,PCIe 接口和 NVMe 协议还会持续演进,融入如CXL等新兴技术。
04
热闹之下
AI SSD的赛道,越来越拥挤。
从云端训练到边缘推理,存储不仅要保证基础性能,更需要与AI计算流程深度适配。存储厂商正在调整技术路线,从单纯追求性能指标转向优化整体系统协同。这种转变反映了行业对AI工作负载特性的深入理解。
当前的技术竞争焦点,已从硬件参数的比拼,转向如何实现存储与计算的无缝配合。毕竟在AI时代,最好的SSD不是跑分最高的那块,而是让AI“忘记”存储存在的那块。
来源:半导体产业纵横