颠覆认知!SSD竟然怕冷不怕热?研究揭秘3D NAND的温度效应

360影视 动漫周边 2025-09-15 11:37 2

摘要:别急着反驳,这可不是我信口开河。前段时间和朋友WittmanARC讨论SSD时,我们找到到了来自山东大学信息科学与工程学院陈杰智教授团队的一篇重磅论文《Temperature Impacts on Endurance and Read Disturbs in

大家好,我是飘雷。

提起影响SSD健康的因素,我们脑海里总会首先想到温度。长久以来,我们都遵循着一个常识:

电子产品怕热,高温是性能杀手,更是寿命克星。

为此,我们想方设法给SSD进行被动和主动散热,时刻监控温度,生怕它过热中暑。

但如果我告诉你,对于当今主流的3D NAND闪存,这个常识其实并不绝对正确呢?

你的宝贝SSD,或许并不是那么怕热,反而更讨厌寒冷?

别急着反驳,这可不是我信口开河。前段时间和朋友WittmanARC讨论SSD时,我们找到到了来自山东大学信息科学与工程学院陈杰智教授团队的一篇重磅论文《Temperature Impacts on Endurance and Read Disturbs in Charge-Trap 3D NAND Flash Memories》。

为了全面了解温度对 3D NAND 闪存的影响,这项研究在较宽的温度范围(-30~70°C)内对采用三层单元(TLC)结构,并采用电荷陷阱(Charge-Trap)技术的 3D NAND 闪存芯片进行了性能测试,重点关注编程/擦除(P/E)循环过程中的原始比特错误率(RBER)变化(即存储器的耐久性),以及频繁读取操作对存储性能的影响(即读取干扰),并且取得了有些反常识的实验结果:

对于主流的电荷阱型3D NAND,它展现出了奇特的喜暖厌寒特性,适度的工作温度不仅无害,反而有助于降低错误率,提升可靠性。

真正的可靠性挑战,可能更多地潜藏在那些我们不常关注的低温场景中。

今天,我们就来解读一下这篇论文,看看它将如何刷新我们对SSD的认知。

在2D NAND时代,存储单元利用浮栅(Floating Gate)来存储电子,闪存颗粒确实很怕热。其工作原理可以简单理解为:高温会让浮栅里的电子们变得活泼,更容易越狱逃跑,导致数据出错和丢失。

因此,温度越高,数据保持能力越差,错误率(RBER)越高,寿命衰减也越快,这套理论深入人心,也让我们形成了高温=杀手的固定思维。

但时代变了,技术在进步。现在市场的主流是3D NAND,特别是电荷阱架构。它的结构和原理都发生了根本性变化,通过堆叠存储层来提升比特密度,从而解决了平面面积缩放带来的问题;因此,关键问题变成了可以堆叠多少层存储层。

上图左侧为2D NAND 串和 3D NAND 串的示意图,其中,3D NAND 单元包含核心氧化物、多晶硅通道、隧穿层、控制层(CT 层)、阻挡层(blocking layer)以及控制栅极(control gate)。

上图右侧为TLC的工作原理:每个单元存储 3 位数据,分别位于三个页面上——最高有效位(MSB)、中间有效位(CSB)和最低有效位(LSB);V1~V7 表示读取电压,其中 V th 定义了电压的下移误差(down-shift error)和上移误差(up-shift error)

那么3D NAND的温度特性是否也和老前辈不一样呢?山东大学的团队就带着这个问题,进行了一系列实验。

研究团队使用专业的NAND测试平台,在一个可以精确控制温度的环境(-30℃ 至 70℃)中,对具有 64 层堆叠、5912 个有效存储块、每个存储块包含 768 个逻辑页、每页 18,336 字节的电荷阱型3D TLC NAND 闪存芯片进行了两大核心测试:擦写磨损测试(模拟长期使用后的寿命衰减)和读取干扰测试(模拟高强度连续读取数据),结果出人意料!

我们通常认为,反复擦写(P/E)会磨损NAND,温度越高,磨损应该越严重,错误率也越高。但实验结果却恰恰相反。

在-30℃的低温下,原始误码率(RBER)最高。随着温度升高到70℃,RBER反而显著下降,处于最低水平。

这意味着,在一定范围内,温暖的工作环境反而有利于降低3D NAND的写入错误。低温环境下的闪存状态更差,更容易出错。

研究团队还做了一个交叉温度实验:他们让一组闪存先在70℃下受虐一段时间,再降回25℃继续测试。结果发现,经历过高温烤验的芯片,其后续的磨损退化速度并没有比一直在常温下工作的芯片更快。

读取干扰(Read Disturb)是NAND闪存的一个固有问题,指的是当你频繁读取某个数据块时,可能会不小心影响到旁边邻居的数据,导致它们出错。

实验结果再次颠覆了我们的认知:

在-30℃的极寒环境下,读取干扰最严重,错误率随着读取次数增加而飙升。在常温和高温下,读取干扰现象被大大抑制。最神奇的是在70℃高温下,随着读取次数的增加,RBER竟然出现了一个微小的下降趋势

这简直是遇强则弱,遇暖则愈。出人意料的是,低温下频繁读取数据,对SSD的伤害最大;而在高温环境下,读取干扰不仅没那么可怕,甚至还能修复一部分已有的错误位,展现出一种奇特的恢复现象。

论文进一步分析发现,这种恢复主要得益于高温抑制了一种叫做up-shift errors(电荷意外增加型错误)的发生。

这项研究成果,对存储行业和普通消费者都有着重要的指导意义。

1. 对SSD厂商和工程师:

重新思考温控策略: 传统的SSD固件温控策略,核心思想是降温保命。但这项研究表明,对于3D NAND,过度的、激进的降温可能适得其反,尤其是在一些需要极高数据可靠性的企业级应用中(如寒冷地区的户外设备、需要强力制冷的数据中心)。低温场景下的可靠性设计是新挑战: 工程师们未来可能需要投入更多精力去优化NAND在低温下的工作特性,而不是一味地和高温作斗争。性能调度优化: 论文还发现,温度和P/E次数会影响编程时间。基于此,可以建立更精准的性能预测模型,让SSD的I/O调度更智能、更高效。

2. 对我们普通消费者:

别再温度焦虑: 看到你的SSD NAND工作温度在50℃、60℃,甚至接近70℃,不必过分担心。这很可能正是它发挥稳定、错误率较低的舒适区。只要没到触发过热保护(通常在80℃以上)导致降速的程度,就让它热情地工作吧。警惕极端低温环境: 如果你的设备需要在户外等严寒环境下工作,那么你可能要更关心低温对SSD数据可靠性的影响。散热依然有意义: 需要强调的是,这项研究并不是说散热片就没用了。给SSD散热,主要目的是为了让主控芯片保持凉爽,避免主控过热降频影响性能,同时也能确保NAND工作在一个稳定、适宜的温暖区间,而不是让它越冷越好。

科技总是在不断发展中打破我们固有的认知。这项研究就像一把钥匙,为我们打开了深入理解3D NAND闪存世界的另一扇门。

下一次,当你看到SSD在努力工作、散发着热情时,或许可以少一份焦虑,多一份安心。毕竟,它可能正在自己最舒服的温度下,为你稳定地服务呢!

标题: Temperature Impacts on Endurance and Read Disturbs in Charge-Trap 3D NAND Flash Memories

作者: Fei Chen, Bo Chen, Hongzhe Lin, Yachen Kong, Xin Liu, Xuepeng Zhan and Jiezhi Chen

单位: 山东大学信息科学与工程学院,高端服务器与存储技术全国重点实验室

期刊: Micromachines 2021, 12, 1152

来源:噩梦飘雷

相关推荐