摘要:从Power shelf到Power rack,电源厂商重要性大幅升级。本次GTC大会麦格米特携带Power side car的方案进行参展,同时台达也在演讲中提出下一代Rubin方案将应用Power rack。Power rack集成了Power shelf
从Power shelf到Power rack,电源厂商重要性大幅升级。本次GTC大会麦格米特携带Power side car的方案进行参展,同时台达也在演讲中提出下一代Rubin方案将应用Power rack。Power rack集成了Power shelf、BBU shelf、Super cap shelf、PDU等产品,同时IT rack柜需800V到50V转化进一步增加了电源使用,因此我们认为电源厂商参与的价值量大幅增加。同时这也意味着AI电源行业竞争壁垒增厚,需具备多产品的技术能力。
800V高压应用使得熔断器等电路保护器件用量增加。从Delta展示来看,其在Power rack、HVDC power shelf、High voltage DCDC等多处都有应用。我们认为电源单独成柜导致需要高压方案降低电流以减少线损,而高压方案则进一步带动熔断器等器件用量增加以实现灭弧等电路保护措施。
SST是下一代数据中心的供电技术路线。 SST方案能够直接将高至10~34.5KV的电流转化为800V的直流电输出,整体SST方案采用模块化设计,这也意味着电压在模块与模块之间均等分布。因此在不同的国家、地区,可以使用SST方案轻松地在不同的电压等级之间进行切换。
超级电容显著降低供电的波动性。AI数据中心不断进行训练任务并进行高速运算,当开始训练任务时负载会迅速上升至较高功率,而当训练任务结束后又会下降至较低水平。超级电容利用快速充放电的特性实现降低供电波动性,根据台达电数据其超级电容能够将供电波动性从73%降至6%。
我们认为Power shelf到Power rack的技术架构变化中最受益的仍为服务器电源厂商,其一在于其价值量增加,其二在于其竞争壁垒增厚。从单纯的Power shelf到涵盖输入/输出PDU、BBU shelf、Super cap shelf等的Power rack这意味着价值量的大幅提升,此外由于单独成柜也要求Power rack和IT rack内各自有一套power shelf分别完成800Vdc和50Vdc的输出。
风险
AI资本开支不及预期,技术路线变动,行业竞争加剧
电源架构从Power shelf向Power rack升级
对于数据中心的输配电方案来讲,本次GTC大会最大的增量在于确立Power rack为下一代技术方案路线。对于GB200/GB300而言,主要采用NVL72/36的机架形式,其将power shelf、compute node、NVlink switch、CDU等都整合至同一个长方体式的机柜内部,但随着芯片本身的迭代升级其自身功率不断升级对于供电要求也越来越高。但我们看到整个机架中75%以上的体积被Compute node所占据,没有额外的空间为增量电源以及电源配件BBU、超级电容提供空间。因此将Powershelf、BBU shelf、Super cap shelf等移出机柜组建为一套Power rack形成新的供电单元以解决当前数据中心输配电所面临的问题。
图表1:当前电源架构面临的问题
资料来源:Nvidia GTC,Delta,中金公司研究部
Power rack方案带来输配电架构更高的集成度和全新的产品架构。Power rack将power shelf、BBU shelf、Super cap shelf、PDU等集成一体化,形成高度整合的电源旁柜方案。根据麦格米特在GTC大会中展出的Side car方案来看,其输入为384V~528V的交流电输出为800V的直流电,机柜尺寸为600mm(W)*1068mm(D)*2236mm(H)。具体而言,其上端集成了PDU方案,左侧为Powershelf右侧为BBU shelf和Super cap shelf等。
图表2:麦格米特Power rack的具体方案
资料来源:Nvidia GTC,麦格米特,中金公司研究部
► PDU:根据Delta的方案,PDU分为输入PDU和输出PDU。其中输入PDU内含L1-L3三路input busbar以及多个MCB短路保护器、熔断器等;而将BBU、power shelf、Super cap shelf等收集的800V电压回流至顶部的输出PDU后则需进一步完成Power rack到IT rack之间的连接。输出PDU内含继电器、熔断器等保护器件,其中相对昂贵的线缆可以大概承受68安培的电流,对应电压为800V则其每根线缆能够支撑54KW的功率。
图表3:Side car的PDU方案
► Powershelf:根据Delta的方案,Powershelf同样分为Power rack侧和IT rack侧的两类产品。1)Power rack侧的power shelf:其将PDU侧480Vac转化为800Vdc输出,其内部仍然是采用了经典的Vienna PFC+LLC拓扑结构,但由于电压较高内部损耗更低,整体效率可以达到98%+的水平。从具体的结构来看,台达的方案为一套Power rack侧的power shelf由两组27.5kw的PSU组成,综合功率共计55kw。2)IT rack侧的power shelf[2]:其将前端的800V直流电转化为50V的直流电供给至后端的DCDC模组。从具体结构来看,单层由6组15kw的PSU组成,合计约90kw,整体效率高达98.5%以上。
图表4:Power rack 侧的Powershelf拓扑结构
资料来源:Nvidia GTC,Delta,中金公司研究部
图表5:Side car的Powershelf方案
英伟达预计2026-2027年将逐步开始应用Rubin,同步Power rack方案也将逐步落地。Rubin采用正交式的机架和Kyber方案,其具体结构为左右两个分立的机柜,左侧为IT-rack右侧为Power rack,根据英伟达估计2026-2027年将逐步应用Rubin,而2027-2028年逐步应用Feyman,而rubin方案的应用也代表着Power rack的方案将加速到来。
图表6:英伟达Kyber方案的架构(左)以及Rubin方案的时间线
资料来源:Nvidia GTC,中金公司研究部
电源架构持续升级,SST是面向未来的技术路线
谷歌曾在《+/-400Vdc Rack for AI/ML Applications》一文中给出了未来主流的数据中心供电架构演进的路线图,当前来看我们主要处于Architecture1、2,而Architecture3则代表着side car的方案,未来有望逐步进入SST方案下的输配电路线。
图表7:谷歌数据中心电源架构的Road map
资料来源:《+/-400Vdc Rack for AI/ML Applications》(Google,2024.10),中金公司研究部
从Architecture1、2到3、4最大的边际变化在于电压等级。从Architecture3开始,power shelf与服务器分离,彼此之间依靠线束进行连接。而对比来看,此前的Power shelf的输入为240V/380V 交流电,输出为50V直流电,而Power rack的存在意味着如果仍然以50V的电压等级进行输出则会在Power rack和IT rack之间的传输中电流较大,而线损往往是跟电流的平方成正比,因此需要大幅升高电压至800V以降低线损。
台达认为未来将进入800V SST的技术路线。SST方案能够直接将高至10~34.5KV的电流转化为800V的直流电输出,整体SST方案采用模块化设计,这也意味着电压在模块与模块之间均等分布。因此在不同的国家、地区,可以使用SST方案轻松地在不同的电压等级之间进行切换。
图表8:数据中心供电架构的逐步演进
资料来源:Nvidia GTC,Delta,中金公司研究部
图表9:SST架构
在IT rack侧的800V到50V电压转化也可以通过Tray level的形式进行降压。在Tray level上可以通过PDB(power distribute board)来实现板基级别的电压转化,直接将800V电压转化至50V或者12V的电压,由于电压跨度较高因此也对安全性、可靠性等提出了更高的要求,此外整体的功率密度也上升至500W/inch^3。
图表10:Tray level的800V到50V转化
超级电容的应用有望大幅提升GPU的动态负载能力
数据中心训练任务的动态负载特性主要表现为周期性、大幅度、瞬时性冲击等。AI数据中心的负载运行特点是不断进行训练任务进行高速运算,当开始训练任务时负载会迅速上升至较高功率,而当一次训练任务结束后又会下降至较低水平,而这样的波动性也对数据中心的供电构成了较大的挑战。
图表11:AI算力集群负载动态功耗曲线图
不同的超容方案特点有所差异。对比来看,EDLC方案的循环寿命较长可以达到1900万次,而LiC多为100万次左右,而EDLC的Hold up时长相对较短仅为1-2秒,而LiC约为10-15s,此外功率密度上LiC约为40-50Wh/Kg也高于EDLC的5-7Wh/Kg。
图表12:不同类型超级电容对比(左),台达的超级电容方案(右)
超级电容的具体工作过程分为四个阶段,其能够显著降低供电的波动性。具体来看,超级电容的工况依次经历50ms左右的EDPC+EDPP、20-30ms的EDPC、20-30ms的Idle以及最后的EPDC,以阶段1为例,在超过额定值的范围超级电容进行放电,在低于额定值的范围超级电容进行充电。从结果来看,超级电容能够将供电的波动性从73%压降至6%。
图表13:超级电容工作原理
资料来源:Nvidia GTC,Delta,中金公司研究部
图表14:超级电容效果对比
资料来源:Nvidia GTC,Delta,中金公司研究部
[1]https://www.nvidia.cn/gtc-global/session-catalog/?tab.catalogallsessionstab=16566177511100015Kus&search=delta#/session/1733965621606001ca8j
[2]Delta在800V到50V的电压转化过程中也提及其尝试PDB方案(power distribute board)直接实现Tray level的800V到50V/12V电压转换
本文摘自:2025年3月24日已经发布的《AI“探电”(六):GTC大会观察— Power shelf向Power rack升级》
江鹏 分析员 SAC 执证编号:S0080523080006
曲昊源 分析员 SAC 执证编号:S0080523060004 SFC CE Ref:BSW232
王颖东 分析员 SAC 执证编号:S0080522090002
来源:新浪财经