解决AI数据中心的电源挑战

360影视 欧美动漫 2025-05-05 09:08 2

摘要:随着人工智能(AI)继续在数据中心运营中发挥核心作用,对高效高性能电源解决方案的需求变得越来越重要。AI工作负载需要大量计算资源,从而导致功耗和发热量升高。

半导体工程师 2025年05月05日 09:03 北京

随着人工智能(AI)继续在数据中心运营中发挥核心作用,对高效高性能电源解决方案的需求变得越来越重要。AI工作负载需要大量计算资源,从而导致功耗和发热量升高。


这些挑战需要在电源数据转换和分配方面采用创新方法,重点是优化电源管理IC、转换器、栅极驱动器和功率MOSFET等电子元器件。


推动AI数据中心电源解决方案发展的趋势


AI数据中心正在经历快速转型,以满足日益复杂的工作负载的需求。更高的总线电压、先进的负载点(POL)电力输送架构和先进电源管理器件的集成等关键趋势正在影响着电源解决方案的发展。这些进步旨在提高能效、减少热挑战并支持下一代AI应用所需的可扩展性。


提高总线电压以减少损耗


数据中心电源设计中最显著的趋势之一是转向更高的总线电压,例如从12V过渡到48V甚至更高。这一转变解决了传统低压系统固有的几个低效率问题:


降低电流:更高电压的系统在提供相同功率时所需的电流更小,从而大大降低了导体和连接器中的电阻损耗以及所需的散热量。


提高功率密度:更低的电流可转化为更小、更高效的配电器件,从而实现更高的功率密度,并最大限度地减少空间要求。


在数据中心和服务器等应用的配电系统中,中间总线转换器(IBC)正变得越来越流行。它是一种DC/DC转换器,用于将中央电源的高压(例如48V或400V)降压为分布在系统中的中间电压(例如12V或8V)。该中间电压在POL处进一步转换成较低电压,为各种元器件供电。

现代IBC的效率极高,通常超过95%,可最大限度地减少能量损失和散热问题。它们外形小巧,可安装在密集的电子系统中,通常在输入和输出之间提供电气隔离,从而提高安全性并减少噪声传播。


Flex电源模块公司(Flex Power Modules)最近推出了两款非隔离非稳压IBC,专为为AI、机器学习和云应用供电的数据中心而设计。BMR321(图1)具有固定的8:1转换比,可实现从40-60V到5-7.5V的高效一步式电源转换。它提供750W的连续功率输出,并可处理高达1,500W的峰值功率。此外,该DC/DC电源转换器的峰值效率高达98%以上,同时还保持了符合开放计算项目(OCP)标准OAM v2.0的紧凑尺寸。



图1:Flex的BMR321 IBC。(来源:Flex Power Modules)


BMR316采用固定4:1转换比设计,可有效地将48V电压降压至12V。它提供1kW的连续功率输出,并支持高达3kW的峰值功率输出。BMR316在峰值负载下的功率密度超过900W/cm3,采用超小型封装,尺寸仅为23.4×17.8×7.65mm。它的输入电压范围为38-60V(峰值为68V),输出电压范围为9.5-15V。


POL功率输出


AI数据中心持续增长的电力需求给整个电源转换链(从AC/DC电源到直接位于处理器旁边的POL级)带来了巨大挑战。


AI依赖于大规模并行计算,利用图形处理单元(GPU)和张量处理单元等架构。这些处理器具有数百个内核和高带宽内存,或采用单片集成,或采用衬底上晶圆上芯片(CoWoS)技术在同一封装内横向配置为堆叠裸片。


针对这些应用,英飞凌科技推出了TDM2254xD电源模块系列(图2)。这些模块旨在通过增强电气、散热和机械性能,为高性能计算平台提供高效的电压管理,支持绿色AI工厂的愿景。


该模块采用独特的设计,通过专门的电感器配置促进从功率级到散热器的有效热传导。这种设计优化了电流和热量传输,在满负荷下实现了比行业标准模块高2%的效率提升。英飞凌表示,提高GPU内核的电源效率可显著节省能源,从而为计算生成式AI的数据中心节省了数兆瓦的电力。



图2:英飞凌的TDM2254xD双相电源模块。(来源:英飞凌科技)


针对AI和高性能计算,安普沃尔半导体公司(Empower Semiconductor)推出了AI供电平台Crescendo,旨在提高AI数据中心的效率和性能。与传统的横向供电系统不同,Crescendo采用垂直供电,直接向AI芯片供电。这种创新方法无需使用笨重的旁路电容器,并将供电损耗降低高达10%,从而实现更精简、更高效的设计。


该平台还集成了Empower专有的FinFast技术,可提供高速、高精度、高效率的电源。即使在要求最苛刻的AI工作负载下,也能确保精确、灵敏的电源调节。


凭借紧凑、超薄的外形(图3),Crescendo最大限度地提高了数据中心的空间利用率。其高密度设计可实现无缝集成,提供支持AI基础设施日益增长的需求所需的功率密度和性能。



图3:Empower的Crescendo供电平台。(来源:Empower Semiconductor)


功率半导体的进步


微芯科技(Microchip)的IGBT 7产品组合是硅器件的最新进展之一。它提供各种封装选项、拓扑结构以及电流和电压范围,专为满足数据中心日益增长的电力需求而设计。这些模块降低了集电极发射极饱和电压和续流二极管正向电压,从而最大限度地减少了传导和开关损耗,提高了能效。它们的散热能力也得到了增强,在结温高达175℃时仍能保持过载能力,从而使它们能够在苛刻的环境中可靠地运行。


性能改进还包括电流处理能力提高了50%,使其非常适合现代大功率应用。动态电压(dv/dt)可控性的增强降低了电磁干扰(EMI)和开关损耗,而续流二极管软度的提高确保了开关期间的平稳过渡,从而降低了系统压力并提高了可靠性。此外,与传统产品相比,这些模块简化了驱动要求,简化了集成并降低了设计复杂性。


氮化镓(GaN)和碳化硅(SiC)器件等电源转换新技术在支持高压运行方面也发挥着至关重要的作用。与传统的硅基器件相比,这些宽禁带(WBG)材料具有更低的开关损耗和更高的热导率,使转换器和栅极驱动器能够在更高的电压下高效运行。


GaN和SiC电源模块和分立器件的采用正在彻底改变AI数据中心的电源格局。主要优势包括:


高开关速度:宽禁带器件可实现更快的开关频率,从而减小电源转换器中电感器和电容器的尺寸。


改善散热性能:凭借更低的传导和开关损耗,这些材料可在不影响可靠性的情况下实现更高的功率密度。


电压范围更广:GaN和SiC器件非常适合现代数据中心不断增加的总线电压。


最近的一个例子是纳微半导体(Navitas Semiconductor)的8.5kW电源(PSU),据称这是业界首款用于下一代AI和超大规模数据中心的电源。该电源结合了GaN和SiC技术,效率高达98%。


这款经过AI优化的54V输出电源符合OCP和Open Rack v3规范,利用三相交错功率因数校正(PFC)和LLC拓扑中的大功率GaNSafe功率IC和第三代快速SiC MOSFET,以最少的元器件数量提供最高的效率和性能。


数字电源管理


数字电源控制作为实时优化供电的一种手段,正日益受到重视。该技术具有以下优势:


dv/dt扩展:根据工作负载要求调整电压水平,可最大限度地提高效率。


远程监控:对电源指标的持续监控可实现预测性维护,并提供运营见解。


自适应控制算法:这些算法可确保在不同负载条件下实现最佳运行,从而提高整体电源稳定性和效率。


纳微半导体还开发了专利IntelliWeave数字控制技术,该技术集成了大功率GaNSafe功率IC和第三代快速SiC MOSFET,专为AI数据中心电源而设计。集成大功率GaNSafe功率IC的数字控制技术已在500kHz GaN交错式3.2kW临界导通模式PFC电源上进行了测试,峰值效率达到99.3%,其中包括EMI滤波器的损耗,与当前解决方案相比,功率损耗降低了30%。


热管理取得进展


由于高性能处理器和高密度硬件配置的功耗增加会产生大量热量,因此先进的热管理至关重要。有效的热管理可确保元器件在安全的温度范围内运行,防止过热,减少功率损耗,提高系统效率并保持最佳性能。


Axiado公司的动态热管理(DTM)解决方案就是一个例子,该公司是一家AI驱动的基于硬件的平台安全解决方案提供商。DTM解决方案由Axiado的可信控制/计算单元(TCU)提供支持。通过利用TCU(内置AI的安全SoC),DTM解决方案可让AI驱动的数据中心根据实时服务器工作负载动态调整冷却,从而降低能耗。这种先进的热管理技术可优化冷却,从而在提高每瓦性能的同时大幅节约成本,同时支持AI数据中心实现碳中和运营。


更高的总线电压、高效的POL传输和宽禁带半导体的采用是AI数据中心电力电子技术发展的标志。随着对计算能力的需求不断上升,这些趋势将确保能效和性能保持可持续性,为未来AI驱动的创新铺平道路。


来源于电子工程专辑,作者Stefano Lovati

半导体工程师半导体行业动态,半导体经验分享,半导体成果交流,半导体信息发布。半导体培训/会议/活动,半导体社群,半导体从业者职业规划,芯片工程师成长历程。283篇原创内容公众号


来源:芯片测试赵工

相关推荐