人工智能数据中心的电源管理

日期:2025-05-19
 人工智能工作负载如何驱动数据中心的电力需求,以及为什么网格到芯片解决方案是超大规模企业的关键
 
作者:Flex嵌入式和关键电源高级副总裁Mattias Jansson
 
人工智能的能力正在彻底改变行业,并导致数据中心功耗急剧上升。在人工智能工作负载和其他GPU和CPU功耗密集型应用的快速增长的推动下,数据中心的电力消耗预计将从2022年到2026年翻一番,达到每年1000 TWh以上。
从成本和环境的角度来看,用电量的增加给数据中心运营商带来了减少用电量的压力。随着高密度服务器机架的功耗上升,这带来了严峻的挑战。
虽然液冷机架已经支持超过100千瓦的密度,但Data Center Frontier强调了行业预测,即未来机架密度可能超过每机架500千瓦。
如何控制电力系统的用电量?关键因素是效率。通过减少损耗,效率的提高意味着更少的电力被浪费。


 
减少损失还可以减少电力系统中产生的热量,这意味着数据中心冷却系统可以更小,使用更少的电力。
电源系统必须尽可能紧凑,以适应数据中心的可用空间。使用较小的电源,数据中心可以迁移到不同的电源架构,例如在机架和板级别使用多个电源转换级的中间总线转换器(IBC)。
 
 
IBC架构
现代处理器芯片的核心可以在仅约400mV至900mV的低电压下运行。这通常是使用中间总线分阶段完成的,而不是一步从输入的交流电源产生,这将需要庞大而昂贵的接线。
首先,输入电源通常转换为48VDC或54VDC,用于在服务器机架周围配电。这提高了电气安全性,并使电流保持相对较低,允许电缆尺寸小于处理高电流所需的尺寸,同时最大限度地减少欧姆(I2R)损耗。
在机架中的每个服务器刀片内,IBC将48V或54V输入转换为中间总线电压,通常为12V。该电压通过电压调节器模块,以在多个板和芯片所需的非常高的电流下实现低电压。
 
一系列嵌入式解决方案
Flex提供了许多嵌入式电源解决方案来满足数据中心的要求。这些包括AC/DC电源和机框、DC/DC转换器和储能系统(见图)。这些产品提高了电源效率,减少了空间使用,同时帮助客户简化了设计,缩短了上市时间。
 

1: Flex的嵌入式电源解决方案系列
 
该系列包括用于数据中心应用的板载DC/DC模块的全面产品组合。这些模块以紧凑的外形尺寸提供,以节省空间,通常在40V至60V的窄电源电压下运行。它们可以使用单个模块满足高达3kW的功率要求,但也可以通过并联多个模块来实现更高的功率。
通过使用电感器-电感器-电容器(LLC)和开关电容转换器(SCC)拓扑结构和尖端组件,可以实现超高功率密度水平。LLC谐振转换器采用零电压开关和零电流开关工作,在提高热性能的同时降低了开关损耗和电磁干扰,使其成为高效应用的理想选择。
相比之下,SCC利用电容器之间的电荷再分配,以较小的电感器尺寸实现高升压或降压电压转换比,从而提高功率密度。将这些拓扑与宽带隙半导体和高频开关控制器等组件集成,使电源设计人员能够进一步优化效率,减少占地面积,并增强现代电子系统的整体电源处理能力。
另一个创新领域是垂直功率传输(VPD),它将电压调节器模块直接放置在印刷电路板(PCB)底部的处理器下方。通过最小化功率在PCB上的传输距离,VPD显著降低了能量损失并提高了整体效率。稳压器与VPD的接近降低了电源平面电阻并增加了电流密度,从而实现了更可靠、更高效的电源,以提供高电流、低电压和极快的负载瞬态响应。相比之下,传统的横向功率传输方法通常会导致PCB上的大量功耗,增加能源成本并使热管理复杂化。
除了转换器和模块,Flex还提供一系列其他定制电源产品,如电源架,可以根据客户的特定要求进行定制。这包括GB200,它由六个电源单元组成,最大总输出功率为33kW。该解决方案可以为机架内的所有有效载荷提供直流电源,包括要求最高的GPU。
该公司的电容式储能系统(CESS)旨在与服务器机架电源系统集成,有助于解决人工智能数据中心的重大公用事业电源挑战。CESS通过在大瞬态或浪涌期间平衡数据中心公用事业电源的峰值,提高了能源效率,并确保了更稳定的电源管理。
 
更广阔的图景
除了嵌入式电源管理,数据中心提供商还在寻找供应商,为电源的所有部分提供解决方案。这包括开关设备、母线槽、配电、先进的液体冷却系统等。
Flex是唯一一家拥有从电网到芯片的电源组合的数据中心基础设施制造商。事实上,通过收购Anord Mardix和Crown Technical Systems等关键电源供应商,Flex凭借先进制造和生命周期服务支持的广泛产品组合,满足了80%以上的数据中心需求。
数据中心的配电可能会带来技术挑战,需要设计关键电源解决方案来防止停机和管理效率。停电、负载不平衡和配电效率低下的风险可能会导致重大后果,从服务中断到过热和设备故障。
可扩展性是另一个重大挑战。传统的电力基础设施可能难以跟上数据中心的扩张,这通常需要昂贵而耗时的修改。Anord Mardix开发的预制模块化系统可以简化这一过程。本质上,这些单元将变压器、开关设备和不间断电源设备等组件集成到一个紧凑的、经过预测试的组件中。这些系统的好处是可以快速部署,减少安装时间并最大限度地减少中断,特别是对于快速通道数据中心建设或空间有限的位置。
配电的灵活性至关重要。许多设施仍然依赖于基于电缆的系统,这可能会导致布线混乱、电压不一致和适应性有限。母线槽系统提供了一种更动态的替代方案,可以在不关闭系统的情况下添加或重新配置电源分接。此解决方案在IT负载频繁变化的超大规模环境中特别有用。
总之,随着数据中心不断发展以适应日益复杂的工作负载和更高的计算需求,对可扩展、可适应和节能的电源解决方案的需求比以往任何时候都更加迫切。凭借优化从电网到芯片的配电的完整垂直集成解决方案组合,Flex使公司能够大规模解决计算和电力挑战,并支持人工智能数据中心的快速扩展。
 
液体冷却
随着每个机架提供的功率增加,热量也会增加,这将随着计算基础设施的扩展和进步而继续扩大,需要采用传统空气冷却之外的创新冷却技术。直接芯片冷却将热量从处理器传递到液冷冷板。
数据中心的这种方法在热量传输/移除方面可以显著优于强制空气冷却,并使电路板设计更加灵活,因为处理器和散热器不必放置在出风口附近。JetCool使用微射流技术精确定位热点,提高芯片级的冷却效率。
 
flexpowermodules.com
 
 

订阅我们的通讯!

电子邮件地址