了解并克服在数据中心为人工智能提供动力的挑战

日期:2022-09-18
 
如何使用合适的AI专用电源解决方案为下一代数据中心提供可靠、高效和可扩展的电源架构
作者:Matt Hunter,高级应用工程经理,Infineon Technologies
 
今天的数据中心通常包含连接到多个硬盘驱动器的双CPU服务器。这些服务器系统擅长存储大量信息,同时处理有限数量的信息。然而,它们并不是为处理海量数据而优化的,这些数据有助于保护我们免受黑客攻击,回答有关宇宙的问题,甚至驾驶汽车。
对于这些巨大的计算密集型任务,需要人工智能(AI)和机器学习处理器。人工智能芯片的工作方式不同于通常设计用于管理任意数量的一般任务的CPU,因此,它不是任何领域的专家。另一方面,人工智能处理器被设计为只做一件事——处理大数据集。它擅长做几件事,但每件事都做得非常快。它还可以很容易地分割成更小的处理器块,从而可以将许多并行的较小处理器设计成单个大型ASIC。
 
结果是拥有500多亿晶体管的大规模人工智能ASIC,所有这些都需要一个共同点——功率。随着人工智能系统进入大规模数据中心,密度和功率挑战与这些系统的计算性能一样激烈。
 
在本文中,我们探讨了在数据中心为人工智能供电的挑战,从将更多硬件压缩到更小系统的密度挑战,到寻找通过更小电线传输更多电流的方法。然后,我们考虑英飞凌如何通过持续开发针对数据中心的节能[1]AI专用电源解决方案来应对这些挑战。
 
电力输送
传统上,在数据中心,服务器的电源是从AC墙壁插座获取的,然后使用“银盒”电源将其转换为12 V DC。然后将该12 V DC电压调节到约1V,以向处理器IC供电。选择12V是因为它允许在电源故障时备用电池。然而,尽管这项技术已经成功应用了几十年,但在应用于数据中心时,需要进行更仔细的检查,因为数据中心有多种电力传输方法。
 
一种选择是将AC分配给每台服务器,但这需要在每台服务器上安装一个“银盒”和电池。将DC直接分配给每台服务器导致采用集中式AC-DC转换器和集中式电池组的机架(或多机架)配电方案。虽然这可以提高运行效率,但随着每个集中式电源上的服务器数量的增加,12 V总线上的电流也会增加,这使得配电具有挑战性,因为电流达到数百或低千安培范围。将配电电压增加到更高的电压可以显著降低这些电流和伴随的功率损耗。
 
过渡到48 V
虽然48伏在逻辑上似乎是下一个要使用的最高电压,但在数据中心使用它的过渡很慢。然而,人工智能带来了一系列不同的挑战,处理器现在被设计为独立模块上的节点,从而可以显著提高处理性能。如果单个处理器互连,每个处理器支持的互连越多,数据带宽越高,性能越好。
 
在模块或子组件中传输所有这些信号的连接器必须具有稳健的信号完整性,这可以通过使用专用引脚来提供。然而,这限制了剩余的电源引脚数。48V引脚提供的功率是12V引脚的四倍,因此迁移到更高的总线电压对于AI来说是有意义的。OAM形状尺寸(开放计算项目提供的标准化AI模块化解决方案)定义了350W的功率限制(如果使用12伏总线电压),但对于48伏,功率限制更为宽裕。
 
增加总线电压可以降低功率损耗,但使用哪种电压的选择没有明确定义。虽然48 V是众所周知的,但在一些计算系统中,使用54 V,并且在电源故障期间,这甚至可以达到60 V。如果总线转换器的输出是另一个调节到固定电压的DC-DC降压转换器,则输入电压的轻微变化不是主要问题。然而,对于风扇、硬盘驱动器或扩展插槽等其他组件,需要固定的12伏电源,因此需要调节的中间总线转换器。为此,英飞凌开发了适用于数据中心的中间总线转换器解决方案,该解决方案使用48 V配电,包括稳压和非稳压版本。
 
中间总线转换器解决方案
三种拓扑中的第一种是开关储能电容器(STC)转换器的变体。它使用寄生电感器实现谐振谐振谐振电路。一个附加的电感器使所有MOSFET能够实现零电压开关(ZVS),而不管电流负载水平如何,称为零电压开关开关电容转换器(ZSC)。这允许更小的电路,没有电感器饱和限制。它的效率为99%,在48 V时提供超过1 kW的满载功率能力(见图1)。
 
图1:4:1零电压开关(ZVS)开关电容器(ZSC)拓扑
 
第二种解决方案是双级稳压开关电容器(DR-HSC)转换器,它解决了输入电压在40 V到60 V之间的12 V稳压电源的需求。DR-HSC是一种级联两级方法(见图2a)。第一级包括ZSC 2:1,第二级由两个多级半桥组成。半桥的相位节点短接至公共电感器,并以相移180°的方式进行控制,以实现自然飞行电容器平衡(见图2b)。
 
图2a:稳压12 V总线转换器

图2b:稳压12 V总线转换器
 
在这种情况下,分析DP-3LFC在不同占空比下的行为是有趣的。特定情况下为50%占空比。在该操作模式下,输出电感器纹波几乎为零,允许使用VRM电感器值。该方法的总效率为98.5%,具有分离两个中间阶段的额外灵活性,以更好地利用现有板布局,更有效地进行人工智能。
 
第三种选择使用混合开关电容器(HSC)转换器。HSC结合了开关电容转换器的优点和磁性器件的高降压比能力。通过电容器和磁性器件传输能量,效率和功率密度可以大幅度提高,达到98%以上的效率。
 
这些模块设计允许在系统板上灵活放置,而不会受到高速PCB布线的干扰。
 
第二阶段进展
随着功率水平的增加,AI处理器需要更低的输入电压(低于1V DC)。转换器的第二级中所需的电流量也增加。
 
常见的解决方案包括并联降压DC-DC级以制造多相转换器。这些可以成倍增加功率,改善瞬态性能,减少输出纹波,但占用更多空间。英飞凌最新的功率级[2]每相可提供高达90安培的电流,其数字控制器现在最多支持16相。然而,虽然它们可以提供所需的直流电流水平,但它们仅适用于具有大电感器空间和足够冷却的环境。
 
不幸的是,AI既不提供奢侈,也不限制部件高度,从而降低了每相的允许电流,从而导致相位计数不断增加。一些AI卡现在正接近多相调节的30个相,虽然这看起来很极端,但必须注意,大多数AI处理器使用多个输入电压。虽然主轨承载最高电流,但几个附加轨也可以承载超过100安培的电流。这些多相调节方案提供了灵活性,可满足当今高性能AI处理器的所有电源轨要求。
 
英飞凌最新的功率级满足在数据中心实现AI的效率和热要求。所示AI评估板具有12个功率级,放置在OAM指定的安装孔之间(北和南)。这可以通过使用新的4×6 mm2功率级而不是标准的5×6 mm2封装来实现。这允许每侧有两个额外的相位(总共四个),提供额外的200安培功率。考虑到OAM形状因数中AI处理器的功率限制,每增加一个效率百分比,处理器就可以获得更多的功率,并减少必须从电源中去除的热量。这里,在1.8V下,效率几乎为95%。
 
为了确保最高的系统性能,英飞凌还开发了一系列新的数字多相控制器[3],以满足对高质量电源日益增长的需求。第七代数字控制器具有多种封装中的电流模式控制,每个控制器支持8、12、甚至多达16相。它在双环设计上保持了完全的灵活性,并支持2MHz(或更高)的开关频率。
 
XDP™ 数字控制器包含高性能专用模拟前端,并使用状态机控制闭环调节。外部接口由集成的ARM®Cortex®-M0微控制器管理,允许基于固件的通信协议升级、新功能请求,甚至是最后一分钟的规格更改。更具体地说,XDPE控制器被设计为用作一系列下一代控制器的平台,允许在各种产品平台上进行更简化的IC开发过程,首先是减少延迟和快速ADC,以快速响应不断变化的系统条件。英飞凌的XDP™ XDPE 152系列超瞬态相位控制器(XDPE15284D、XDPE15254D和XDPE152C4D)现在也支持跨电感电压调节(TLVR)[4],所示的32相板提供两个电子负载(见图3)。

图3:支持TLVR的高级XDPE数字控制器
 
结论
数据中心是互联网的骨干,支持我们每天使用的所有信息服务。新形式的信息应用(如人工智能处理)的能源密集型需求日益扩展了传统的数据中心电力架构。
 
本文讨论了在数据中心为人工智能供电的挑战,包括有助于向48 V过渡的拓扑。此外,我们还考虑了英飞凌如何开发创新的电源解决方案,以使数据中心的人工智能处理尽可能高效。这些解决方案解决了数据中心的基本构建块和任务,重点是改进系统架构、提高电源效率和降低冷却要求。
 
有关更多信息,请扫描以下QR码,探索英飞凌的高效节能、性能卓越的数据处理技术,用于计算和数据存储。
 
 
《2022年电源和传感选择指南》——加快元件搜索速度。扫描二维码下载

 
参考文献
[1] Infineon Technologies, “The green potential of data centers,” August 2022 [Online]. Available: https://www.infineon.com/cms/en/about-infineon/energy-efficiency-technologies/data-centers/ 
[2] Infineon Technologies, “Integrated Smart Power Stages,” August 2022 [Online]. Available: https://www.infineon.com/cms/en/product/power/dc-dc-converters/integrated-power-stages/ 
[3] Infineon Technologies, “Digital Multiphase Controllers,” August 2022 [Online]. Available: https://www.infineon.com/cms/en/product/power/dc-dc-converters/digital-multiphase-controllers/ 
[4] J. Ejury, “TLVR topology for high-current, low-voltage DC/DC power supplies,” Whitepaper, Infineon Technologies, May 2021.
 

订阅我们的通讯!

电子邮件地址