满足AI服务器电源需求的新一代GaN器件

日期:2024-01-05
  
在新的大规模人工智能工作负载的推动下,数据中心的电力需求持续上升,设计师在既定的CRPS尺寸内面临着严格的效率目标的挑战
 
纳微半导体高级应用经理Tao Wei
 
云计算中大规模人工智能(AI)的快速开发和部署,包括OpenAI的ChatGPT、微软的Bing with AI,以及谷歌的Bard和Deep Mind Gemini,正在将新的、更强大的、专门设计的AI处理器引入数据中心服务器。下一代超大规模系统预计将包含超级芯片平台,如Nvidia的DGX GH200“Grace Hopper”,每个器件的功耗高达1600W。这一趋势将使典型的服务器功率需求从目前的30-40kW增加到未来每个机柜100kW。
与此同时,随着全球对节能减排的关注,雄心勃勃的生态设计法规继续提高供电效率目标。最新的欧洲法规预计服务器电源将超过PLUS Titanium效率规范。PLUS Titanium目前是80 PLUS认证计划中的最高标准,要求在整个负载范围内达到最高效率值,并引入了一种新的10%测试来测量轻负载效率,如表所示。80 PLUS Titanium还规定,在较低的负载水平下,功率因数应至少为0.95,这需要有功功率因数校正(PFC)。


1230V输入时的80 PLUS效率规格
 
另一方面,服务器机架大小限制是既定的,并且基本上是不可移动的。众所周知,企业和超大规模市场的需求非常严峻,并推动了开放计算项目——包括Facebook、英特尔、谷歌、微软和戴尔——定义了通用冗余电源(CRPS)规范。CRPS旨在确保模块化,便于更换和维护,灵活应对不同的应用和环境,还有冗余,要求机架电源采用1U(40mm)x 73.5 x 185mm的外形。
随着服务器功率需求将增加2x-3x,设计人员现在面临着更严峻的挑战,以满足CRPS尺寸内更大功率传输和显著更高效率的需求。仔细观察一个典型的兼容电源可以提供一些见解。
 
电源设计与演进
CRPS最常用的拓扑结构是升压PFC级,然后是LLC谐振转换器(图1)。第一级执行功率因数校正,同时将AC公用电功率转换为恒定的380 VDC总线电压。第二级稳压并提供隔离,将380V总线电压转换为后续级的12 V低压输出。升压PFC在大约65kHz的开关频率下操作,以实现最佳效率和EMI性能。LLC谐振转换器的开关损耗往往较低,因此频率通常在100-150kHz之间。
 

1CRPS两级拓扑
 
随着大规模人工智能工作负载时代的到来,功率需求不断增加,要求CRPS LLC转换器提供至少1.5kW的功率。这一数字在未来可能会进一步上升。为了在12V下提供1.5 kW的功率,需要125A的电流输出。当使用LLC变压器时,需要多个输出,以最大限度地减少二次绕组和同步整流器(SR)的传导损耗。
图2展示了一种流行的配置,采用40V同步整流器(SR)MOSFET构建。该电路将两个SR并联在一起,以增加系统功率密度。


2:带三组同步整流器的半桥LLC转换器
 
传统上,工程师将绕组和SR并联在一起,以实现较低的绕组电阻。然而,这种方法会导致端接损耗,随着开关频率的增加,端接损耗变得更加明显,从而导致整个系统效率的下降。
使用并联的多个变压器,而不是绕组和SR,可以减少与AC相关的传导损耗,并最大限度地减少漏磁通,从而降低漏电感。这种方法还简化了端子设计,增强了初级绕组和次级绕组之间的交错,尤其是在绕组连接到SR的端子时。
然而,使用多个变压器会带来更大的磁芯损耗和更大的磁性元件尺寸。矩阵变压器可以通过确保铁芯之间的磁通消除来减轻这些损失。矩阵变压器将单个变压器组合在一起,使得一次侧绕组串联/并联,而二次侧绕组并联/串联。具有初级侧串联和次级侧并联连接的配置适用于CRPS LLC降压应用。
根据CRPS的规定,对于380 V和12 V输出的标称母线电压,理想的变压器匝数比计算为16(𝑁 = 𝑉𝑖𝑛 / 2.𝑉𝑜)。由于该设计包括三个变压器,因此实际比例为15。因此,在这种设置中,使用串联的初级绕组和并联的次级绕组,每个变压器需要5的匝数比。
 
如果使用传统的线绕变压器,转换器的物理尺寸仍然是一个挑战。基于PCB的平面变压器(图3)提供了一种节省空间的替代方案,并且使用自动化工艺生产,这种工艺对于大规模制造来说具有成本效益和可重复性。然而,由于PCB绕组的限制,只有当开关频率足够高以显著减少匝数时,才能实现平面变压器。


3:用于3输出CRPS LLC模块的平面矩阵变压器
 
GaN提高频率
用GaN技术取代硅MOSFET可以实现更高的开关频率,适用于平面变压器,同时保持开关损耗,以实现PLUS Titanium效率。GaN晶体管还受益于低导通损耗,这是由于它们在导通时的低沟道电阻以及硅MOSFET中不存在本征体二极管。
然而,增强模式(常关)GaN-HEMT(高电子迁移率晶体管)具有相对脆弱的栅极。MOSFET通常可以处理从-10 V到20 V的栅极电压,阈值为2 V到5 V,eMode GaN HEMT的栅极电压范围为-10 V到7 V。GaN阈值电压通常在1 V到2 V的范围内。
GaN HEMT因此需要精确的栅极控制。然而,当在高功率桥式电路中使用分立GaN-HEMT时,在低侧关断时栅极-源极电压(VGS)中的负尖峰可能超过器件的指定最大值。此外,栅极环路电感和高di/dt的组合效应可能导致严重的高侧和低侧VGS振铃。此外,还存在很高的击穿电流风险。
在与GaN HEMT相同的封装中集成优化的栅极驱动器有助于设计者正确控制VGS以避免这些风险。纳微的GaNSafe™器件集成了GaN HEMT和优化的栅极驱动电路,增加了死区控制的高级算法和1000W至22000W范围内应用所需的额外安全功能。它实现了“数字输入、电源输出”的设计方法,具有快速切换、高效率和卓越的功率密度。它旨在满足基于人工智能的数据中心以及电动汽车、太阳能和储能系统的需求。
 
这些器件具有零栅极-源极环路电感,可以在高达2MHz的频率下进行切换,以最大限度地提高应用功率密度。内置高速短路保护,具有自主“检测和保护”功能,可在50 ns内工作。静电放电(ESD)保护,通常不配备分立的GaN晶体管,而是内置的,可防止高达2 kV的事件。此外,它具有650 V连续和800 V瞬态电压能力,可以在特殊的应用条件下工作。可编程的开启和关闭速度简化了满足EMI监管要求的过程。这些器件的静态电流极低,封装在4引脚TOLL封装中,而类似的多芯片模块可能需要多达三倍的连接,并且冷却能力较差。
纳微的系统设计中心利用GaNSafe技术创建了电源参考设计,包括两个满足80 PLUS Titanium的CRPS转换器。其中包括一个1.5 kW CRPS就绪的LLC谐振转换器模块,该模块使用一个10层交错平面变压器,以适应1U高90 x 30.5 x 11 mm的尺寸。GaNSafe器件的开关频率超过600 kHz,模块的效率超过97.5%。当与98.5%的图腾柱PFC配对时,在50%的满负载下,峰值效率超过96%。
第二种设计是一个3.2kW的CRPS185数据中心电源平台,外形尺寸为40 x 73.5 x 185 mm,在30%负载时效率超过96.5%,在20%至60%负载时效率达到96%。5.95.9 W/cc的功率密度,相当于几乎100 W/in3,与可比的传统硅方法相比,尺寸减少了40%。
 
结论
在现有硅器件的限制下,满足大规模人工智能工作负载的功率需求、遵守既定的CRPS尺寸并满足80 PLUS Titanium效率是极其困难的。GaN技术允许构建高效、高功率CRPS转换器所需的高开关频率。这些器件内置门驱动、系统安全和保护功能,确保可靠性和抗故障性,满足数据中心运营商的需求。
 
www.navitassemi.com
 

订阅我们的通讯!

电子邮件地址