PC/AI设备的功率传输考虑因素
日期:2025-01-19
栅极密度的增加将功耗推到了新的高度
作者:Advantest全球性能数字COE经理Simondavide Tritto随着对更大功率的不断需求,高性能计算(HPC)产品在制造测试期间为测试单元提供和管理高功率带来了挑战。根据Market.us的数据,全球计算能力市场预计将从2023年的457亿美元增长到2033年的813亿美元,在2024年至2033年预测期内,复合年增长率(CAGR)为6.8%。本文重点介绍了制造测试电源的交付,分析了驱动对更多电源需求的因素,并解释了ATE系统如何在市场快速增长期间满足这些需求。
.jpg)
图1:用于AI应用的HPC设备需要大量的电力
在制造过程中,对人工智能应用的HPC设备进行测试带来了巨大的电力输送挑战。这些挑战是由于这些器件的复杂性而产生的,这些器件每单位面积的栅极密度在数亿个晶体管/mm2的范围内增加,导致大多数操作模式下的功耗很大,包括当所有栅极都处于静态模式时漏电流增加。此外,具有多核CPU/GPU芯片组合和越来越多的高速内存芯片和HSIO接口的服务器级系统在更高的时钟频率下工作,导致更高的动态功耗,因为功率P会随着电压和频率的变化而变化:
.jpg)
图2:所有测试单元组件必须提供电源管理的相关功能
解决这些功耗挑战需要创新的设计策略以及精确可靠的电源管理,以确保在整个制造过程中充分验证性能和功能。为了实现严格的电源控制,所有测试单元组件——ATE系统、接口硬件(探针卡和负载板)和处理设备(探测器或处理器)——都必须提供电源管理的相关功能。
电源管理挑战
要解决的第一个问题是电源完整性(PI),这是信号完整性(SI)的一个相关方面。PI需要复杂的滤波/解耦,以尽量减少配电网(PDN)因电感/电阻而可能注入的噪声和瞬态。PI必须从电源仪器一直保持到DUT电源引脚或焊盘。
此外,测试环境必须可扩展,以处理不同类型的HPC设备及其不同的功率要求。因此,测试仪必须适应广泛的功率水平,以支持现代HPC设备所需的多个独立控制的功率域。
因此,测试仪必须管理多个电源和控制电路,以在所有电源域上准确地提供必要的电压,并且还必须允许各种域的精确和用户可定义的加电和断电顺序,以避免损坏并确保正确的初始化和操作。
热管理
热管理是另一个关键问题。它影响整个测试单元,包括测试夹具和搬运设备,这些设备需要高效的散热机制,如先进的冷却系统。最后,在整个测试流程中,准确监测测试温度并平衡所提供的功率及其热影响是必要的。
HPC设备的功率需求在不同的测试中甚至在一次测试执行中都会迅速变化。因此,测试仪必须对功率需求的快速变化做出响应,而不会造成不稳定或延迟,电源的响应必须足够快以适应功率变化。快速响应取决于PDN及其相关电容器网络,需要本体与滤波以及陶瓷与聚合物组件的最佳组合。
同时,搬运设备必须对急剧的温度变化和峰值做出快速反应,以确保正确的测试设置和被测设备的完整性。功耗和热分布监测是正确执行测试并深入了解设备性能和效率的关键因素,特别是在设备验证和启动期间。
ATE的电源和多站点考虑因素
关于ATE系统,架构方面通常定义了测试耗电设备的可用功率预算。每个测试系统都有其可以处理/提供的功率的全球最大额定值,也有每个单独仪器的本地额定值。这些额定值考虑了测试仪硬件的几个方面:整体测试仪供电基础设施、冷却能力、组件以及电缆和连接器的载流能力,直至与测试夹具对接的机械接口。
向DUT提供所需的电源对测试设置的最大站点数量有几个影响。专注于ATE系统,越来越多的电源引脚/焊盘需要越来越多的设备电源(DPS)仪器,这些仪器在测试仪基础设施中的存在受到一些边界条件的限制。上述额定功率适用于任何系统资源,包括数字、混合信号和RF资源。在许多情况下,ATE供应商提供功率预算计算器,以确保测试仪基础设施支持目标并行性。随着当前DUT中电源域数量的增加,ATE DPS资源上的灵活联动功能(将多个DPS通道连接在一起,通过单个引脚提供组合电流的选项)可以实现更好的资源分配。
另一个方面是ATE基础设施中的资源布局。随着数字引脚和电源连接数量的增加,路由所有需要的信号成为一项挑战,特别是随着站点数量的增加。为了使布线尽可能简单,测试夹具更容易设计,测试仪资源布局和密度起着关键作用。
另一个重要参数是负载板/探针卡组件的可用空间。随着引脚数量和DPS连接的增加,信号布线的复杂性和组件(如开关和电容器)数量的增加要求测试夹具上有更多的可用空间;这个空间会强烈限制可实现的最大站点数量,因此设计ATE系统以最大化这个空间是关键。
最后但同样重要的是ATE系统的散热能力,这也会影响可实现的最大并行性。测试夹具的热特性决定了最大的现场计数,ATE仪器的冷却效率和热稳定性也是如此。
探针卡和负载板的电源处理
尖端HPC设备日益增长的复杂性也给探针卡和负载板设计带来了类似的复杂性。随着引脚数量和芯片尺寸的增加(许多HPC设备已经达到掩模版尺寸),对更多功率处理的需求推动了探针卡制造技术的一系列必要且有时相互竞争的增强。一个例子是需要更多更大/更长的功率探头和更短的高速针,导致混合探测方案,其中不同长度和力的针共存于同一探针卡中,使平面性检查复杂化,并增加了整体接触力。一个相关的品质因数是典型HPC设备的电源引脚与总引脚的比率,从早期的10%到20%左右,到最近的应用中超过60%。
由于这些原因,功率输送不仅对针,而且对所有组件的探针卡的设计都有重大影响,同时存在机械和热问题。对于前者,增加引脚数量(电源和信号引脚)会产生更高的总接触力,这反过来又要求硬度更高的针力更低(目前的趋势是低于2克/针,即将达到1克/针)。总针数为数万针的探针卡很常见,新技术使针数超过10万针。
关于探针卡的热考虑,功率意味着热量,因此整个堆栈的散热能力被推到了极限。ATE供应商正在寻求具有更好耗散系数的新方法和新材料,以增强探针卡结构的被动冷却。主动冷却方案也在评估中。最后,探针卡组件的热模拟,以及DUT的功率分布,有助于确保在正常运行期间不会出现极端热点。
类似的考虑也适用于负载板设计,其中热处理和功率处理要求适用于DUT插座结构。精确的PDN设计,然后对最终结构进行热模拟,可以确保PI和DPS的稳定性,避免热热点的风险,从而对DUT或负载板组件造成潜在的损坏。
满足HPC/AI设备的电源要求
为了支持耗电量大的HPC/AI应用,Advantest提供了V93000 SOC测试平台,该平台现已推出最新一代EXA Scale。平台仪器包括新推出的DC Scale XHC32电源,该电源与现有板卡完全兼容,能够无缝过渡到新一代高功率电源,同时有效地重用现有的DUT板。V93000 EXA Scale平台与DC Scale XPS256以及DUT Scale Duo设备接口扩展(可增加50%以上的空间和高达3倍的组件高度)一起,在整个HPC/AI设备的制造测试过程中提供了一流的电源交付和完整性。
.jpg)
图3:V93000 EXA级SoC测试平台的Advantest直流级XHC32电源
www.advantest.com
推荐行业新闻更多