0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

瞬变对AI加速卡供电的影响

要长高 来源:EETOP 2023-11-16 17:23 次阅读

摘要

图形处理单元(GPU)、张量处理单元(TPU)和其他类型的专用集成电路ASIC)通过提供并行处理能力来实现高性能计算,以满足加速人工智能AI)训练和推理工作负载的需求。

AI需要大量的算力,尤其是在学习和推理时。这种需求不断地将供电网络的边界推向前所未有的新水平。这些高密度工作负载变得愈加复杂,更高的瞬态需求推动配电网络的每个部分都必须高效运行。AI加速卡严格的功耗要求对系统性能也有影响。本文将讨论AI加速卡的配电网络要求,剖析瞬变的影响,并介绍ADI公司针对这些需求提出的多相供电解决方案。

简介

AI技术完全改变了计算架构,以复现模仿人脑的神经网络。AI看似已广泛存在,但实际上,驱动AI的技术仍在发展。专门用于AI计算的处理器加速器IC包括GPU、现场可编程门阵列(FPGA)、TPU和其他类型的ASIC。本文将它们统称为xPU。

随着AI技术部署快速推进,数据中心将继续批量购买AI加速卡。根据Gartner的报告,2021年AI芯片收入总计超过340亿美元,预计到2026年将增长至860亿美元。1xPU采用大规模并行计算方案,与普通CPU相比,在AI性能方面实现了巨大飞跃。xPU拥有大量小内核,因此非常适合AI工作负载,有助于神经网络训练和AI推理。然而,xPU进行AI计算和移动数据通常会产生相对较大的功耗。简而言之,xPU是非常耗电的IC。其严格的功耗要求对AI加速卡提出了新的挑战,这也会影响系统性能。本文将分析AI加速卡的供电网络要求,并介绍ADI公司针对这些严格要求提出的多相供电解决方案。

AI带来的供电挑战

AI涉及许多方面,但能效不在其中。AI工作时,尤其是处理深度学习和推理等AI工作负载时,需要极高的计算功率。在系统层面,AI加速器对于提供近乎即时的结果(正是这些结果使其有价值)发挥着关键作用。所有xPU都有多个高端内核,这些内核由数十亿个晶体管构成,消耗数百安培电流。这些xPU的内核电压(VCORE)已降至低于1.0 V的水平。图1显示了AI加速卡的通用框图。本文将重点介绍为此类系统提出的多相控制器和相应的功率级IC。

image.png

图1.通用AI加速卡框图

AI加速卡所需的峰值电流密度对于任何主板来说都是非常沉重的负担,难以处理。工作负载的高度动态特性和极高的电流瞬变会导致非常高的di/dt和持续数微秒的尖峰电压瞬变,这些瞬变非常具有破坏性,可能对xPU造成损害。AI的平均工作负载会持续很长时间,解耦电容将无法始终提供满足即时需求的能量。本文的下一部分将介绍ADI公司提出的多相负载点(PoL)解决方案,它会消除典型AI加速器的瞬变,避免给整个配电网络产生压力。但首先,我们来讨论AI带来的电源设计挑战。

AI带来新的电源设计挑战

目前,AI功率需求远远超过传统供电网络的能力。xPU稳压器(VR)的要求与标准PoL稳压器有很大不同。业界发现,某些应用要求在小于1 V的电压下为xPU提供超过1000 A的电流。重要的是,电源必须非常稳定,产生的噪声非常小,同时消除所有电压瞬变可能性,以免导致xPU内部误触发。为了应对惊人的电流需求,高性能AI加速器VR PoL的设计必须满足某些关键要求。

电压尖峰和瞬变管理

AI加速卡的关键要求之一是VR的架构应能提供出色的瞬变电压管理。向任何系统提供千瓦级功率始终是首要挑战。输出电压(包括容差、纹波以及负载瞬态骤降和峰值)必须始终高于xPU最小电压以避免系统挂起,并且还必须始终低于xPU最大电压以免损坏xPU。加速卡的瞬态功率尖峰可能要求达到最大热功率目标的2倍甚至更高。

这里重要的是,PoL环路带宽须足够灵活,以处理所遇到的各类更快速瞬变。带宽越高,环路响应越快,电压偏差越小。实现快速瞬态电源轨较直接的一种方法是选择具有快速瞬态性能的稳压器。ADI AI VCORE系列IC具有非常低的频率输出噪声、快速瞬态响应和高效率等特性。除此之外,ADI AI电源芯片组还支持负载线路,有助于电源设计人员有效管理AI工作负载引起的瞬变和尖峰。

长电源路径走线中的I2R损耗和热管理

随着AI xPU处理器电流不断提高,PoL供电解决方案的密度已成为关键要素。既要可靠地向xPU的每个部分供电,同时不用担心散发的热量会影响芯片的可靠性并导致热失控,现在变得极其困难。换言之,热管理是设计这种高功率电源所面临的重大挑战之一。传统的供电方法是将稳压器放置在xPU的一侧,以便将电力横向传输到处理器。这些走线的电阻哪怕再小,也可能引起不可接受的电压(I2R)下降。PCB电源层电阻上的压降会随着xPU电流提高而成比例地增加。这意味着VR和BGA引脚之间几厘米的PCB电源走线会产生大量的损耗。PCB铜电源层中的此类损耗已成为计算稳压器设计效率和性能的主导因素。传统3芯片(分立式)供电解决方案需要大量高电流走线,与之相比,使用集成了电流和温度电路模块的单芯片功率级IC,可以大大减少PCB上的走线数量。

ADI价值主张:MAX16602 + MAX20790 + 耦合电感

AI稳压器的精度变得更加严格。效率和尺寸是重中之重。性能和功耗也受到严格审查。正如上一节所述,解决AI加速卡VR设计问题已成为一项艰巨的任务。设计人员非常清楚,若不能有效处理不必要的瞬态效应,就无法在所需电流中产生大的阶跃。解决这些瞬态效应还需要某种类型的高精度动态电压定位或负载线路方案。ADI公司大力投资AI市场,为48 V和12 V系统提供全套解决方案。本节介绍ADI AI多相电源芯片组,即MAX16602多相控制器和MAX20790功率级,以及我们获得专利的耦合电感(CL)技术,以帮助解决这些AI PoL设计挑战。图2显示了8相MAX16602CL8_EV设计的MAX16602、MAX20790和CL简化框图连接。这种相对简洁的设计实现了每相约88 APK的高电流传输能力。内部补偿和先进的控制算法,加上功率级中集成的电流检测电路以及耦合电感,使其成为拥有出色效率的小尺寸解决方案。

image.png

图2.采用ADI高集成度电源芯片组的8相VR设计有助于实现高密度设计,同时减少外部连接

更高集成度的单芯片智能功率级IC

MAX20790是一款功能丰富的智能功率级IC,旨在与MAX16602(以及该产品系列中的其他几款ADI控制器)配合使用,以实现高密度多相稳压器。这是一种单芯片集成,几乎消除了分立式设计中常见的FET和驱动器之间的寄生电阻和电感,从而实现高开关速度,而且功率损耗明显低于传统方案。如果检测到开关节点(VX)故障,功率级会立即关闭,并将故障ID传送给控制器。该智能功率级IC还有一个片内电流传感器。此电流检测电路模块显然优于使用电感直流电阻的方法。众所周知,DCR检测不准确,需要温度补偿才能使电流测量结果可信。

控制器IC

MAX16602是一款用于xPU VCORE VR的多相控制器。该IC提供高密度、灵活且可扩展的解决方案,可为AI xPU供电。该器件支持脉冲宽度调制(PWM)并联,可控制多达16个相位。该IC的架构简化了设计,减少了组件数量,支持高级电源管理和遥测功能,并在整个负载范围内提高了节能效果。它实现了自主切相,在整个负载范围内保持高效率。完整芯片组是一个高效率多相降压转换器,具有广泛的状态和参数测量特性。保护和关断参数通过串行PMBus®接口进行设置和监测,甚至包括功率级IC中收集的故障。

以下是该ADI控制器支持的其他几个关键特性,这些特性对于任何AI供电方案都很重要。

高级调制方案

MAX16602利用高级调制方案(AMS)来提供更好的瞬态响应。该调制方案支持以极短的延迟开启和关闭相位。根据负载需求,当负载增加时,可以同时开启多个相位;当负载释放时,可以立即关闭多个相位。启用AMS后,系统闭环带宽可以扩展,而不会造成相位裕量损失。因此,PoL能够更好地响应AI VR的即时和动态电流需求。

负载线路控制

负载线路允许VCORE根据输出电流在最小值和最大值之间变换。它实质上是为轻负载设置高VCORE值,为重负载设置低值。主要是为了让控制环路可以处理更高的负载电流(这是让计算顺利进行所必需的)。ADI控制器在整个输出电流范围内提供准确的输出负载线路控制。输出电压定位利用来自功率级IC的无损电流检测信号进行,这些信号会反馈到控制器。负载线路是在控制器中通过对电压控制环路误差放大器的直流增益进行数字编程来设置。控制器的EC表和数据手册的表6中提供了各种直流负载线路特性,从0.105 mΩ到0.979 mΩ。图3显示了16相PoL设计在40 A至360 A负载阶跃和800 A/μs摆率下的瞬态曲线。结果表明过冲极小。

总而言之,ADI的多相功率转换和PoL产品提供高效率和高功率密度。图5显示了我们的16相MAX16602 + MAX20790 + CLH1110-4评估板的效率曲线以及偏置和电感损耗。ADI公司为各种AI加速器应用提供稳压器和其他电源转换解决方案。采用我们的多相控制器和集成功率级解决方案,有助于ADI客户满足严苛的动态xPU电源要求,应对当今AI应用带来的设计挑战。

image.png

图3.16相VR在40 A至360 A阶跃负载和800 A/μs摆率下的瞬态曲线

设计中添加有源电压定位可以降低对负载瞬态响应的要求,并更好地利用xPU总容差窗口。负载线路控制有助于降低给定阶跃负载的峰峰值输出电压偏差,同时可以减少输出轨上的bulk电容量。总电压波动将会减小,从而降低xPU崩溃或损坏的风险。请注意,MAX16602中的负载线路电路模块可以禁用。

耦合电感(CL)的优势

十多年来,ADI公司一直投资开发其专利CL技术。这项技术支持实现更高的密度、更大的带宽、更快的瞬变解决方案,与分立式实现方案相比,效率提高50%,磁性元件尺寸缩小1.82倍。CL能够有效地在稳态中用作大电感,在瞬态中用作小电感,除了减小电感尺寸外,还能节省COUT。2图4显示了ADI多相VR设计中常用的耦合电感系列。

image.png

图4.ADI多相VR设计常用的耦合电感系列

根据设计规格和优先级,耦合电感消除电流纹波的优势可用来换取更小的尺寸或更高的效率。1较大的系统优势以及ADI产品的与众不同之处在于,AI PoL设计人员可以使用CL相对轻松地实现VR总尺寸较小的解决方案。几家知名磁性器件供应商拥有ADI的免费CL许可,可以为我们提供所需的元件。

顶部散热封装

顶部散热为表面贴装封装提供了另一种散热途径。MAX16602和MAX20790都是倒装芯片四方扁平无引线(FCQFN)封装,带裸露的顶部散热焊盘。FCQFN是一种先进的封装,可提供设计人员青睐的出色热性能。这种无引线封装不仅可以减少寄生电感,还能从器件的结直接向周围环境散热。MAX20790的结壳顶部(θJC-TOP)热阻为0.25°C/W。AI电源设计利用顶端散热配置,可以提高系统的热性能和设计灵活性。

image.png

图5.16相AI VR评估板设计的效率曲线

垂直供电

随着处理复杂AI功能的xPU问世,功耗随之急剧增加。具有高达650 A连续电流和超过1000 A峰值电流传输能力的VR开始普及。为AI处理器供电的挑战在于保持高效率。常规电源架构无法跟上这些非常耗电的AI xPU的步伐。VR芯片制造商和架构师正在从根本上研究不同的供电方法。业界正在讨论一种为AI xPU供电的新趋势,称为垂直供电,也称为背面供电。

VR必须尽可能靠近负载输入xPU电源引脚,以实现高电流输送。我们无法通过传统的横向供电方法实现这一目标。垂直供电将电源调节器移到处理器正下方,从而消除了PCB上可能产生的所有损耗。该结构将电源转换器、功率级、电容和磁性元件放置在PCB的背面,并通过过孔垂直地向xPU供电。换言之,电流传输是从xPU BGA阵列下方垂直进行。这是一条长度缩短的垂直路径,可显著降低阻抗并消除损耗。图6显示了安装在PCB另一侧、xPU下方的垂直供电模块架构。此示意图仅用于说明。ADI公司拥有广泛的AI xPU VCORE解决方案系列,用于解决当今的这些问题。我们的电源解决方案能够以非常小的外形尺寸实现出色的效率。本文介绍的解决方案将多相控制器MAX16602和智能单芯片功率级MAX20790相结合,可提供非常高的电源转换效率、非常快的瞬态响应和非常准确的遥测报告。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 供电
    +关注

    关注

    1

    文章

    311

    浏览量

    23451
  • AI
    AI
    +关注

    关注

    87

    文章

    29646

    浏览量

    267989
  • 耦合电感
    +关注

    关注

    0

    文章

    77

    浏览量

    20057
  • 加速卡
    +关注

    关注

    1

    文章

    55

    浏览量

    10926
收藏 人收藏

    评论

    相关推荐

    AMD推出新款纤薄尺寸电子交易加速卡

    AMD(超威,纳斯达克股票代码:AMD)今日宣布推出 AMD Alveo UL3422 加速卡 ,这是其创纪录的加速卡系列1的最新成员,专为超低时延电子交易应用而设计。AMD Alveo
    的头像 发表于 10-16 09:14 352次阅读

    大模型向边端侧部署,AI加速卡朝高算力、小体积发展

    电子发烧友网报道(文/李弯弯)AI加速卡是专门用于处理人工智能应用中的大量计算任务的模块。它集成了高性能的计算核心和大量的内存,旨在加速机器学习、深度学习等算法的计算过程。当前,AI
    的头像 发表于 09-17 00:18 2829次阅读

    EPSON差分晶振SG3225VEN频点312.5mhz应用于AI加速卡

    AI加速卡,通常也被称为AI算力,是一种专为加速人工智能(AI)应用和算法而设计的硬件设备。
    发表于 09-10 14:56 0次下载

    基于菲数科技FA728Q加速卡实现低时延LLT应用

    菲数科技使用Stratix 10 FPGA和开源的开放式FPGA堆栈(OFS)基础设施开发高性能FPGA加速卡
    的头像 发表于 08-30 17:13 427次阅读
    基于菲数科技FA728Q<b class='flag-5'>加速卡</b>实现低时延LLT应用

    YXC高频差分晶振,频点312.5mhz,高精度.高稳定性,应用于AI加速卡

    在一些AI加速卡中,扬兴推荐的YXC差分晶振YSO210PR系列,该系列频率范围为10MHz ~1500MHz,可满足高精度、高稳定度的需求,支持差分信号(LVDS/LVPECL)输出,以下为YSO210PR系列中OA2EIBWNY-312.5M的这颗料在
    的头像 发表于 08-21 14:03 259次阅读
    YXC高频差分晶振,频点312.5mhz,高精度.高稳定性,应用于<b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>

    借助全新 AMD Alveo™ V80 计算加速卡释放计算能力

    对于大规模数据处理,最佳性能不仅取决于原始计算能力,还取决于高存储器带宽。 因此,全新 AMD Alveo™ V80 计算加速卡专为具有大型数据集的内存受限型应用而设计,这些应用需要 FPGA 硬件
    发表于 05-16 14:09 190次阅读
    借助全新 AMD Alveo™ V80 计算<b class='flag-5'>加速卡</b>释放计算能力

    OpenAI Sora模型需大量AI加速卡及电力支持

    若以每片H100加速卡3万美元市价估算,总花费将高达216亿美元(相当于1561.68亿元人民币),这仅是H100加速卡采购费用。该模型在运营时还会产生极高的能耗,每片H100能耗达到700瓦,72万片则意味着能耗高达50.4亿瓦。
    的头像 发表于 03-27 15:58 489次阅读

    英伟达发布最强AI加速卡Blackwell GB200

    英伟达在最近的GTC开发者大会上发布了其最新、最强大的AI加速卡——GB200。这款加速卡采用了新一代AI图形处理器架构Blackwell,标志着英伟达在
    的头像 发表于 03-20 11:38 1027次阅读

    英伟达发布超强AI加速卡,性能大幅提升,可支持1.8万亿参数模的训练

    得益于NVIDIA每两年进行一次GPU架构升级以提高性能的策略,全新的基于Blackwell的加速卡比之前的H100更为强大,尤其适用于AI相关任务。
    的头像 发表于 03-19 12:04 690次阅读

    英伟达发布最强AI加速卡GB200,开启新一代AI图形处理时代

    英伟达正式发布了其最新、也是迄今为止最强大的AI加速卡——GB200。这一重大发布标志着英伟达在AI图形处理领域迈入了一个新的里程碑。
    的头像 发表于 03-19 11:26 1081次阅读
    英伟达发布最强<b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>GB200,开启新一代<b class='flag-5'>AI</b>图形处理时代

    今日看点丨英伟达发布最强 AI 加速卡--Blackwell GB200;三星面临罢工 存储市场供需引关注

    1. 英伟达发布最强 AI 加速卡--Blackwell GB200 ,今年发货   3 月 19 日,英伟达发布最强 AI 加速卡--Blackwell GB200,今年发货。英伟达
    发表于 03-19 11:08 1153次阅读

    宁畅发布《基于标准PCIe接口的人工智能加速卡液冷设计》白皮书

    宁畅公司最近发布了一份名为《基于标准PCIe接口的人工智能加速卡液冷设计》的技术白皮书,这份白皮书由宁畅参与起草,并由开放计算标准工作委员会(OCTC)归口,旨在为冷板式人工智能加速卡的设计提供重要的指导。
    的头像 发表于 01-09 14:02 662次阅读

    宁畅参与发布AI加速卡液冷设计白皮书

    近日,由宁畅参与起草的《基于标准PCIe接口的人工智能加速卡液冷设计》白皮书正式发布。该技术白皮书由开放计算标准工作委员会(OCTC)归口,旨在为冷板式人工智能加速卡的设计提供重要指导。
    的头像 发表于 01-09 11:28 715次阅读

    AI加速卡供电的影响

    ,尤其是在学习和推理时。这种需求不断地将供电网络的边界推向前所未有的新水平。这些高密度工作负载变得愈加复杂,更高的瞬态需求推动配电网络的每个部分都必须高效运行。AI加速卡严格的功耗要求对系统性能也有影响。本文将讨论
    的头像 发表于 12-01 18:10 373次阅读
    <b class='flag-5'>瞬</b><b class='flag-5'>变</b>对<b class='flag-5'>AI</b><b class='flag-5'>加速卡</b><b class='flag-5'>供电</b>的影响

    HPC领域的一款大杀器-HBX-G500大带宽加速卡

    HBX-G500是一款高性能可编程加速卡,为AI、计算、网络等领域,提供多通道的高带宽存储、高性能计算、先进高速接口等解决方案;
    的头像 发表于 11-29 09:16 916次阅读
    HPC领域的一款大杀器-HBX-G500大带宽<b class='flag-5'>加速卡</b>