这个电源技术,要爆发了

电子工程世界 2024-08-14 07:01
▲ 点击上方蓝字关注我们,不错过任何一篇干货文章!
处理器和数据中心架构正在发生变化,以满足运行 AI 和大型语言模型 (LLM) 的服务器的更高电压需求。

曾经,服务器运行时耗电量只有几百瓦。但在过去几十年里,由于需要处理的数据量大幅增加,以及用户要求更快处理数据,情况发生了巨大变化。NVIDIA 的Grace Blackwell芯片消耗 5 到 6 千瓦,这大约是过去服务器总功耗的 10 倍。

功率是电压乘以电流。“如果我需要 5 千瓦,我可以在 120 伏的标准电压下实现。” Rambus的杰出发明家 Steven Woo 说道。“但我需要 40 安培的电流,这是很大的电流。”

这类似于你在五金店购买的那种电线。“大电流电线有很多不同的直径,而且非常粗。”Woo 说。“以前大家都认为服务器的功率可能是 1 或 2 千瓦,对于 120 伏电压,你只需提供 10 安培的电流。现在,由于功率需求高得多,如果我将电压保持在 120 伏,我必须提供四倍甚至更高的电流,但电线无法承受这么大的电流,它们会熔化。”

如果不能提高电流,那么另一个选择就是提高电压。“电流乘以电压等于 5 千瓦,”Woo 指出。“如今服务器的电压为 48 伏,而以前是 12 伏。现在 NVIDIA 正在讨论 48 伏,他们将电压提高了四倍,这使得他们能够在保持电流不变的情况下将功率提高四倍。”

这种变化反映在电源上,西门子 EDA 嵌入式电路板系统部市场开发经理 Rod Dudzinski 指出:“我们看到客户在构建大型数据中心时,寻求不同的途径来提供运行机架式系统所需的电力。一些数据中心公司正在借鉴高性能电源模块和相关电力电子产品的理念和概念来实现这一目标,例如高效的电源转换为热效率再到终身可靠性。到 2025 年,传统数据中心的功耗预计将增加 50%,因此,电路板级电源转换效率和功率密度对于系统架构师来说是首要考虑因素,应将其作为减少系统中每个 PCB 配电网络 (PDN) 损耗的手段。”

类似的变化也反映在 EDA 中。Movellus战略营销副总裁 Lee Vick 表示,数据中心电源领域正在发生的事情与 EDA 领域正在发生的事情有相似之处。“在芯片设计领域,我们过去的情况是,通过 EDA 工具流程单独制作晶体管,但这些工具是一系列不同的工具——布局工具、时序工具、布线工具。最终,我们不得不转向一个集成这些工具、集成流程和集成数据的世界,以满足现代世界的性能需求。现在,即使是 EDA 公司也不会止步于设计,因为你必须管理芯片的生命周期,从设计到测试和制造,一直到现场,在那里他们会对设备进行检测并捕获遥测数据,以反馈到设计过程中并改进测试。这是一个完整的生命周期。这是一个完全集成的垂直流程(即使它在时间框架上是水平的),这是至关重要的。”

类似的趋势也适用于数据中心的电力。“以前,当你设计芯片时,你会有一个功耗预算,”Vick说。“或者,如果你是一名工程师,你被安排设计一个模块,你会有一个针对该特定模块的功耗预算,你不敢超出这个预算。但这就是你需要关心的一切——输入和输出。现在情况已经不同了。在数据中心,我们看到需求已经远远超出了子集或芯片,而是扩展到主板、机架、数据中心层面。”

这里的连锁反应很重要,而不仅仅是必须将功耗降至最低。“每个人都必须将功耗降至最低,”他说。“有限制,有需求,也有变化。你必须能够对它们做出反应。另一个关键的事情是,我们已经远远超越了假设,超越了‘这是未来的事情’的夸张。在最近的 DAC 上,我们有一个小组,讨论的是管理千瓦功率预算。我们有来自 IC 设计、EDA、IP 和系统设计的行业专家,所有人和组织都在发挥作用。这不是 IP 提供商、芯片设计师或 EDA 公司可以单独解决的问题,这需要每个人共同努力。同样,在数据中心,我们必须改善电力分配和散热,这只会在宏观层面增加能耗。但现代数据中心的芯片和芯片内部的大量芯片和计算元件的规模只会加剧这种情况。”

Ansys首席应用工程师 Ashutosh Srivastava认为,这种情况是双向的,因为芯片设计会导致功耗激增,因为最新的 AI 芯片(包括 GPU)在进行更大、更快的计算时会消耗更多能量。在某些情况下,每台服务器的功耗超过 2 千瓦。“与此同时,芯片架构师也在寻求设计一种芯片来优化功耗而不影响性能,因为它们的运行成本会更高——不仅是电力成本,还有散热基础设施。”

此外,数据中心的上游配电也正在发生变化,以适应更大的电力需求,其中包括将机架中的分布式总线电压从旧的 12V 更改为 48V。Srivastava 表示:“通过将电压提高 4 倍,电流可以减少了 4 倍,传导损耗减少了 16 倍。机架中的每个转换器也经过重新设计,以提高效率。通过高效转换器,可以优化与芯片直接供电相关的功率损耗。例如将芯片的电源直接堆叠在顶部有助于减少这种功率损耗。”

 解决“最后一公里”的供电 


已经有不少电源厂商都推出了包括48V以及垂直供电技术,从而降低损耗并提高瞬态响应速度。

比如Vicor就推出了分比式电源架构 (FPA) ,取代传统多相位稳压器,可提高密度和电源系统效率,FPA 将功率转换分解为单独的稳压和变压功能,这些功能可以单独优化,最大限度提高性能。稳压模块可部署在主板上的任何位置,而重要电流输出模块电流倍增器则可针对密度、效率和低噪声进行优化,并可部署在非常接近处理器的位置。电流倍增器不仅能够提供超过 1000Amp 的大电流,而且还可让 PDN 电阻锐降 50 倍。Vicor 可根据处理器电流,提供横向及纵向分比式电源选项。

横向供电 (LPD):大电流传输通过模块化电流倍增器 (MCM) 模块实现,这些模块布置在主板或处理器基板上,与处理器相邻。将 MCM 布置在基板上,不仅可最大限度降低 PDN 损耗,而且还可减少电源所需的处理器基板 BGA 引脚。LPD 旨在支持 OCP 加速器模块 (OAM) 卡及定制 AI 加速器卡的供电需求和独特封装。

垂直供电 (VPD):对于极高的处理器电流,VPD 将电流倍增器模块直接部署在处理器下方,与 LPD 相比,这可将 PDN 电阻再降低达 10 倍之巨。垂直供电的另一项优势是为高速 I/O 和存储器开放了上层 PCB 的电路板面积。VPD 采用与 Vicor LPD 解决方案类似的电流倍增器,但将通常部署在处理器下方的高频率旁路电容集成在与 MCM 连接的变速器封装中。此外,该变速器还允许对从 MCM 的输出引脚到处理器电源引脚的间距进行必要的修改,其输出电源引脚也与处理器或 ASIC 的电源映射相匹配,可最大限度提高性能。

MPS也提供了水平供电和垂直供电两种模式,其中水平供电解决方案的第一级使用了800W的MPC12109,利用高性能的LLC拓扑全面实现软开关,在极致小尺寸的同时峰值效率可以达到98%;第二级采用多颗MPC22167模块并联实现强大的输出能力。其中,单模块集成了两组DrMOS和电感,采用顶部散热的方式。凭借业内领先的低压大电流工艺以及高性能数字COT控制器,MPS的整体方案不仅拥有较高的电源质量,同时设计简单灵活。

MPS垂直供电解决方案同样采用两级架构,其特点是通过10:1的LLC模块将48V输入电压转为更低的4.8V,进一步发挥MPS低压大电流工艺的优势。同时采用先进的电感技术将第二级的多相功率模块整体高度压缩在5mm以内,突破了多相电源在主芯片背面布局的难关。由于垂直供电方案的功率传输路径长度只是PCB板子的厚度,极大地减小了传输路径寄生参数对电源质量的影响,同时也大大降低了路径功率损耗。这种新颖的垂直供电方式将在未来AI的发展进程中大放异彩。

英飞凌的TDM2254xD 双相电源模块,支持垂直供电,减少 PDN 损耗并提高功率密度。其封装尺寸为10x9x8 mm + 10x9x5 mm,峰值电流为 160 A,满载时效率比同类产品高出 2%。

 新数据中心考虑因素 


数据中心设计的另一个重要考虑因素是其位置。“通常,这些数据中心位于城市地区,因此数据中心的能源效率不高——与人口的电力需求竞争可能会限制其容量,”Srivastava 说。“因此,一些地区禁止建造新的数据中心,如果情况紧急,数据中心将需要减少其电力负荷,以便为社区的其他重要区域供电。这意味着要么制造节能的计算硬件,要么寻找替代电源。这导致了另一种趋势,大型数据中心现在正在考虑建造自己的发电厂来提供所需的电力,尤其是来自可持续和可靠来源的电力。这可能采用传统的太阳能或风能与储能相结合的形式,甚至正在开发中的小型模块化核反应堆 (SMR)。”

数据中心的电源管理是一项不断发展的挑战。Cadence 产品工程总监 Mark Fenton 表示: “IT 负载在一天中可能会发生很大波动,受到各种应用程序需求的影响。机柜的功率是一组复杂的变化变量——其当前用电量、未来项目的预算容量以及最大设计限制。反过来,电力分配和容量可以在多个数据中心之间共享。”

例如,在共置环境中,用户不断调整对共享系统的需求,几乎不了解 IT 已安装或即将安装的内容。“新的 GPU 工作负载表现出不同的功率行为,通常会导致大量且几乎瞬时的功率峰值,”Fenton 说。“这些波动对数据中心电力基础设施构成了重大的故障风险,这是一个主要问题。为了优化效率并最大限度地利用可用功率,利用三相电源是有益的,但同时需要平衡相位以防止效率低下至关重要。”

 电压转换中的功率损耗 


数据中心的电压转换涉及多个转换和调节阶段,这可能导致严重的功率损耗。“如果我的服务器现在是 48 伏电压,那么问题在于芯片本身仍然需要在 12 伏或 5 伏,甚至 1 伏电压下运行。”Rambus 的 Woo 说道。“这意味着必须降低电压。但每次降低电压时,都会损失一些功率,因此效率会开始下降。这是因为转换电压水平需要功率,所以这是一个大问题,转换不同的电压会消耗大量功率。”

这意味着数据中心基础设施必须将建筑公用设施电源转换为机架级的单相或三相电源。“电压可能会从 13.8 kV(中压)降至 480 V 或 208 V(低压),随后降至 240 V 或 120 V,”Fenton 说。“部分负载下的效率往往更高,而且由于大多数电源采用 2N 冗余供电,因此系统的很大一部分在这些部分负载条件下运行。”

Ansys 高级应用工程师 Steve Chwirka 指出,损耗始于将公用电源从 480V 交流电降压的大型变压器。“这种新的较低交流电压通过多种类型的电缆和 PDU(配电单元)进行分配,这些 PDU 基本上是非常大的母线。所有这些都会导致系统中的传导损耗。有几种电源转换级别也与功率损耗有关。其中包括不间断电源 (UPS),它在故障条件下为机架供电,时间刚好够备用发电机启动。主要的转换发生在机架上,交流电压转换为高压直流,然后通过电源单元 (PSU) 转换为较低的直流电压。这个直流电压现在要经过几个级别的转换,才能到达芯片。”

在每个级别,功率损耗量都不同。从公用设施输入到芯片,Chwirka 对功率损耗进行了一些估算。“电力变压器是非常高效的机器,损耗仅为 1% 到 2%。UPS 系统的效率会根据其设计和负载条件而有所不同。提供最高级别保护的在线 UPS 系统的效率通常为 90% 到 95% 之间。因此,它们会损耗 5% 到 10% 的电力。PDU 也有一些固有损耗。这些损耗会导致大约 1% 到 2% 的额外损耗。现代 PSU 的效率通常为 80% 到 95% 之间。这意味着在从交流转换为直流的过程中可能会损耗 5% 到 20% 的功率。额外的转换器(有时称为中间总线转换器 (IBS))将机架的 48 V DC 转换为 8 到 12 V DC,效率可高达 98% 左右。由于尺寸限制,芯片所需的低电压的最终转换效率比IBC略低。”

 关于电力输送你需要知道什么 


在设计数据中心环境时需要考虑很多因素,其中最重要的事情之一就是高电压周围的基础设施。“如果高电压进入系统,你需要知道如何将电压降低到你需要的水平,”Woo 指出。“可能是一些外部电路在进行降压。有一些片上方法可以在小范围的电压上进行电压管理。最重要的是真正了解你的芯片将消耗多少电量,并了解这些电量来自哪里。这通常是一个系统级问题。还有关于老化的问题,因为有时芯片升温时会发生膨胀。制造芯片的不同材料的膨胀速率都不同,如果进行热循环(即在高温和低温之间频繁切换),这可能会导致开裂和其他可靠性问题。”

架构也有影响。Ansys 研究员 Norman Chang 解释说,随着 3D-IC 芯片组越来越大,芯片架构师需要考虑将电源垂直分配到芯片组,例如 Tesla D1 Dojo 芯片中的电源系统设计。“架构师还需要考虑热分布,因为通过系统技术协同优化,3D-IC 中放置了数十个芯片,”他说。“3D-IC 中的模拟/混合信号设计需要放置在对峰值计算工作负载产生的热/应力变化不太敏感的位置。

最终,数据中心电力输送方面的挑战将落入芯片和系统架构师的视野。Movellus 的 Vick 表示:“作为一名计算机架构师,我非常注重数字化和处理器。后来我开始为硬 IP 公司工作,他们会问‘你们的供电有多少个脉冲?’我会说‘我不知道。电源就在那里。它总是干净的,你不必担心。’但实施和集成等因素很重要——你的电源有多干净,以及你如何布线。我们在架构层面看到的一件事是,当你集成电路的模拟部分时,无论是电源调节、传感器还是时钟,你必须将模拟电压运行在传统数字区域,这一简单事实可能会严重破坏你的设计。假设我有一大块消耗大量能源的数字逻辑。我想看看电网端发生了什么,我想看看是否出现了信号下降。但这需要把一个模拟传感器塞进这些数字逻辑中,这很难做到。”

将模拟设计迁移到数字设计可以让你更自由地进行更多仪表形式的操作,并了解正在发生的事情。“这是超出模块功能范围的一个例子,”Vick说。“哦,当然,这与实施有很大关系,所以我们正在从深奥的东西转向现实世界,现实世界的实施很重要。这不是我是否可以设计这个东西,或者我是否可以获得最佳的 TOPS/w。我可以在实际设计中实际实现它吗?我能处理嘈杂的电源吗?我能否处理不稳定的电网?所需的裕度和过度设计量表明我再也无法承受,如今电网本身受到与逻辑遇到相同的设计约束。它正行驶在那条崎岖的边缘,有时它会出现偏移,会出现挣扎,我必须从硬件和软件的角度来考虑这个问题,而不是假设有无限的清洁能源。”

· END ·



欢迎将我们设为“星标”,这样才能第一时间收到推送消息。
扫码关注:汽车开发圈,回复“驾驶

领取自动驾驶、辅助驾驶等方面免费资料包!



扫码添加小助手回复“进群”

和电子工程师们面对面交流经验


电子工程世界 关注EEWORLD电子工程世界,即时参与讨论电子工程世界最火话题,抢先知晓电子工程业界资讯。
评论
  • 11-29学习笔记11-29学习笔记习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记
    youyeye 2024-12-02 23:58 92浏览
  • 《高速PCB设计经验规则应用实践》+PCB绘制学习与验证读书首先看目录,我感兴趣的是这一节;作者在书中列举了一条经典规则,然后进行详细分析,通过公式推导图表列举说明了传统的这一规则是受到电容加工特点影响的,在使用了MLCC陶瓷电容后这一条规则已经不再实用了。图书还列举了高速PCB设计需要的专业工具和仿真软件,当然由于篇幅所限,只是介绍了一点点设计步骤;我最感兴趣的部分还是元件布局的经验规则,在这里列举如下:在这里,演示一下,我根据书本知识进行电机驱动的布局:这也算知行合一吧。对于布局书中有一句:
    wuyu2009 2024-11-30 20:30 142浏览
  • 遇到部分串口工具不支持1500000波特率,这时候就需要进行修改,本文以触觉智能RK3562开发板修改系统波特率为115200为例,介绍瑞芯微方案主板Linux修改系统串口波特率教程。温馨提示:瑞芯微方案主板/开发板串口波特率只支持115200或1500000。修改Loader打印波特率查看对应芯片的MINIALL.ini确定要修改的bin文件#查看对应芯片的MINIALL.ini cat rkbin/RKBOOT/RK3562MINIALL.ini修改uart baudrate参数修改以下目
    Industio_触觉智能 2024-12-03 11:28 110浏览
  • 当前,智能汽车产业迎来重大变局,随着人工智能、5G、大数据等新一代信息技术的迅猛发展,智能网联汽车正呈现强劲发展势头。11月26日,在2024紫光展锐全球合作伙伴大会汽车电子生态论坛上,紫光展锐与上汽海外出行联合发布搭载紫光展锐A7870的上汽海外MG量产车型,并发布A7710系列UWB数字钥匙解决方案平台,可应用于数字钥匙、活体检测、脚踢雷达、自动泊车等多种智能汽车场景。 联合发布量产车型,推动汽车智能化出海紫光展锐与上汽海外出行达成战略合作,联合发布搭载紫光展锐A7870的量产车型
    紫光展锐 2024-12-03 11:38 126浏览
  • 戴上XR眼镜去“追龙”是种什么体验?2024年11月30日,由上海自然博物馆(上海科技馆分馆)与三湘印象联合出品、三湘印象旗下观印象艺术发展有限公司(下简称“观印象”)承制的《又见恐龙》XR嘉年华在上海自然博物馆重磅开幕。该体验项目将于12月1日正式对公众开放,持续至2025年3月30日。双向奔赴,恐龙IP撞上元宇宙不久前,上海市经济和信息化委员会等部门联合印发了《上海市超高清视听产业发展行动方案》,特别提到“支持博物馆、主题乐园等场所推动超高清视听技术应用,丰富线下文旅消费体验”。作为上海自然
    电子与消费 2024-11-30 22:03 107浏览
  • TOF多区传感器: ND06   ND06是一款微型多区高集成度ToF测距传感器,其支持24个区域(6 x 4)同步测距,测距范围远达5m,具有测距范围广、精度高、测距稳定等特点。适用于投影仪的无感自动对焦和梯形校正、AIoT、手势识别、智能面板和智能灯具等多种场景。                 如果用ND06进行手势识别,只需要经过三个步骤: 第一步&
    esad0 2024-12-04 11:20 103浏览
  • 概述 说明(三)探讨的是比较器一般带有滞回(Hysteresis)功能,为了解决输入信号转换速率不够的问题。前文还提到,即便使能滞回(Hysteresis)功能,还是无法解决SiPM读出测试系统需要解决的问题。本文在说明(三)的基础上,继续探讨为SiPM读出测试系统寻求合适的模拟脉冲检出方案。前四代SiPM使用的高速比较器指标缺陷 由于前端模拟信号属于典型的指数脉冲,所以下降沿转换速率(Slew Rate)过慢,导致比较器检出出现不必要的问题。尽管比较器可以使能滞回(Hysteresis)模块功
    coyoo 2024-12-03 12:20 170浏览
  • 最近几年,新能源汽车愈发受到消费者的青睐,其销量也是一路走高。据中汽协公布的数据显示,2024年10月,新能源汽车产销分别完成146.3万辆和143万辆,同比分别增长48%和49.6%。而结合各家新能源车企所公布的销量数据来看,比亚迪再度夺得了销冠宝座,其10月新能源汽车销量达到了502657辆,同比增长66.53%。众所周知,比亚迪是新能源汽车领域的重要参与者,其一举一动向来为外界所关注。日前,比亚迪汽车旗下品牌方程豹汽车推出了新车方程豹豹8,该款车型一上市就迅速吸引了消费者的目光,成为SUV
    刘旷 2024-12-02 09:32 138浏览
  • RDDI-DAP错误通常与调试接口相关,特别是在使用CMSIS-DAP协议进行嵌入式系统开发时。以下是一些可能的原因和解决方法: 1. 硬件连接问题:     检查调试器(如ST-Link)与目标板之间的连接是否牢固。     确保所有必要的引脚都已正确连接,没有松动或短路。 2. 电源问题:     确保目标板和调试器都有足够的电源供应。     检查电源电压是否符合目标板的规格要求。 3. 固件问题: &n
    丙丁先生 2024-12-01 17:37 114浏览
  • 作为优秀工程师的你,已身经百战、阅板无数!请先醒醒,新的项目来了,这是一个既要、又要、还要的产品需求,ARM核心板中一个处理器怎么能实现这么丰富的外围接口?踌躇之际,你偶阅此文。于是,“潘多拉”的魔盒打开了!没错,USB资源就是你打开新世界得钥匙,它能做哪些扩展呢?1.1  USB扩网口通用ARM处理器大多带两路网口,如果项目中有多路网路接口的需求,一般会选择在主板外部加交换机/路由器。当然,出于成本考虑,也可以将Switch芯片集成到ARM核心板或底板上,如KSZ9897、
    万象奥科 2024-12-03 10:24 93浏览
  • 光伏逆变器是一种高效的能量转换设备,它能够将光伏太阳能板(PV)产生的不稳定的直流电压转换成与市电频率同步的交流电。这种转换后的电能不仅可以回馈至商用输电网络,还能供独立电网系统使用。光伏逆变器在商业光伏储能电站和家庭独立储能系统等应用领域中得到了广泛的应用。光耦合器,以其高速信号传输、出色的共模抑制比以及单向信号传输和光电隔离的特性,在光伏逆变器中扮演着至关重要的角色。它确保了系统的安全隔离、干扰的有效隔离以及通信信号的精准传输。光耦合器的使用不仅提高了系统的稳定性和安全性,而且由于其低功耗的
    晶台光耦 2024-12-02 10:40 143浏览
  •         温度传感器的精度受哪些因素影响,要先看所用的温度传感器输出哪种信号,不同信号输出的温度传感器影响精度的因素也不同。        现在常用的温度传感器输出信号有以下几种:电阻信号、电流信号、电压信号、数字信号等。以输出电阻信号的温度传感器为例,还细分为正温度系数温度传感器和负温度系数温度传感器,常用的铂电阻PT100/1000温度传感器就是正温度系数,就是说随着温度的升高,输出的电阻值会增大。对于输出
    锦正茂科技 2024-12-03 11:50 141浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦