人工智能对数据中心基础设施带来了哪些挑战?

安森美 2024-11-11 19:01

本文作者:安森美(onsemi)高级总监Aditya Jain

在加密货币和人工智能/机器学习(AI/ML)等新兴应用的驱动下,数据中心的能耗巨大,并将快速增长以满足用户需求。根据国际能源署(IEA)的最新报告,2022 年数据中心的耗电量将达到 460 TWh(太瓦时),约占全球总用电量的 2%。在美国,拥有全球三分之一的数据中心,耗电量为 260 TWh,占总用电量的 6%。



预测未来具有挑战性,这取决于部署了多少非常耗电的图形处理单元(GPU)来应对人工智能技术的需求,当然还取决于进一步增加空调来降低数据中心的温度。国际能源署的报告显示,到 2026 年,数据中心的耗电量将至少增长到 650 TWh(40%),但也可能高达 1,050  TWh(128%)。

数据中心支持人工智能趋势

人工智能是一项极其耗电的技术,支持其运行的数据中心需要具备足够的算力和电力输送能力。瑞典RISE研究机构最近的一项研究清楚地展示了由于该技术迅速普及所带来的巨大变化。例如,ChatGPT在2022年11月推出后仅五天内就达到了100万用户。他们在两个月内就拥有了 1 亿用户,而TikTok达到同一用户量级用了9个月,Instagram则用了两年半的时间。


作为参考,在谷歌上进行一次搜索仅需 0.28 Wh,相当于让一个60W的灯泡亮17秒。

相比之下,训练 GPT-4 需要 1.7 万亿个参数和 13 万亿个tokens(单词片段),这是一个完全不同的命题。要做到这一点,需要包含 25,000 个英伟达 A100 GPU的多台服务器,每台服务器的功耗约为 6.5 kW。OpenAI 表示,训练耗时 100 天,耗能约 50 GWh,耗资 1 亿美元。


显然,人工智能将极大地改变数据中心的游戏规则,其所需的计算能力和能耗水平将远远超过我们迄今为止所看到的任何水平。

数据中心 48V 架构

早期的数据中心采用集中式电源架构 (CPA),将主电源(电网)电压集中转换为 12V(母线电压),然后将其分配给各服务器,并使用相对简单的转换器在本地将其转换为5V 或 3.3V逻辑电平。


然而,随着功率需求的增长,12V 母线上的电流(以及相关损耗)变得高得令人无法接受,迫使系统工程师改用48V 母线布置。根据欧姆定律,电流减少了 4 倍,损耗则降低了 4 倍的平方。这种配置被称为分布式电源架构 (DPA)。


与此同时,处理器和其他一些元器件的电压也在不断降低,最终降至亚伏特级别,导致需要多个次级电压轨。为解决这一问题,采用了二阶转换技术,通过DC-DC转换器(称为中间母线转换器 - IBC)将 48V 电压转换为 12V 母线,再根据需要从 12V 母线输出其他电压。


图1 服务器电源系统的结构

对高能效 MOSFET的需求

数据中心内部的电力损耗给运营商带来了挑战。首先,也是最明显的一点是,他们正在为那些无助于服务器运行的电力付费。其次,任何浪费的能源都会转化为热量,这就必须设法处理。由于超大规模AI服务器的功率需求高达 120 kW(而且肯定会随着时间推移而增加),即使在 50% 负载的情况下,以 97.5% 的峰值效率计算 2.5% 的损耗,每台服务器也会浪费 1.5 kW的电力,相当于一台全时运行的电加热器。


处理热量可能需要在功率转换系统中采取散热措施,如散热器或风扇。这些措施会增大电源的体积,占用本可用于更多计算能力的空间,就风扇而言,还会耗费电能并增加成本。由于数据中心内的温度需要严格控制,过高的损耗也会使环境温度升高,这意味着需要更多的空调来降温。这既是资本支出,也是运营成本,同时还占用空间。


显然,尽可能高效地将主(电网)电压转换为驱动人工智能 GPU 和其他设备供电所需的电压,对数据中心运营商来说大有裨益。


因此,多年来人们在电源拓扑结构方面做了大量工作,在前端 PFC 阶段引入了图腾柱PFC (TPPFC) 等技术,以提高其效率。此外,为了提高效率,二极管整流器已被 MOSFET 所取代,并引入了同步整流等技术。


优化拓扑结构只是其中的一半,要优化效率,所有元件也必须尽可能高效,尤其是对转换过程至关重要的 MOSFET。


当 MOSFET 用于开关电源转换时,主要有两种形式的损耗:导通损耗和开关损耗。导通损耗由漏极和源极之间的电阻(RDS(ON))造成,在电流流动时一直存在。开关损耗是由栅极电荷 (Qg)、输出电荷 (QOSS) 和反向恢复电荷 (Qrr) 共同造成的,这些电荷在每个开关周期都会得到补充。由于目前的趋势是提高开关频率以减小磁性元件的尺寸,因此随着补充频率的增加,这种损耗也会变得相当显著。


显然,特定 MOSFET 的导通损耗和开关损耗越低,电源系统的整体转换效率就越高。

PowerTrench® T10 MOSFET 简介

同步整流现在已成为所有高性能、大电流、低压电源转换应用中的关键技术,特别是在数据中心服务器的应用中更是如此。在这种应用中,包括RDS(ON)、Qg、QOSS和Qrr在内的几个MOSFET参数会直接影响转换效率,器件制造商正努力寻求减小这些影响的方法。


安森美的 PowerTrench T10 MOSFET 采用新型屏蔽栅极沟道设计,实现了超低的 Qg 值,且 RDS(ON) 低于 1mOhm 。最新的 PowerTrench T10 技术不仅减少了振铃、过冲和噪声,其业界先进的软恢复体二极管还降低了 Qrr。这在导通电阻性能和恢复特性之间实现了良好的折中平衡,同时还可实现具有良好反向恢复特性的低损耗快速开关。


总体而言,PowerTrench T10 器件在参数方面的改进提高了中低压、大电流开关电源解决方案的效率。通常情况下,开关损耗比上一代器件最多可降低 50%,而导通损耗可降低 30%-40%。


安森美推出了PowerTrench T10技术的40V系列和80V系列产品。NTMFWS1D5N08X(80V、1.43mΩ、5mm x 6mm SO8-FL 封装)和 NTTFSSCH1D3N04XL(40V、1.3mΩ、3.3mm x 3.3mm 源下双冷却封装)为人工智能数据中心应用中的电源单元(PSU)和中间母线转换器(IBC)提供了同类极佳的效率(FOM)。它们达到了开放式机架(Open Rack) V3 规范要求的 97.5% 的 PSU 效率和 98% 的 IBC 效率。


图2 PowerTrench T10 MOSFET 的优势

结语

人工智能革命已经到来,没有人能够完全确定它对数据中心未来的电力输送需求究竟意味着什么。不过,可以肯定的是,一系列新的挑战已经出现。房地产资源稀缺和电网的限制使得很难找到容量充足的新地点。关键 IT 方面的总体电力需求激增,给电力成本带来沉重负担。为了满足这些需求,数据中心业主不仅要建设新设施,还要将现有设施推向极限,力求实现每平方英尺兆瓦级的高密度配置。


随着功率水平肯定会超过 100 kW,功率转换将成为关键重点,以实现高效运行,确保散热,可靠地提高功率密度,并在狭窄的现代数据中心中节省空间。


安森美的 PowerTrench T10 技术提供了业界先进的RDS(ON)、更高的功率密度、降低开关损耗,以及更好的热性能,从而降低总系统成本。PowerTrench T10 等创新功率半导体技术将成为未来的关键组成部分。



⭐点个星标,茫茫人海也能一眼看到我⭐

「 点赞、在看,记得两连~ 」

安森美 安森美(onsemi, 纳斯达克股票代码:ON)专注于汽车和工业终端市场,包括汽车功能电子化和安全、可持续能源网、工业自动化以及5G和云基础设施等。以高度差异化的创新产品组合,创造智能电源和感知技术,解决最复杂的挑战,帮助建设更美好的未来。
评论
  • PLC组态方式主要有三种,每种都有其独特的特点和适用场景。下面来简单说说: 1. 硬件组态   定义:硬件组态指的是选择适合的PLC型号、I/O模块、通信模块等硬件组件,并按照实际需求进行连接和配置。    灵活性:这种方式允许用户根据项目需求自由搭配硬件组件,具有较高的灵活性。    成本:可能需要额外的硬件购买成本,适用于对系统性能和扩展性有较高要求的场合。 2. 软件组态   定义:软件组态主要是通过PLC
    丙丁先生 2025-01-06 09:23 83浏览
  • 自动化已成为现代制造业的基石,而驱动隔离器作为关键组件,在提升效率、精度和可靠性方面起到了不可或缺的作用。随着工业技术不断革新,驱动隔离器正助力自动化生产设备适应新兴趋势,并推动行业未来的发展。本文将探讨自动化的核心趋势及驱动隔离器在其中的重要角色。自动化领域的新兴趋势智能工厂的崛起智能工厂已成为自动化生产的新标杆。通过结合物联网(IoT)、人工智能(AI)和机器学习(ML),智能工厂实现了实时监控和动态决策。驱动隔离器在其中至关重要,它确保了传感器、执行器和控制单元之间的信号完整性,同时提供高
    腾恩科技-彭工 2025-01-03 16:28 170浏览
  • By Toradex 秦海1). 简介嵌入式平台设备基于Yocto Linux 在开发后期量产前期,为了安全以及提高启动速度等考虑,希望将 ARM 处理器平台的 Debug Console 输出关闭,本文就基于 NXP i.MX8MP ARM 处理器平台来演示相关流程。 本文所示例的平台来自于 Toradex Verdin i.MX8MP 嵌入式平台。  2. 准备a). Verdin i.MX8MP ARM核心版配合Dahlia载板并
    hai.qin_651820742 2025-01-07 14:52 40浏览
  • 根据Global Info Research项目团队最新调研,预计2030年全球封闭式电机产值达到1425百万美元,2024-2030年期间年复合增长率CAGR为3.4%。 封闭式电机是一种电动机,其外壳设计为密闭结构,通常用于要求较高的防护等级的应用场合。封闭式电机可以有效防止外部灰尘、水分和其他污染物进入内部,从而保护电机的内部组件,延长其使用寿命。 环洋市场咨询机构出版的调研分析报告【全球封闭式电机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球封闭式电机总体规
    GIRtina 2025-01-06 11:10 103浏览
  • 彼得·德鲁克被誉为“现代管理学之父”,他的管理思想影响了无数企业和管理者。然而,关于他的书籍分类,一种流行的说法令人感到困惑:德鲁克一生写了39本书,其中15本是关于管理的,而其中“专门写工商企业或为企业管理者写的”只有两本——《为成果而管理》和《创新与企业家精神》。这样的表述广为流传,但深入探讨后却发现并不完全准确。让我们一起重新审视这一说法,解析其中的矛盾与根源,进而重新认识德鲁克的管理思想及其著作的真正价值。从《创新与企业家精神》看德鲁克的视角《创新与企业家精神》通常被认为是一本专为企业管
    优思学院 2025-01-06 12:03 113浏览
  • 大模型的赋能是指利用大型机器学习模型(如深度学习模型)来增强或改进各种应用和服务。这种技术在许多领域都显示出了巨大的潜力,包括但不限于以下几个方面: 1. 企业服务:大模型可以用于构建智能客服系统、知识库问答系统等,提升企业的服务质量和运营效率。 2. 教育服务:在教育领域,大模型被应用于个性化学习、智能辅导、作业批改等,帮助教师减轻工作负担,提高教学质量。 3. 工业智能化:大模型有助于解决工业领域的复杂性和不确定性问题,尽管在认知能力方面尚未完全具备专家级的复杂决策能力。 4. 消费
    丙丁先生 2025-01-07 09:25 77浏览
  • 每日可见的315MHz和433MHz遥控模块,你能分清楚吗?众所周知,一套遥控设备主要由发射部分和接收部分组成,发射器可以将控制者的控制按键经过编码,调制到射频信号上面,然后经天线发射出无线信号。而接收器是将天线接收到的无线信号进行解码,从而得到与控制按键相对应的信号,然后再去控制相应的设备工作。当前,常见的遥控设备主要分为红外遥控与无线电遥控两大类,其主要区别为所采用的载波频率及其应用场景不一致。红外遥控设备所采用的射频信号频率一般为38kHz,通常应用在电视、投影仪等设备中;而无线电遥控设备
    华普微HOPERF 2025-01-06 15:29 125浏览
  • 在智能家居领域中,Wi-Fi、蓝牙、Zigbee、Thread与Z-Wave等无线通信协议是构建短距物联局域网的关键手段,它们常在实际应用中交叉运用,以满足智能家居生态系统多样化的功能需求。然而,这些协议之间并未遵循统一的互通标准,缺乏直接的互操作性,在进行组网时需要引入额外的网关作为“翻译桥梁”,极大地增加了系统的复杂性。 同时,Apple HomeKit、SamSung SmartThings、Amazon Alexa、Google Home等主流智能家居平台为了提升市占率与消费者
    华普微HOPERF 2025-01-06 17:23 141浏览
  •     为控制片内设备并且查询其工作状态,MCU内部总是有一组特殊功能寄存器(SFR,Special Function Register)。    使用Eclipse环境调试MCU程序时,可以利用 Peripheral Registers Viewer来查看SFR。这个小工具是怎样知道某个型号的MCU有怎样的寄存器定义呢?它使用一种描述性的文本文件——SVD文件。这个文件存储在下面红色字体的路径下。    例:南京沁恒  &n
    电子知识打边炉 2025-01-04 20:04 98浏览
  • 村田是目前全球量产硅电容的领先企业,其在2016年收购了法国IPDiA头部硅电容器公司,并于2023年6月宣布投资约100亿日元将硅电容产能提升两倍。以下内容主要来自村田官网信息整理,村田高密度硅电容器采用半导体MOS工艺开发,并使用3D结构来大幅增加电极表面,因此在给定的占位面积内增加了静电容量。村田的硅技术以嵌入非结晶基板的单片结构为基础(单层MIM和多层MIM—MIM是指金属 / 绝缘体/ 金属) 村田硅电容采用先进3D拓扑结构在100um内,使开发的有效静电容量面积相当于80个
    知白 2025-01-07 15:02 66浏览
  • 随着市场需求不断的变化,各行各业对CPU的要求越来越高,特别是近几年流行的 AIOT,为了有更好的用户体验,CPU的算力就要求更高了。今天为大家推荐由米尔基于瑞芯微RK3576处理器推出的MYC-LR3576核心板及开发板。关于RK3576处理器国产CPU,是这些年的骄傲,华为手机全国产化,国人一片呼声,再也不用卡脖子了。RK3576处理器,就是一款由国产是厂商瑞芯微,今年第二季推出的全新通用型的高性能SOC芯片,这款CPU到底有多么的高性能,下面看看它的几个特性:8核心6 TOPS超强算力双千
    米尔电子嵌入式 2025-01-03 17:04 55浏览
  • 这篇内容主要讨论三个基本问题,硅电容是什么,为什么要使用硅电容,如何正确使用硅电容?1.  硅电容是什么首先我们需要了解电容是什么?物理学上电容的概念指的是给定电位差下自由电荷的储藏量,记为C,单位是F,指的是容纳电荷的能力,C=εS/d=ε0εrS/4πkd(真空)=Q/U。百度百科上电容器的概念指的是两个相互靠近的导体,中间夹一层不导电的绝缘介质。通过观察电容本身的定义公式中可以看到,在各个变量中比较能够改变的就是εr,S和d,也就是介质的介电常数,金属板有效相对面积以及距离。当前
    知白 2025-01-06 12:04 167浏览
  • 光耦合器,也称为光隔离器,是一种利用光在两个隔离电路之间传输电信号的组件。在医疗领域,确保患者安全和设备可靠性至关重要。在众多有助于医疗设备安全性和效率的组件中,光耦合器起着至关重要的作用。这些紧凑型设备经常被忽视,但对于隔离高压和防止敏感医疗设备中的电气危害却是必不可少的。本文深入探讨了光耦合器的功能、其在医疗应用中的重要性以及其实际使用示例。什么是光耦合器?它通常由以下部分组成:LED(发光二极管):将电信号转换为光。光电探测器(例如光电晶体管):检测光并将其转换回电信号。这种布置确保输入和
    腾恩科技-彭工 2025-01-03 16:27 180浏览
  • 本文介绍Linux系统更换开机logo方法教程,通用RK3566、RK3568、RK3588、RK3576等开发板,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。制作图片开机logo图片制作注意事项(1)图片必须为bmp格式;(2)图片大小不能大于4MB;(3)BMP位深最大是32,建议设置为8;(4)图片名称为logo.bmp和logo_kernel.bmp;开机
    Industio_触觉智能 2025-01-06 10:43 87浏览
  • 根据环洋市场咨询(Global Info Research)项目团队最新调研,预计2030年全球无人机锂电池产值达到2457百万美元,2024-2030年期间年复合增长率CAGR为9.6%。 无人机锂电池是无人机动力系统中存储并释放能量的部分。无人机使用的动力电池,大多数是锂聚合物电池,相较其他电池,锂聚合物电池具有较高的能量密度,较长寿命,同时也具有良好的放电特性和安全性。 全球无人机锂电池核心厂商有宁德新能源科技、欣旺达、鹏辉能源、深圳格瑞普和EaglePicher等,前五大厂商占有全球
    GIRtina 2025-01-07 11:02 63浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦