AI基础设施:从算力之战到能源之争

智能计算芯世界 2024-12-28 08:40
本文来自“AI基础设施篇:AI新视觉,从算力之争到能源之争”,数据中心已经是“烧电大户”,用电量占比达到全美 4%2023 年美国数据中心合计功率约 19GW,按此估算全年耗电量约 166TWh(太瓦时),在全国用电量中占比 4%
重磅合集」本星球合集资源链接,进入链接检索内容,根据提示均可下载:
1、《70+篇半导体行业“研究框架”合集》
2、《55+份智能网卡和DPU合集》
3、《14份半导体“AI的iPhone时刻”系列合集》
4、《21份走进“芯”时代系列深度报告合集》
5、《800+份重磅ChatGPT专业报告
6、《92份GPU技术及白皮书汇总》

数据中心烧电 166 TWh,超过纽约市全年耗电量,相当于 1538 万家庭用户全年耗电量。分地区来看,22 年纽约全年耗电量 143.2TWh,德州全年耗电量 475.4TWh,加州 251.9TWh,佛罗里达 248.8TWh,华盛顿 90.9TWh美国数据中心全年耗电量超过纽约市全年耗电量。2022 年每位住宅用户的年平均用电量为 10791kWh,照此估算,166TWh 相当于约 1538万家庭用户一年的耗电量。

AI 对电网的挑战

【挑战一:用电总量大幅提升】

与传统的数据中心相比,AI 数据中心需要消耗大量电量。主要原因是数据量的大幅增长、复杂的算法以及 24/7 即时相应的需求。例如,一个 Google 传统搜索的请求消耗约 0.3Wh,而一个 ChatGPT 请求需要消耗 2.9Wh,为前者的十倍;《焦耳》上发表的一篇论文称,如果谷歌每一次搜索都使用 AIGC,其用电量将上升到每年 290 亿 KWh,这将超过肯尼亚、克罗地亚等许多国家的总用电量;根据纽约客杂志报道,ChatGPT 每天消耗超过 50 KWh

【挑战二:用电摆伏加剧】

现象:AI 数据中心(无论是训练还是推理)电流需求高度瞬变,会在几秒内出现巨大的摆幅。随着神经网络模型任务负载的增加或减少,电流需求会有剧烈波动,每微秒变化甚至可达2000A

原理:1)高峰负载波动:AI 模型的训练和推理对算力需求巨大,但并非持续运行,模型训练启动时会出现高峰负载,而低谷时则维持基础运行,导致用电摆伏;2)资源动态调度:AI任务具有周期性,例如大规模训练需要集中资源,而推理阶段相对分散,这使得功耗曲线更加不稳定;3)实时响应需求:生成式 AI 和大模型应用需要低延迟和高吞吐,驱动基础设施实时扩展,进一步放大功耗波动性。

结果:影响电网稳定性。电网设计并不适应摆伏过大,电网基本针对用电负荷进行设计,希望看到一个比较平稳、有规律的缓慢变化的负载,例如,用电负荷 100GW 的用电设备接入电网后可能会有两条 200GW 的传输线进行供电,两条传输线有一条传输线正常就可以保证运行。而 AI 用电特征会在几秒内出现巨大摆幅,这种剧烈波动可能会影响电网的稳定性。

【挑战三:后续用电需求更大】

AI 数据中心的推理由于用户的大量请求,会比训练更消耗能源。目前,谷歌已在今年上半年宣布将加入新的 AI 功能完善搜索体验,将推出基于 Gemini AI Overviews,该功能已面向部分用户开放试用;微软推出名为 Microsoft Copilot 的个人 AI 助手,并已将 ChatGPT 集成到 Bing 中。而目前谷歌搜索引擎的访问量已经达到每月 820 亿次,Office 商业产品的付费用户数量已超过 4 亿,庞大的用户基数意味着训练好的大模型如果集成到公司产品中,用户请求数将大量增长,AI 即时响应次数激增,导致模型推理耗能超过训练耗能。根据麦肯锡估计,直到 2030 年美国数据中心电力负载可能占所有新增需求的 30%40%

结论:随着 AI 的迅速发展,预计集成大语言模型的 AI 软件将会迅速发展,训练需求和推理需求共振,未来数据中心用电量将大幅提升,AIDC 会成为新一代“电老虎”,数据中心消耗电力的比重会进一步提升。

AIDC 究竟多耗电?

测算角度一(保守):AI 芯片

测算逻辑:测算角度一是从芯片数量角度出发,推演到 2030 年,再用芯片数量*芯片功耗来预测用电总量,未考虑服务器整体功耗会大于单芯片*数量,未考虑将来芯片升级迭代后可能发生的单芯片功耗提升情况,因此我们认为测算角度一属于“保守型”测算,测算数据是几种方法中较小的,2030 AIDC 用电需求为 57GW

在用 GPUTPU 数量:根据 DCD 报道,2023 年英伟达、AMD 和英特尔三家企业数据中心GPU 总出货量预估为 385 万个,2023 年为谷歌生产的 TPU 数量预计为 93 万个。进一步追溯供应链,台积电预测,2024 2029 AI 服务器制造的需求的同比增长率约为 50%。以此计算,2030 GPU 出货量约为 6578 万,TPU 出货量约为 1589 万。而根据英伟达官方说法,大部分 H100A100 的使用寿命平均为 5 年,因此我们假设 2030 年在用芯片数量为 26-30 年芯片出货量的总和,因此 2030 年在用 GPUTPU 数量约为 17136 万和 4139 万。

GPUTPU 功耗:H100 NVL 的最大功率可达到 800W。则 2030 年预计将有 17136 万个 GPU,假设 GPUTPU 能耗占 IT 设备总能耗的 90%,假设美国占比 34%,利用率为 80%PUE 1.3 计算,2030 年美国 AIDC GPU 电力需求约为 54GWGPU 数量*GPU 功耗*美国占比*PUE*利用率÷芯片占比=17136 万个*0.8kW*34%*1.3*80%÷90%=54GW)。

而根据谷歌官方说法,TPU v4 芯片平均功率为 200W,结合上述 2030 年在用 TPU 量约为 4139 万的估计,我们预计 2030 TPU 总功耗约为 3.3GW(其他指标假设与 GPU 相同)。

角度一结论:2030 年美国 AIDC 用电总量为 57GW23-26 年芯片存量仅考虑 23 年之后的芯片出货量进行加总,其他计算方法与上述方法相同,27 年至 30 年与上述计算方法相同,最终加总 GPU TPU 功耗得出美国 AIDC 所需电容量在 24-30 年将分别达到 3、6、10、17、25、38、57GW

测算角度二(乐观):数据中心

测算逻辑:测算角度二是从数据中心建设角度出发,参考第三方预测的全球数据中心建设进度(复合增速 25%),同时由于预测数据截至 2026 年,我们假设 2027 2030 年依旧维持 25%的复合增速,对全球数据中心电力需求进行预测,并假设其中 AIDC 的用电量和占比,因此我们认为,该预测角度得到的数据较为“乐观”,最终预测到 2030 年美国 AIDC 用电需求最高为 91GW

研究公司 SemiAnalysis 利用了 5000 多个数据中心的分析和建设预测,并将这些数据与全球数据以及卫星图像分析相结合,预计未来几年数据中心电力容量增长将加速至 25%的复合年增长率,同时 AIDC 占比将进一步提升,数据中心方面,根据预测数据,全球数据中心关键 IT 电力需求将从 23 年的 49GW 激增到 26 年的 96GW,我们假设 27-30 年继续保持数据中心25%的复合增速(参考 2023 2026 年增速,为 25%),那么到 2930 年全球数据中心关键 IT 电力需求分别增长至 188234GW;参考 Semi Analysis 数据,结合 AI 算力蓬勃发展、下游应用陆续爆发大背景,我们认为未来 AI 在数据中心中占比有望持续加速提升,因此我们假设 23-30 年全球 AIDC 占比分别达到 12%、16%、30%、44%、56%、68%、78%、88%,从而计算出 2930 年全球的 AIDC IT 设备电力需求分别为 65GW91GW

角度二结论:以美国占比为 34%PUE 1.3 计算,到 2030 年美国 AIDC 电力需求将达91GW

总结一:AIDC 占比全美总耗电比例提升

根据 Statista 预测数据,2022 年,美国的电力使用量约为 4085 太瓦时,预计未来几十年美国的电力使用量将继续上升,到 2030 年达到 4315 太瓦时(对应 493GW),到 2050 年将达到 5178 太瓦时。根据我们前面的“测算角度一”,假如 2030 AIDC 总功耗最高为 57GW,那么占全美用电量的比重将提升至 12%57GW/493GW),较 2023 年的 5%大幅提升。

总结二:AIDC 耗电量有望比肩比特币挖矿

比特币矿场用电量进行过假设和预测,在该报告中,据我们预测 2024、2025、2026、2027、2028 年得州比特币矿场负荷分别为 4.7/6.5/8.3/10.1/11.9GW(假设得州比特币矿场年新增负荷为 1.8GW),关于得州比特币矿场负荷在美国的份额,我们假设保持 28.5%不变,因此据我们预测美国比特币矿场年负荷分别为 17/23/29/36/42GW

结论:保守预测下,美国 AIDC 耗电量将在 2030 年赶超比特币挖矿电力需求;乐观预测下,美国 AIDC 电力需求将在 2029 年超过比特币挖矿。

下载链接:
半导体行业系列专题:晶圆代工,特色工艺蓬勃发展,自主可控成果显著
AI的裂变时刻”系列报告合集(2)
AI的裂变时刻”系列报告合集(1)
人工智能行业AI硬件全景洞察报告:下一波AI创新机遇在物理空间(2024)
中国移动:智能体通信网络(ACN)白皮书
豆包出圈:解析字节的AI终端布局
AI基础设施篇:AI新视觉,从算力之争到能源之争
中国计算机和软件:模型即服务(MaaS)
智算产业趋势展望:数据智能时代到来(2024)
《2024年生成式AI大会(实践篇)》
1、豆包MarsCode落地编程助手场景的探索与实战 2、多模态LLM在云音乐推荐场景的落地应用 3、腾讯游戏知几语音合成大模型推理实践 4、多模态大语言模型领域进展分享
《2024年生成式AI大会(RAG生成检索篇)》
1、RAG 2.0引擎的设计挑战和实现 2、GraphRAG进展分享 3、基于大模型的生成式检索 4、增强AI能力的Agent实践RAG与Tool Use的协同效应 5、RAG在办公领域中的探索与实践
伽马数据:人工智能行业研究报告(2024.10)
2024新技术前瞻专题系列合集
SSD闪存技术基础知识全解(知识星球版)
服务器基础知识全解(知识星球版)
存储系统基础知识全解(知识星球版)


本号资料全部上传至知识星球,更多内容请登录智能计算芯知识(知识星球)星球下载全部资料。




免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。



温馨提示:

请搜索“AI_Architect”或“扫码”关注公众号实时掌握深度技术分享,点击“阅读原文”获取更多原创技术干货。



智能计算芯世界 聚焦人工智能、芯片设计、异构计算、高性能计算等领域专业知识分享.
评论
  • 一、前言 回首2024,对于我而言,是充满挑战与收获的一年。在这一年里,我积极参与了论坛的众多活动,不仅拓宽了我的认知边界(有些东西不是你做不到,而是你想不到),还让我在实践中收获了宝贵的经验和。同时,多种多样的论坛活动让我们全方面的接受新东西,连接新知识,多种类型的的活动交织了你我的2024。在这里说一说对过去一年的活动经历,进行一次年终总结,并谈谈我的收获和感受,以及对2025年的展望。二、活动足迹(一)快速体验:机智云Gokit2.0开发板初体验 机智云Gokit2.0开发板的体验活动让大
    无言的朝圣 2024-12-27 14:50 86浏览
  • 在当今竞争激烈的商业世界中,供应链管理已成为企业生存与发展的核心竞争力之一。它就像一条无形的纽带,将供应商、制造商、分销商、零售商直至最终消费者紧密相连,确保产品和服务能够高效、顺畅地流转。今天,就让我们一同深入探索供应链管理的奥秘。供应链管理是什么简单来说,供应链管理是对从原材料采购、生产制造、产品配送直至销售给最终用户这一整个过程中,涉及的物流、信息流和资金流进行计划、协调、控制和优化的管理活动。它不仅仅是对各个环节的简单串联,更是一种通过整合资源、优化流程,实现整体效益最大化的管理理念和方
    Jeffreyzhang123 2024-12-27 17:27 97浏览
  • 在当今这个科技飞速发展的时代,物联网(IoT)已经不再是一个陌生的概念,它正以一种前所未有的速度改变着我们的生活和工作方式,像一股无形的力量,将世界紧密地连接在一起,引领我们步入一个全新的智能时代。物联网是什么简单来说,物联网就是通过感知设备、网络传输、数据处理等技术手段,实现物与物、人与物之间的互联互通和智能化管理。想象一下,你的家里所有的电器都能 “听懂” 你的指令,根据你的习惯自动调节;工厂里的设备能够实时监测自身状态,提前预警故障;城市的交通系统可以根据实时路况自动优化信号灯,减少拥堵…
    Jeffreyzhang123 2024-12-27 17:18 82浏览
  • 在科技飞速发展的今天,医疗电子作为一个融合了医学与电子技术的交叉领域,正以前所未有的速度改变着我们的医疗模式和健康生活。它宛如一颗璀璨的明珠,在医疗领域绽放出耀眼的光芒,为人类的健康福祉带来了诸多惊喜与变革。医疗电子的神奇应用医疗电子的应用范围极为广泛,深入到医疗的各个环节。在诊断方面,各种先进的医学成像设备堪称医生的 “火眼金睛”。X 光、CT、MRI 等成像技术,能够清晰地呈现人体内部的结构和病变情况,帮助医生准确地发现疾病。以 CT 为例,它通过对人体进行断层扫描,能够提供比传统 X 光更
    Jeffreyzhang123 2024-12-27 15:46 98浏览
  • 从教师的角度来看,麻省理工学院开除因学术造假的学生,这一决定是合理且必要的。首先,学术诚信是学术研究的基石。在学术界,真实性和原创性是至关重要的。学术造假不仅破坏了学术研究的公正性和准确性,还损害了学术领域的整体声誉。因此,对于任何形式的学术不端行为,包括伪造数据、抄袭等,学校都应采取严厉措施,以维护学术诚信。其次,学校对学生具有管理权,包括对学生的处分权。按照相关规定,学校有权对违纪学生进行警告、严重警告、记过、留校察看、勒令退学、开除学籍等处分。开除学籍是一种严厉的处分,通常适用于严重违反学
    curton 2024-12-28 21:49 36浏览
  • 在当今这个数字化的时代,电子设备无处不在,从我们手中的智能手机、随身携带的笔记本电脑,到复杂的工业控制系统、先进的医疗设备,它们的正常运行都离不开一个关键的 “幕后英雄”—— 印刷电路板(Printed Circuit Board,简称 PCB)。PCB 作为电子设备中不可或缺的重要部件,默默地承载着电子元件之间的连接与信号传输,是整个电子世界的基石。揭开 PCB 的神秘面纱PCB,简单来说,就是一块由绝缘材料制成的板子,上面通过印刷、蚀刻等工艺形成了导电线路和焊盘,用于固定和连接各种电子元件。
    Jeffreyzhang123 2024-12-27 17:21 86浏览
  • 图森未来的“夺权之争”拉扯了这么久,是该画上句号了。大约9年前,侯晓迪、陈默、郝佳男等人共同创立了图森未来,初衷是以L4级别的无人驾驶卡车技术为全球物流运输行业赋能。此后,先后获得了5轮融资,累计融资额超过6.5亿美元,并于2021年成功在美国纳斯达克上市,成为全球自动驾驶第一股。好景不长,2023年市场屡屡传出图森未来裁员、退市的消息。今年1月份,图森未来正式宣布退市,成为了全球首个主动退市的自动驾驶公司。上市匆匆退市也匆匆,其背后深层原因在于高层的频繁变动以及企业的转型调整。最近,图森未来的
    刘旷 2024-12-27 10:23 68浏览
  • 一、引言无人机,作为近年来迅速崛起的新兴技术产物,正以前所未有的速度改变着众多行业的运作模式,从民用领域的航拍、物流,到工业领域的测绘、巡检,再到军事领域的侦察、打击等,无人机的身影无处不在。为了深入了解无人机的现状,本次调研综合了市场数据、行业报告、用户反馈等多方面信息,全面剖析无人机的发展态势。二、市场规模与增长趋势随着技术的不断进步和成本的逐渐降低,无人机市场呈现出爆发式增长。近年来,全球无人机市场规模持续扩大,预计在未来几年内仍将保持较高的增长率。从应用领域来看,消费级无人机市场依然占据
    Jeffreyzhang123 2024-12-27 17:29 160浏览
  • 起源与基础20 世纪 60 年代:可编程逻辑设备(PLD)的概念出现,一种被称为 “重构能力” 的芯片的可编程性吸引了许多工程师和学者。20 世纪 70 年代:最早的可编程逻辑器件 PLD 诞生,其输出结构是可编程的逻辑宏单元,它的硬件结构设计可由软件完成,设计比纯硬件的数字电路更灵活,但结构简单,只能实现小规模电路。诞生与发展20 世纪 80 年代中期:为弥补 PLD 只能设计小规模电路的缺陷,复杂可编程逻辑器件 CPLD 被推出,它具有更复杂的结构,能够实现较大规模的电路设计。1988 年:
    Jeffreyzhang123 2024-12-27 10:41 72浏览
  • 引言工程师作为推动科技进步和社会发展的核心力量,在各个领域发挥着关键作用。为深入了解工程师的职场现状,本次调研涵盖了不同行业、不同经验水平的工程师群体,通过问卷调查、访谈等方式,收集了大量一手数据,旨在全面呈现工程师的职场生态。1. 工程师群体基本信息行业分布:调研结果显示,工程师群体广泛分布于多个行业,其中制造业占比最高,达到 90%,其次是信息技术、电子通信、能源等行业。不同行业的工程师在工作内容、技术要求和职业发展路径上存在一定差异。年龄与经验:工程师群体以中青年为主,30 - 45 岁年
    Jeffreyzhang123 2024-12-27 17:39 115浏览
  • 采购与分销是企业运营中至关重要的环节,直接影响到企业的成本控制、客户满意度和市场竞争力。以下从多个方面介绍如何优化采购与分销:采购环节优化供应商管理供应商评估与选择:建立一套全面、科学的供应商评估体系,除了考虑价格因素,还要综合评估供应商的产品质量、交货期、信誉、研发能力、售后服务等。通过多维度评估,选择那些能够提供优质产品和服务,且与企业战略目标相契合的供应商。建立长期合作关系:与优质供应商建立长期稳定的合作关系,这种合作模式可以带来诸多好处。双方可以在信任的基础上进行深度沟通与协作,共同开展
    Jeffreyzhang123 2024-12-27 17:43 111浏览
  • 在科技飞速发展的今天,汽车不再仅仅是一种交通工具,更是一个融合了先进技术的移动智能空间。汽车电子作为汽车产业与电子技术深度融合的产物,正以前所未有的速度推动着汽车行业的变革,为我们带来更加智能、安全、舒适的出行体验。汽车电子的发展历程汽车电子的发展可以追溯到上世纪中叶。早期,汽车电子主要应用于发动机点火系统和简单的电子仪表,功能相对单一。随着半导体技术的不断进步,集成电路被广泛应用于汽车领域,使得汽车电子系统的性能得到了显著提升。从电子燃油喷射系统到防抱死制动系统(ABS),从安全气囊到车载导航
    Jeffreyzhang123 2024-12-27 11:53 111浏览
  • 在当今科技飞速发展的时代,工业电子作为现代制造业的中流砥柱,正以前所未有的速度推动着各个行业的变革与进步。从汽车制造到航空航天,从智能家居到工业自动化,工业电子的身影无处不在,为我们的生活和生产带来了巨大的改变。工业电子的崛起与发展工业电子的发展历程可谓是一部波澜壮阔的科技进化史。追溯到上世纪中叶,电子技术开始逐渐应用于工业领域,最初主要是简单的电子控制装置,用于提高生产过程的自动化程度。随着半导体技术、计算机技术和通信技术的不断突破,工业电子迎来了爆发式的增长。集成电路的发明使得电子设备的体积
    Jeffreyzhang123 2024-12-27 15:40 110浏览
  • 发明阶段(20世纪80年代至90年代)起源:当时ASIC设计成本高,周期长,流片失败率高,业界需要一种通用的半导体器件进行流片前测试和验证,可编程逻辑器件就此产生。诞生:1980年,Xilinx公司成立。1985年,Ross Freeman制造了第一片PFGA芯片XC2064,采用4输入,1输出的LUT和FF结合的基本逻辑单元。发展阶段(1992年至1999年)容量提升:FPGA容量不断上涨,芯片面积逐渐增大,为架构穿心提供空间,复杂功能可以实现。布线问题凸显:缩着芯片复杂度增加,片上资源的互连
    Jeffreyzhang123 2024-12-27 10:26 89浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦