越来越“热”的芯片,如何降温?

EETOP 2024-09-12 11:47

前言:2024年,AI的“狂飙突进”势头不减,继ChatGPT之后,文生视频大模型 Sora 的推出更是让人们看到AI的无限可能。然而,随之而来的能耗问题也不容忽视。国际能源署(IEA)《Electricity 2024——Analysis and forecast to 2026E》的报告,ChatGPT每响应一个请求需要消耗2.9瓦时,这相当于一个5瓦的LED灯泡亮35分钟。考虑到每天90亿次搜索,这将在一年内额外消耗近10太瓦时的电力,相当于一座小型核电站一年的发电量。而这些能源消耗的“罪魁祸首”之一,就是支撑AI运行的芯片。为了保证芯片的高效运行,庞大的数据中心往往需要消耗大量的电力进行冷却。根据IEA的报告,数据中心的电力需求主要来自计算和冷却两个方面,两者各占总电力需求的40%左右。预计到2026年,全球数据中心、加密货币和人工智能的电力消耗将在620至1,050 TWh之间变动。


 来源:IEA《Electricity 2024 - Analysis and forecast to 2026》


近年来,为了满足5G、AI、汽车电子等新兴市场不断增长的算力需求,芯片的集成度不断提高,相应的功耗也随之增加。功耗增加会产品热量,当热度达到一定程度,芯片轻则宕机,重则损毁。一个直观的生活案例,这就好比我们的手机,过热会直接死机。因此芯片散热已是当今工程师的“必修课”。但为了满足便携性和美观性需求,电子设备的尺寸又必须不断减小,这就导致给散热系统留下的空间愈发有限。如何高效散热,已成为整个行业亟待解决的关键问题。


01

电子系统散热:日益严峻的挑战

随着芯片制程的不断微缩,大大加剧了散热困境。按照传统散热经验,芯片的散热密度存在物理极限,每平方毫米芯片的散热能力约为 1 瓦。目前行业内的发展趋势是,进入 10 纳米以下,英特尔和 AMD 等芯片巨头纷纷采用均热片来解决发热问题。3 纳米和 2 纳米甚至是埃米时代的来临,散热将是头等大事。

在人工智能浪潮的推动下,下一代 AI 芯片,其功耗甚至超过 1 千瓦。面对如此高功耗,液冷技术成为必要的降温选择。然而,设备越热,其冷却成本也随之增加。CDCC 的统计数据显示,数据中心的制冷系统在资本支出(CAPEX)中占 20-25%,在运营支出(OPEX)中的电力成本更是占了 40%。

功耗曾经被视为软性指标,但现在已成为芯片设计中的重要考量因素。过高的热量带来的不良影响不容忽视:

  • 性能下降:过高的温度会导致芯片性能下降,甚至出现死机、蓝屏等故障。

  • 可靠性降低:高温会加速电子元件的老化,缩短设备的使用寿命。

  • 安全性隐患:极端情况下,过热可能引发火灾等安全事故。

  • 能源浪费:过多的电力消耗不仅增加了运营成本,还加剧了能源危机。 

热量不仅会影响单个电子元件的性能,还会对整个电子系统的可靠性造成威胁。以现代汽车为例,在汽车电动化、智能化和网联化的发展趋势下,车内集成了成百上千个电子元件,这些元件之间相互作用产生的热量和振动,会形成复杂的热应力和机械应力场,影响设备的稳定性和可靠性。

面对日益严峻的散热挑战,以及对芯片性能提升的孜孜以求,如何在保证芯片性能的前提下,有效解决散热问题,是摆在业界面前的一项紧迫任务。

EDA 的角度来看,要实现精准的热分析面临着诸多挑战。首先,热量在芯片内的传播路径复杂多样,需要考虑不同材料的热导率、界面热阻等因素。其次,对于 3D-IC 等先进封装技术,需要考虑不同层次之间的热传导和散热路径,这增加了分析的复杂性和计算的负担。此外,由于热仿真的精度要求高,需要考虑如何在保证计算效率的同时,不影响分析结果的准确性。

然而,当前市场上的热分析工具往往是零散的且功能单一,工程师需要同时使用多个不同的软件和方法来完成散热设计,这增加了工程开发周期和成本,同时降低了设计的效率和一致性。传统的电子散热设计和分析工具已显得力不从心。


因此,电子行业亟需要创新的方法和工具来为芯片“降温”。这种解决方案应具备以下特点: 

  • 早期评估:在设计初期就对热解决方案进行评估,积极利用数字孪生等创新技术,避免后期返工。通过采用“左移”开发策略,即在设计早期引入热分析,我们可以更早地发现并解决潜在的热问题,从而提高产品的可靠性。

  • 全局入手:将整个电子系统作为一个整体进行热分析,考虑各组件之间的相互作用。

  • 统一平台:提供一个集成的设计环境,涵盖热仿真、流体仿真等多种分析功能。

02

Cadence Celsius Studio

开启散热设计新时代

今年初,Cadence 以其一贯的创新精神,推出了一款真正的系统级热分析工具——Cadence Celsius Studio,它结合有限元分析(FEA)与计算流体力学(CFD)技术,为电子行业日益严峻的散热问题提供了一套全面的解决方案。作为业界首个将 AI 技术与热设计深度融合的综合性平台,Celsius Studio 打破了传统热分析工具的局限,将电热协同仿真、电子元件冷却和热应力分析整合到一个综合的平台,引领电子系统热设计迈向一个全新的智能化时代。


Cadence Celsius Studio 实现了多项突破:

(一)真正的热系统分析:Cadence Celsius Studio 中,热和应力的建模是通过有限元分析(FEA)来完成的,通过精细到粗略的网格设计,可以满足广泛的精度需求。在 Cadence Celsius EC Solver 中,工程师可以通过建模对流和/或主动冷却(如风扇等),来实现散热分析。

 

(二)AI 驱动,实现设计优化:当今的高性能电子系统要求设计人员考虑 SIPI 和热完整性以及电磁干扰和兼容性(EMI/EMC)等问题,多物理场分析变得至关重要。Celsius Studio 中所搭载的 Cadence Optimality Intelligent System Explorer,是一款 AI 驱动的多物理场优化软件,它突破了传统人力密集型优化流程的限制,用 AI 驱动的技术取代了传统的设计-测试-优化循环的交互流程,可对整个设计空间进行快速高效的探索,锁定理想设计。

 

人工智能技术的引入,为电子设计自动化带来了革命性的变革。Celsius Studio 不仅能帮助工程师在设计早期阶段发现热问题,还可提供分析和设计洞察,预测潜在的热问题,并提供智能化的优化建议,尽可能减少机械工程团队的后期设计迭代,缩短电子系统的开发迭代周期。Celsius Studio 专为大规模并行执行而设计,经过生产验证,其可在不牺牲精度的前提下,与手动、详尽、强力的参数表研究相比,生产力平均提高 10 倍。

 

计算流体动力学(CFD)是多物理系统分析的一个方面,它使用数值模型模拟流体的行为及其热力学特性。

 

(三)打通电气工程师和机械工程师的“鸿沟”:随着 PCB 机械外壳尺寸日益减小以及 PCB 本身复杂性的增加,电气和机械工程师之间的协作对于芯片和系统的热分析和优化愈发重要。从电路板的轮廓到最终布局和布线,双方必须掌握相同的信息,彼此同步进行,并消除过程中的冗余。

 

为了进行这种分析,ECAD(电子计算辅助设计)+ MCAD(机械计辅助设计)的协作必不可少。MCAD 和 ECAD 之间的无缝集成曾经是导致分析速度慢的主要障碍之一。在 Celsius Studio 中,Cadence 内部的专家简化了 MCAD 和 ECAD 模型的导入过程,将之前几天的工作量大大缩短到几乎无感知的时间,使得电路板和机架内的热、应力和冷却分析变得更加高效和简便。

 

Celsius Studio 平台既面向电气工程师,也可以满足机械工程师的需求。对于电气工程师,Celsius Thermal Solver 可进行芯片/SoC 性能/热分析、封装和 PCB 的电热协同仿真,以及在兼顾热影响的同时进行封装/PCB 的元件摆放。对于热工程师,Celsius Electronics Cooling 提供了电子元件冷却散热分析,可通过添加散热器、风扇、通风口来缓解潜在的热问题。

 

(四)多平台无缝集成,众人拾柴火焰高:Celsius Studio 的强大之处在于,可以与 Cadence 的多种实现平台无缝集成,包括 Allegro X Design Platform(用于电路板设计)、AWR Design Environment(用于微波 IC)、Virtuoso System Design Platform(用于定制/模拟电路)和 Innovus Implementation System(用于数字电路),芯片散热是一个复杂的工程性问题。Cadence 正在集结过往几十年的经验,将更多的工具整合在一起,助力热分析更加便捷。

 

这些多工具的见解可指导电源整体热和应力分析以及热量减少策略、布局优化以及热通孔和温度传感器布局,让电气和机械/热工程师可以在同一个环境中对设计装配流程执行多阶段分析,解决单个封装上多晶粒堆叠的 3D-IC 翘曲问题,无需对几何体进行简化或转换。

 

Celsius Studio 正在成为电子行业解决热设计难题的首选工具,帮助企业提高产品竞争力,加速产品创新。 

  • 通过采用 Celsius Studio,三星半导体在设计早期阶段即获得了准确的热分析结果,显著提升了 3D-IC 和 2.5D 封装的设计效率,将产品开发周期缩短了 30%。

  • BAE Systems 利用 Celsius Studio 在 MMIC 设计周期内实现了快速、准确的热分析,大幅提升了 RF 和热功率放大器的性能。

  • Celsius Studio 帮助 Chipletz 的设计团队能够及早获取详细信息,解决散热问题,并显著缩短了周转时间。在 Chipletz 工程团队开发复杂设计时,能够多次高效且详细地运行 3D-IC 2.5D 封装的热仿真。 

 

总的来说,Cadence 的 Celsius Studio 为芯片、封装、电路板和终端系统提供全方位的热分析和优化提供了一种独辟蹊径的做法。 


结束语


Cadence Celsius Studio 的推出,为当今电子行业的发展带来了全新的机遇。通过将人工智能与传统仿真技术相结合,Celsius Studio 将帮助工程师克服日益严峻的散热挑战,加速创新产品的上市。


通过提供精确的热仿真和高效的设计优化功能,Celsius Studio 将成为电子工程师的得力助手,助力他们设计出更高性能、更可靠的电子产品。

EETOP EETOP半导体社区-国内知名的半导体行业媒体、半导体论坛、IC论坛、集成电路论坛、电子工程师博客、工程师BBS。
评论
  •     为控制片内设备并且查询其工作状态,MCU内部总是有一组特殊功能寄存器(SFR,Special Function Register)。    使用Eclipse环境调试MCU程序时,可以利用 Peripheral Registers Viewer来查看SFR。这个小工具是怎样知道某个型号的MCU有怎样的寄存器定义呢?它使用一种描述性的文本文件——SVD文件。这个文件存储在下面红色字体的路径下。    例:南京沁恒  &n
    电子知识打边炉 2025-01-04 20:04 100浏览
  • 随着市场需求不断的变化,各行各业对CPU的要求越来越高,特别是近几年流行的 AIOT,为了有更好的用户体验,CPU的算力就要求更高了。今天为大家推荐由米尔基于瑞芯微RK3576处理器推出的MYC-LR3576核心板及开发板。关于RK3576处理器国产CPU,是这些年的骄傲,华为手机全国产化,国人一片呼声,再也不用卡脖子了。RK3576处理器,就是一款由国产是厂商瑞芯微,今年第二季推出的全新通用型的高性能SOC芯片,这款CPU到底有多么的高性能,下面看看它的几个特性:8核心6 TOPS超强算力双千
    米尔电子嵌入式 2025-01-03 17:04 55浏览
  • 彼得·德鲁克被誉为“现代管理学之父”,他的管理思想影响了无数企业和管理者。然而,关于他的书籍分类,一种流行的说法令人感到困惑:德鲁克一生写了39本书,其中15本是关于管理的,而其中“专门写工商企业或为企业管理者写的”只有两本——《为成果而管理》和《创新与企业家精神》。这样的表述广为流传,但深入探讨后却发现并不完全准确。让我们一起重新审视这一说法,解析其中的矛盾与根源,进而重新认识德鲁克的管理思想及其著作的真正价值。从《创新与企业家精神》看德鲁克的视角《创新与企业家精神》通常被认为是一本专为企业管
    优思学院 2025-01-06 12:03 116浏览
  • 光耦合器,也称为光隔离器,是一种利用光在两个隔离电路之间传输电信号的组件。在医疗领域,确保患者安全和设备可靠性至关重要。在众多有助于医疗设备安全性和效率的组件中,光耦合器起着至关重要的作用。这些紧凑型设备经常被忽视,但对于隔离高压和防止敏感医疗设备中的电气危害却是必不可少的。本文深入探讨了光耦合器的功能、其在医疗应用中的重要性以及其实际使用示例。什么是光耦合器?它通常由以下部分组成:LED(发光二极管):将电信号转换为光。光电探测器(例如光电晶体管):检测光并将其转换回电信号。这种布置确保输入和
    腾恩科技-彭工 2025-01-03 16:27 180浏览
  • 村田是目前全球量产硅电容的领先企业,其在2016年收购了法国IPDiA头部硅电容器公司,并于2023年6月宣布投资约100亿日元将硅电容产能提升两倍。以下内容主要来自村田官网信息整理,村田高密度硅电容器采用半导体MOS工艺开发,并使用3D结构来大幅增加电极表面,因此在给定的占位面积内增加了静电容量。村田的硅技术以嵌入非结晶基板的单片结构为基础(单层MIM和多层MIM—MIM是指金属 / 绝缘体/ 金属) 村田硅电容采用先进3D拓扑结构在100um内,使开发的有效静电容量面积相当于80个
    知白 2025-01-07 15:02 75浏览
  • 在智能家居领域中,Wi-Fi、蓝牙、Zigbee、Thread与Z-Wave等无线通信协议是构建短距物联局域网的关键手段,它们常在实际应用中交叉运用,以满足智能家居生态系统多样化的功能需求。然而,这些协议之间并未遵循统一的互通标准,缺乏直接的互操作性,在进行组网时需要引入额外的网关作为“翻译桥梁”,极大地增加了系统的复杂性。 同时,Apple HomeKit、SamSung SmartThings、Amazon Alexa、Google Home等主流智能家居平台为了提升市占率与消费者
    华普微HOPERF 2025-01-06 17:23 141浏览
  • 自动化已成为现代制造业的基石,而驱动隔离器作为关键组件,在提升效率、精度和可靠性方面起到了不可或缺的作用。随着工业技术不断革新,驱动隔离器正助力自动化生产设备适应新兴趋势,并推动行业未来的发展。本文将探讨自动化的核心趋势及驱动隔离器在其中的重要角色。自动化领域的新兴趋势智能工厂的崛起智能工厂已成为自动化生产的新标杆。通过结合物联网(IoT)、人工智能(AI)和机器学习(ML),智能工厂实现了实时监控和动态决策。驱动隔离器在其中至关重要,它确保了传感器、执行器和控制单元之间的信号完整性,同时提供高
    腾恩科技-彭工 2025-01-03 16:28 170浏览
  • 每日可见的315MHz和433MHz遥控模块,你能分清楚吗?众所周知,一套遥控设备主要由发射部分和接收部分组成,发射器可以将控制者的控制按键经过编码,调制到射频信号上面,然后经天线发射出无线信号。而接收器是将天线接收到的无线信号进行解码,从而得到与控制按键相对应的信号,然后再去控制相应的设备工作。当前,常见的遥控设备主要分为红外遥控与无线电遥控两大类,其主要区别为所采用的载波频率及其应用场景不一致。红外遥控设备所采用的射频信号频率一般为38kHz,通常应用在电视、投影仪等设备中;而无线电遥控设备
    华普微HOPERF 2025-01-06 15:29 125浏览
  • 根据环洋市场咨询(Global Info Research)项目团队最新调研,预计2030年全球无人机锂电池产值达到2457百万美元,2024-2030年期间年复合增长率CAGR为9.6%。 无人机锂电池是无人机动力系统中存储并释放能量的部分。无人机使用的动力电池,大多数是锂聚合物电池,相较其他电池,锂聚合物电池具有较高的能量密度,较长寿命,同时也具有良好的放电特性和安全性。 全球无人机锂电池核心厂商有宁德新能源科技、欣旺达、鹏辉能源、深圳格瑞普和EaglePicher等,前五大厂商占有全球
    GIRtina 2025-01-07 11:02 68浏览
  • 这篇内容主要讨论三个基本问题,硅电容是什么,为什么要使用硅电容,如何正确使用硅电容?1.  硅电容是什么首先我们需要了解电容是什么?物理学上电容的概念指的是给定电位差下自由电荷的储藏量,记为C,单位是F,指的是容纳电荷的能力,C=εS/d=ε0εrS/4πkd(真空)=Q/U。百度百科上电容器的概念指的是两个相互靠近的导体,中间夹一层不导电的绝缘介质。通过观察电容本身的定义公式中可以看到,在各个变量中比较能够改变的就是εr,S和d,也就是介质的介电常数,金属板有效相对面积以及距离。当前
    知白 2025-01-06 12:04 170浏览
  • 本文介绍Linux系统更换开机logo方法教程,通用RK3566、RK3568、RK3588、RK3576等开发板,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。制作图片开机logo图片制作注意事项(1)图片必须为bmp格式;(2)图片大小不能大于4MB;(3)BMP位深最大是32,建议设置为8;(4)图片名称为logo.bmp和logo_kernel.bmp;开机
    Industio_触觉智能 2025-01-06 10:43 87浏览
  • PLC组态方式主要有三种,每种都有其独特的特点和适用场景。下面来简单说说: 1. 硬件组态   定义:硬件组态指的是选择适合的PLC型号、I/O模块、通信模块等硬件组件,并按照实际需求进行连接和配置。    灵活性:这种方式允许用户根据项目需求自由搭配硬件组件,具有较高的灵活性。    成本:可能需要额外的硬件购买成本,适用于对系统性能和扩展性有较高要求的场合。 2. 软件组态   定义:软件组态主要是通过PLC
    丙丁先生 2025-01-06 09:23 85浏览
  • 根据Global Info Research项目团队最新调研,预计2030年全球封闭式电机产值达到1425百万美元,2024-2030年期间年复合增长率CAGR为3.4%。 封闭式电机是一种电动机,其外壳设计为密闭结构,通常用于要求较高的防护等级的应用场合。封闭式电机可以有效防止外部灰尘、水分和其他污染物进入内部,从而保护电机的内部组件,延长其使用寿命。 环洋市场咨询机构出版的调研分析报告【全球封闭式电机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球封闭式电机总体规
    GIRtina 2025-01-06 11:10 104浏览
  • 大模型的赋能是指利用大型机器学习模型(如深度学习模型)来增强或改进各种应用和服务。这种技术在许多领域都显示出了巨大的潜力,包括但不限于以下几个方面: 1. 企业服务:大模型可以用于构建智能客服系统、知识库问答系统等,提升企业的服务质量和运营效率。 2. 教育服务:在教育领域,大模型被应用于个性化学习、智能辅导、作业批改等,帮助教师减轻工作负担,提高教学质量。 3. 工业智能化:大模型有助于解决工业领域的复杂性和不确定性问题,尽管在认知能力方面尚未完全具备专家级的复杂决策能力。 4. 消费
    丙丁先生 2025-01-07 09:25 80浏览
  • By Toradex 秦海1). 简介嵌入式平台设备基于Yocto Linux 在开发后期量产前期,为了安全以及提高启动速度等考虑,希望将 ARM 处理器平台的 Debug Console 输出关闭,本文就基于 NXP i.MX8MP ARM 处理器平台来演示相关流程。 本文所示例的平台来自于 Toradex Verdin i.MX8MP 嵌入式平台。  2. 准备a). Verdin i.MX8MP ARM核心版配合Dahlia载板并
    hai.qin_651820742 2025-01-07 14:52 44浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦