产业丨发热激增遇挑战,AI+散热的技术与市场趋势

原创 AI芯天下 2023-08-10 20:31

·聚焦:人工智能、芯片等行业

欢迎各位客官关注、转发






前言

散热,这个过去不被人们重点关注的产业,正由于AI带来的数据量和计算量的爆发增长逐渐从幕后走向台前。


今明两年,AI行业中可能会出现算力被散热卡脖子的情况。



作者 | 方文三
图片来源 |  网 络 


散热行业都面临技术转型升级的痛点


电能转化为其他形式的能,会伴随做功的过程;而做功就会放热,过热就会把GPU烧坏。


此前一般都是采用风冷的方式降热,但风冷达到功率上限后性价比下降。


国内的数据中心的应用存在明确的要求:数据中心必须有液冷存在。


至少确定的是,液冷的渗透率会从目前的不到10%,攀升至2025年的20%。


考虑到[东数西算]的整体规划布局,未来新增机柜更多将在枢纽节点内,风冷方案在某些地区可能无法严格满足要求,液冷方案渗透率有望加速提升。


如果只是在散热工程技术上争取改善,在原有方案上做一些微调或优化,那么进步升级的速度会比较慢,提供的散热能力与高性能、高算力等需求之间的差距会越来越大。


只有通过一些创造性、颠覆性的散热技术,从根本上实现规模数量级或数倍的能力提升,才可能解决当前利用传统技术所面临的芯片性能散热供需差距不断扩大的问题。


由于AI算力需求的快速提升,相关CPU/GPU的功率提升呈现加速态势,需要更强大和更有效的冷却解决方案来保持设备的正常运行。



大厂率先推进散热技术

后摩尔定律时代AI芯片性能和功耗同步大幅提升,风冷芯片级散热功耗上限在800W左右,风冷达到功率上限后性价比下降。


作为当今世界上最先进的量产GPU,英伟达H100的功率高达700-800W。


这只是一颗GPU所需功率,已超过普通的一匹空调。



据台湾经济日报报道,英伟达、台积电正在与硬件厂商合作,推进散热技术。


据AI供应链消息称,热处理技术供应商高力正积极与台积电、英伟达开发AI GPU浸没式液冷系统。


随着算力的不断提升,则需要大大提高芯片性能来进行支撑,而这又带出另一大挑战,即芯片的热设计功耗(TDP)。


近日,中国台湾热处理技术供应商高力也被曝已确定取得台积电150台液冷式分配器订单,并正与台积电和英伟达开发AI GPU浸没式液冷系统。


英特尔也是浸没式液冷散热技术的支持者,在2022年时,英特尔就表示[浸没式液冷的时机已至]。



浸没式液冷技术将成为主流冷却技术

目前主流液冷散热方案第一种是借由水循环的方式,透过泵和管线进入机体带走热能。


另一种是浸没式技术,将热源(例如芯片)放置在不导电液体中,借此带走热能。


因此,为了提高单一机柜的功率密度,数据中心近些年开始普遍使用液冷方案。


其大致可以分为两种技术路径:冷板式(Cold Plate)与浸没式(Immersion)。


前者是通过冷板将发热器件的热量间接传递给封闭在循环管路中的冷却液体;


后者则直接将发热器件以及电路板整体直接置于液体中。


与空气介质相比,液体的导热率更高、比热容更大、吸热能力也更强。


另外在运营成本上,液冷散热也有较大的优势。


这项散热封装技术若再搭配具有三重液冷循环之服务器装置技术。


能够为数据中心省去所有的二级、三级散热系统。


只需将自我浸没式服务器插入机柜内,再接入水管及非导电冷却液管就可以直接使用。



从散热技术来说,目前散热模组是以含有热导管技术的主被动混合式散热技术为主。


目前散热模组分为[气冷散热]和[液冷散热]:


气冷散热就是用空气作为媒介,透过热接口材料、均热片(VC)或热导管等中间材料,由散热片或风扇与空气对流进行散热。


液冷散热则是透过,或浸没式散热,主要就是透过与液体热对流散热,进而使晶片降温,但是随着晶片发热量的增加与体积的缩小,芯片热设计功耗(TDP)的提高,气冷散热逐渐不敷使用。



散热市场向液冷+芯片级演进


芯片级散热系统核心为由热管、均热板构成的散热模组。


芯片散热模块原理即为将芯片热量通过热管、均热片等导热材料传导,沿着导热环节到达散热鳍片位置。


散热鳍片是纯铜制造,多褶结构,与空气接触面积大,传导至散热环节通过启动风扇进


行主动散热,风扇的转速会根据散热量的多少自动调节,从而完成导热至散热的环节。


当前冷板式液冷技术成熟度较高,在液冷技术路线中处于主流,假设当前占比为80%。


综合测算,AI 大模型训练+推理会带来40亿元的液冷市场空间。


随着模型参数增加、使用推广,未来四年带来液冷市场 60%+年复合增速。


根据测算,预计服务器散热模块规模至2026年能保持接近30%的复合增长。



液冷技术投资机会的三条主线


①华为电气-艾默生系的专业温控厂商:最早从事精密空调研发设计,具备多年的产业洞察,对技术研发具备前瞻性,且形成平台化的散热布局,赋能多行业应用;


②布局液冷技术的服务器厂商:冷却技术由房间级向行级甚至服务器内部芯片级延伸,能够参与液冷技术方案的服务器厂商,有望更快迎来算力升级的机遇,强化产品竞争力;


③提供包含芯片级散热的完整解决方案的供应商:芯片作为服务器核心热量源,随着芯片功率提升,散热方案向服务器内部芯片级升级。


结尾:


资本市场走俏背后,是散热技术愈发成为制约芯片等电子产品性能升级的阿喀琉斯之踵。


作为一个与计算机科学共同成长起来的产业,散热模组厂商们经历了多次电子信息革命,但当下AI的爆发,似乎才真正让这个行业真实现了[翻身]。


正因如此,业界需要将相关热管理、散热技术快速提升,才能满足芯片等电子信息产品的持续迭代升级。


部分资料参考:国金证券:《AI+散热,站在新风口》


本公众号所刊发稿件及图片来源于网络,仅用于交流使用,如有侵权请联系回复,我们收到信息后会在24小时内处理。



END


推荐阅读:


商务合作请加微信勾搭:

18948782064

请务必注明:

「姓名 + 公司 + 合作需求」


AI芯天下 聚焦人工智能,AI芯片,5G通讯等行业动态
评论
  • 食物浪费已成为全球亟待解决的严峻挑战,并对环境和经济造成了重大影响。最新统计数据显示,全球高达三分之一的粮食在生产过程中损失或被无谓浪费,这不仅导致了资源消耗,还加剧了温室气体排放,并带来了巨大经济损失。全球领先的光学解决方案供应商艾迈斯欧司朗(SIX:AMS)近日宣布,艾迈斯欧司朗基于AS7341多光谱传感器开发的创新应用来解决食物浪费这一全球性难题。其多光谱传感解决方案为农业与食品行业带来深远变革,该技术通过精确判定最佳收获时机,提升质量控制水平,并在整个供应链中有效减少浪费。 在2024
    艾迈斯欧司朗 2025-01-14 18:45 68浏览
  • 根据Global Info Research(环洋市场咨询)项目团队最新调研,预计2030年全球无人机电池和电源产值达到2834百万美元,2024-2030年期间年复合增长率CAGR为10.1%。 无人机电池是为无人机提供动力并使其飞行的关键。无人机使用的电池类型因无人机的大小和型号而异。一些常见的无人机电池类型包括锂聚合物(LiPo)电池、锂离子电池和镍氢(NiMH)电池。锂聚合物电池是最常用的无人机电池类型,因为其能量密度高、设计轻巧。这些电池以输出功率大、飞行时间长而著称。不过,它们需要
    GIRtina 2025-01-13 10:49 201浏览
  • 流量传感器是实现对燃气、废气、生活用水、污水、冷却液、石油等各种流体流量精准计量的关键手段。但随着工业自动化、数字化、智能化与低碳化进程的不断加速,采用传统机械式检测方式的流量传感器已不能满足当代流体计量行业对于测量精度、测量范围、使用寿命与维护成本等方面的精细需求。流量传感器的应用场景(部分)超声波流量传感器,是一种利用超声波技术测量流体流量的新型传感器,其主要通过发射超声波信号并接收反射回来的信号,根据超声波在流体中传播的时间、幅度或相位变化等参数,间接计算流体的流量,具有非侵入式测量、高精
    华普微HOPERF 2025-01-13 14:18 493浏览
  • 01. 什么是过程能力分析?过程能力研究利用生产过程中初始一批产品的数据,预测制造过程是否能够稳定地生产符合规格的产品。可以把它想象成一种预测。通过历史数据的分析,推断未来是否可以依赖该工艺持续生产高质量产品。客户可能会要求将过程能力研究作为生产件批准程序 (PPAP) 的一部分。这是为了确保制造过程能够持续稳定地生产合格的产品。02. 基本概念在定义制造过程时,目标是确保生产的零件符合上下规格限 (USL 和 LSL)。过程能力衡量制造过程能多大程度上稳定地生产符合规格的产品。核心概念很简单:
    优思学院 2025-01-12 15:43 530浏览
  • PNT、GNSS、GPS均是卫星定位和导航相关领域中的常见缩写词,他们经常会被用到,且在很多情况下会被等同使用或替换使用。我们会把定位导航功能测试叫做PNT性能测试,也会叫做GNSS性能测试。我们会把定位导航终端叫做GNSS模块,也会叫做GPS模块。但是实际上他们之间是有一些重要的区别。伴随着技术发展与越发深入,我们有必要对这三个词汇做以清晰的区分。一、什么是GPS?GPS是Global Positioning System(全球定位系统)的缩写,它是美国建立的全球卫星定位导航系统,是GNSS概
    德思特测试测量 2025-01-13 15:42 498浏览
  • 新年伊始,又到了对去年做总结,对今年做展望的时刻 不知道你在2024年初立的Flag都实现了吗? 2025年对自己又有什么新的期待呢? 2024年注定是不平凡的一年, 一年里我测评了50余块开发板, 写出了很多科普文章, 从一个小小的工作室成长为科工公司。 展望2025年, 中国香河英茂科工, 会继续深耕于,具身机器人、飞行器、物联网等方面的研发, 我觉得,要向未来学习未来, 未来是什么? 是掌握在孩子们生活中的发现,和精历, 把最好的技术带给孩子,
    丙丁先生 2025-01-11 11:35 463浏览
  • ARMv8-A是ARM公司为满足新需求而重新设计的一个架构,是近20年来ARM架构变动最大的一次。以下是对ARMv8-A的详细介绍: 1. 背景介绍    ARM公司最初并未涉足PC市场,其产品主要针对功耗敏感的移动设备。     随着技术的发展和市场需求的变化,ARM开始扩展到企业设备、服务器等领域,这要求其架构能够支持更大的内存和更复杂的计算任务。 2. 架构特点    ARMv8-A引入了Execution State(执行状
    丙丁先生 2025-01-12 10:30 471浏览
  • 数字隔离芯片是现代电气工程师在进行电路设计时所必须考虑的一种电子元件,主要用于保护低压控制电路中敏感电子设备的稳定运行与操作人员的人身安全。其不仅能隔离两个或多个高低压回路之间的电气联系,还能防止漏电流、共模噪声与浪涌等干扰信号的传播,有效增强电路间信号传输的抗干扰能力,同时提升电子系统的电磁兼容性与通信稳定性。容耦隔离芯片的典型应用原理图值得一提的是,在电子电路中引入隔离措施会带来传输延迟、功耗增加、成本增加与尺寸增加等问题,而数字隔离芯片的目标就是尽可能消除这些不利影响,同时满足安全法规的要
    华普微HOPERF 2025-01-15 09:48 83浏览
  •   在信号处理过程中,由于信号的时域截断会导致频谱扩展泄露现象。那么导致频谱泄露发生的根本原因是什么?又该采取什么样的改善方法。本文以ADC性能指标的测试场景为例,探讨了对ADC的输出结果进行非周期截断所带来的影响及问题总结。 两个点   为了更好的分析或处理信号,实际应用时需要从频域而非时域的角度观察原信号。但物理意义上只能直接获取信号的时域信息,为了得到信号的频域信息需要利用傅里叶变换这个工具计算出原信号的频谱函数。但对于计算机来说实现这种计算需要面对两个问题: 1.
    TIAN301 2025-01-14 14:15 113浏览
  • 随着数字化的不断推进,LED显示屏行业对4K、8K等超高清画质的需求日益提升。与此同时,Mini及Micro LED技术的日益成熟,推动了间距小于1.2 Pitch的Mini、Micro LED显示屏的快速发展。这类显示屏不仅画质卓越,而且尺寸适中,通常在110至1000英寸之间,非常适合应用于电影院、监控中心、大型会议、以及电影拍摄等多种室内场景。鉴于室内LED显示屏与用户距离较近,因此对于噪音控制、体积小型化、冗余备份能力及电气安全性的要求尤为严格。为满足这一市场需求,开关电源技术推出了专为
    晶台光耦 2025-01-13 10:42 510浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦