CPU/GPU 算力、功率的提升持续拉动散热相关需求,且有加速态势。根据 PassMark 评分数据,2001 年 2020 年,Intel/AMD 的 CPU 芯片单核/多核性能均持续提升。同时根据 Techspot 的相关研究,CPU 和 GPU 的算力(或处理能力)大部分由它们的晶体管密度决定,而每个晶体管都会在电流通过时产生热量,因此晶体管密度的提升带来了热量的提升;同时市场上大多数的 CPU都能以高于其基本频率的速度运行。
另一方面,由于 AI 算力需求的快速提升,相关 CPU/GPU 的功率提升也呈现加速态势。以 GPU 为例,主要用于游戏等领域的携带图像处理能力的 GPU,从 2004 年的 G70 至 2022 年的 AD102,18年期间功率提升近 5x 至约 450W;对比看用于 AI 领域的 V100/A100/H100,2017-2023 年每间隔 3 年功率提升 1.6x/1.75x 至 700W
芯片级散热材料与工艺的演变,风冷走向液冷。散热器最先以风冷方式出现,早期为一体成型的挤铝下压式散热器,铝材便宜易加工,但导热效率(237W/(M·K))只有铜的二分之一(401W/(M·K)),因此出现了塞铜式散热器。就散热器形态而言,早期为下压式散热器,更新的塔式散热器能够通过侧吹的方式提高散热效率。随 CPU 功率提高,散热器开始与热管、鳍片等器件搭配组成性能更高的散热模组,并且出现散热效率风高的水冷散热器。芯片类散热(包含 CPU/GPU)主要有风冷和水冷两种解决方案,相同规格功耗下,水冷散热能力更强,但价格昂贵,高端市场使用多。
下载链接:
《数据中心液冷技术合集(2023)》
1、电信运营商液冷技术白皮书(2023)
2、浸没式液冷数据中心运维白皮书
3、运营商力推液冷,中兴液冷技术领先(2023)
《2023年液冷技术白皮书汇总》
1、浸没式液冷数据中心热回收白皮书(2023) 2、数据中心绿色设计白皮书(2023)
《数据中心液冷技术合集》
1、集装箱冷板式液冷数据中心技术规范
2、浸没式液冷发展迅速,“巨芯冷却液”实现国产突破
3、两相浸没式液冷—系统制造的理想实践
4、AIGC加速芯片级液冷散热市场爆发
《液冷技术专题》
1、中国液冷数据中心发展白皮书
2、全浸没式液冷数据中心解决方案
3、浸没液冷数据中心规范
4、喷淋式直接液冷数据中心设计规范
5、单相浸没式直接液冷数据中心设计规范
《液冷服务器技术合集》
1、某液冷服务器性能测试台的液冷系统设计
2、浸没液冷服务器可靠性白皮书
3、天蝎5.0浸没式液冷整机柜技术规范
AI芯片、服务器、边缘域和Chiplet共舞(2023)
随 CPU 功率提高,散热器开始与热管、鳍片等器件搭配组成性能更高的散热模组,并且出现散热效率风高的水冷散热器。
风冷和水冷散热方式对比
芯片类散热(包含 CPU/GPU)主要有风冷和水冷两种解决方案,相同规格功耗下,水冷散热能力更强,但价格昂贵,高端市场使用多。
水冷散热器零部件及工作原理
水冷散热模组主要包含冷排、水管、风扇、冷头等零部件,分为一体式水冷与分体式水冷,二者工作原理相同,但零部件组装方式存在不同。以一体式水冷为例,冷头内部含有泵机,工作时冷头一面直接接触 CPU 表面,另一面采用CNC 工艺敲出的大量凹槽(微水道),冷水流经微水道被 CPU 产生的热量加热,经过泵机带动水流,流经水管进入冷排,冷排内部有很多水路,水路之间镶嵌有大量鳍片,热量传递给鳍片后经由冷排上方风扇散热,降温后的冷水再次回流,经水泵循环的冷液,带走冷头上从核心吸收的热量。冷排的尺寸很大地影响散热效率,目前市面常见尺寸有 120mm,240mm 和 360mm。
目前 CPU 冷头和显卡冷头主要都适用铜底导热,市面 CPU 水冷冷头设计主要有两种,一种是普通铜柱型,另一种是喷射式,喷射式冷头在铜柱基础上能够将水通过狭小的喷嘴快速喷射到不铜板底部,提升局部流速并且形成乱流,使水冷液的吸热效率大为提高,喷射式冷头水阻较大,对水泵扬程要求更高。显卡冷头分为单核心、半覆盖和全覆盖式冷头。
风冷散热模组零部件及工作原理
风冷散热模组的工作原理为,CPU/GPU 工作时产生的大量热量传递给散热器,导致散热器升温,在风扇作用下散热器与周围空气进行热传递,当散热器散发的热量与 CPU 最大功耗时产生的热量相等时,温度达到平衡稳定状态。风冷散热模组主要包含三个组成部分:
1)热管(Heat Pipes)或均热板(Vapor Chamber);2)散热鳍片(Fins);3)散热风扇或涡轮。
这三个部分之间常搭配导热材料和焊接等工艺加速热量传导。热管与鳍片的接触方式主要有两种,一种为“穿 Fin”,热管直接插入鳍片;另一种为金属焊接。热管与CPU/GPU 核心的接触方式主要有两种,一种是直触,直接把热管加工到大概形状后对底面进行打磨并贴在核心上,这种加工方法成本低,但容易发生形变,主要用于中低端;中高端采用铜底更多,加工中把热管穿插焊接在一个铜块内,或用带凹槽的铜块将热管夹在中间,热量先由铜底吸收再传递到热管上,这种方式使用寿命长、传热均匀,成本更高。
市场空间及主要公司
当前数字基础设施建设已经成为“十四五”时期及未来一个时期我国经济实现高质量发展的重要基础。2023 年初以来,以 OpenAI 公司 ChatGPT 为代表的生成式 AI 在引发市场广泛关注,AI 技术带来算力的大幅提升。根据《冷板式液冷服务器可靠性白皮书》,2022 年英特尔第四代服务器处理器单 CPU 功耗已突破 350 瓦,AI 行业头部企业的单 GPU 芯片功耗突破 700 瓦,高算力场景将对芯片散热带来巨大的挑战,热管理解决方案正迎来爆炸式需求。
据 Market Watch 统计,全球热管市场规模在 2022 年达到了30 亿美元,预计热管 2028 年市场规模将达到 46 亿美元,2022-2028 期间CAGR 为7.48%。
全 球 热 管 主 要 厂 商 有 FURUKAWA 、 Innergy tech 、 Advanced Cooling Technologies 、 Fujikura 、 Aavid Thermalloy 、 Asia VitalComponents 等。2022 年全球均热板市场规模大约为 46 亿元人民币,预计2029 年将达到 137 亿元,2023-2029 期间 CAGR 为 14.2%,均热板全球市场主要生产商主要 Auras、CCI、Jentech、Taisol 和 Fujikura 等,国内主要有中石科技与富信科技。
OrionX GPU AI算力资源池化技术白皮书
世界AI大会系列:数据为核,迈向多模态AI大模型时代
本号资料全部上传至知识星球,更多内容请登录智能计算芯知识(知识星球)星球下载全部资料。
免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。
温馨提示:
请搜索“AI_Architect”或“扫码”关注公众号实时掌握深度技术分享,点击“阅读原文”获取更多原创技术干货。