数据中心液冷技术发展分析

智能计算芯世界 2022-04-04 00:00



摘要:随着我国信息产业的飞速发展,数据中心总体需求不断提升,单机柜功率密度不断提高,传统的散热方式已不能满足当前高密度数据中心的发展需求。液冷技术的出现,改善了传统的散热形式,并凭借高可靠、低能耗等优势,逐步被应用于数据中心。文章主要对浸没式、冷板式、喷淋式 3 种液冷技术进行分析,并对种液冷技术的特点进行对比,归纳种技术的不同特性。分析液冷系统、应用以及行业发展,为后续建设绿色高效的数据中心提供参考。


关键词:液冷;浸没式;冷板式;喷淋式;数据中心


来源:电力信息与通信技术,中国知网 

作者:王艳松,张琦,孙聪,庄泽岩,黄子轩,翟天一


01引言


数据中心在信息社会和数字经济发展中扮演着重要的角色,提供计算、存储、网络能力,支撑社交、视频、网购等应用的正常进行。随着云计算、大数据、人工智能等技术的发展和应用,数据中心规模不断扩大,数据中心总体耗能总量不断增加。如图所示,数据中心能耗结构中冷却系统能耗占据高达40%,成为数据中心进行能效优化的重要因素。


随着国家对新基建的重视,数据中心迎来新的发展浪潮,伴随着数字化社会的发展,数据中心也将会承担越来越重要的角色,推动数据处理、存储、传输等相关设备的建设与发展。


图1 数据中心能耗结构图


作为各类数据信息的关键基础设施,数据中心的规模不断提升,规模的年增长率保持在 30% 左右,截止到2020 年底,数据中心机架总量已经超过400 万架。数据中心利用率是数据中心算力的主要表现形式。2019 年底,我国大型、超大型、中小型的数据中心利用率均达到45% 以上。当前,数据中心能效水平不断攀升,加快了可再生能源的利用效率。当前,我国数据中心的电源利用效率(Power Usage EffectivenessPUE)水平较低,大型、超大型数据中心平均PUE 均达到1.5 以下,在绿色低碳数中心建设方面取得了突出的成果。同时,我国可再生能源利用率不断攀升,到2020 年底,可再生能源发电量超过22000 亿kW,增长率达8.4%。蚂蚁集团、阿里巴巴等领先数据中心企业设计实施了可再生能源利用、绿色技术研发等绿色低碳数据中心策略。


数据中心一方面作为各类数据信息的核心基础设施,另一方面又与传统行业融合发展、紧密相连,特别是与电力系统领域更加密不可分。数据中心机房作为现代信息建设的基础工程,能够提供稳定的运行环境。而电力系统作为数据中心的重要组成部分,占据整个数据中心资产的 50% 以上,是数据中心的主要支撑。近年来,随着我国电力行业信息化程度逐步提高,能源互联网建设进程不断增加,电力行业先后提出云大物移、智慧能源等建设目标,深入应用大数据、人工智能、区块链等技术,加速推进能源革命与数字革命融合发展。当前,智能电网和互联网技术不断创新,以数据赋能电力系统,用价格信号引导电力用户改变自身的用电行为,从需求侧增加电力系统运行的敏捷性,丰富电网的运行调节手段,有效促进我国电能量市场的高速发展。同时,国家电网有限公司结合供配电资源优势,提出将变电站、数据中心站等多站进行融合的建设目标,利用现有资源,实现数量多、分布广的部署特点,为社会提供多种类型的服务。我国电力行业大型数据中心以支撑自身业务为主,并不断以绿色化、智能化、定制化为方式,推动数据中心建设。


数据中心作为集中放置电子信息设备,提供运行环境的建筑场所,是电力系统领域中的重要基础设施。数据中心大多建立在环境周边清洁、水源充足、远离自然灾害隐患、环境温度利于节约能源的地区,不但能够确保数据中心建设的安全性,而且对降低数据中心在建设过程中的能源消耗、节省数据中心的建设成本有一定的优势,如张北云联数据中心通过全自动化楼宇设备自控(Building Automation System-RTUBA)系统,利用周边环境温度低的优势,实现自然冷源利用率的最大化,使年均PUE 1.23。另外,电力对于数据中心基础建设是数据中心运营的重要保障,电价成本的高低对数据中心的建设和运营均具有较大的影响。数据中心全天处于运行状态,不但需要充足的电力供给保障服务器、IT设备的正常运行,而且还需要长期运行机房的散热设备对机房进行降温处理。因此,电费支出成为数据中心运营支出的主要部分,使华为、阿里巴巴、腾讯、今日头条、百度等科技巨头对数据中心的布局逐渐向河北、内蒙古、贵州等一线周边城市扩散。如位于乌兰察布市察哈尔经济技术开发区的乌兰察布华为云数据中心,利用电力气候等独特优势采取多种措施实现绿色、高质量、低成本的运营模式,达到全年PUE 小于1.15,成为业界最佳水平。阿里巴巴公司利用贵州水电充足、电价成本偏低的优势,将数据中心设立在贵州,实现了建设高等级、低成本的数据中心。


随着新基建战略的不断推进,数据中心逐渐成为各行各业不可或缺的纽带,同时,其自身的能耗问题也备受关注。由于冷却系统耗能占比高、可优化空间大,当前通过改善数据中心的制冷方式,进而降低数据中心能耗,已经成为推进我国数据中心高质量发展的必要措施之一。液冷技术是数据中心制冷革新的关键技术之一,可以较好地提高数据中心的能效水平。


在发展方面,液冷技术在航天等领域内具有很长的应用历史,而在数据中心行业中发展较为缓慢。文献[9]提出了液冷结合风冷技术的双通道系统,且测试实验PUE 结果达1.1 1.2 之间;文献基于多个城市的液冷散热样本数据进行分析,构建了不同城市数据中心制冷散热系统的能耗计算模型,有效降低了数据中心系统的能耗值。文献结合数据中心节能分析基础上,采用热回收技术,在降低数据中心能耗的同时,提升热回收效益。在国外,也有大量的研究人员对降低数据中心的损耗进行大量的研究,产生了较多的应用案例,如IBM 公司的SuperMUC 充分应用液冷技术的制冷优势,大幅度降低了数据中心的损耗率。


针对数据中心液冷技术在不同行业的技术应用发展,本文主要从浸没式、冷板式、喷淋式 3 种液冷技术的发展进行分析,并将种液冷技术的特点进行系统的对比,总结出液冷技术的不同特点以及适用应用场景类型,为数据中心液冷技术的场景应用及技术发展提供参考。


01液冷技术分析


液冷技术是电子设备进行散热的技术,主要区别于目前常用的风冷技术。当前液冷技术包括浸没式、冷板式、喷淋式等类型,本节主要介绍上述 3 种液冷技术的系统组成和运行过程,并对种液冷技术进行对比。


1.1 浸没式液冷技术


浸没式液冷技术通过浸没发热器件,使得器件与液体直接接触,进而进行热交换。根据介质是否存在相变化分为单相浸没和相变浸没 2 种类型。本文主要以相变浸没液冷技术为研究对象,分析其降低数据中心能耗工作原理。


浸没式液冷技术主要由冷却液、腔体结构、换热模块及相关的连接管道等设施构成。其中,冷却液为数据中心的换热介质,具有高绝缘、低黏度以及超强的兼容特性,是浸没式液冷技术的主要媒介。主板芯片等发热器件表面的散热性能在很大程度上影响介质沸腾的换热强度,若芯片表面光滑,则液体在换热面上的传热系数较高,从而提高热量的散发速率。市场上常采用安装散热罩的方式,增大芯片的散热面积,从而提高数据中心的散热性能,降低损耗率。冷却模块是浸没式液冷技术的主要散热模块,包含液气换热器、循环泵等多个配件设施。冷却模块的部署方式可以影响冷却液的冷凝换热效率,改变浸没式系统的冷却极限,从而降低数据中心的散热效率,其模块大多适用于高性能、高热流的计算场景,如中科曙光 E 级超算设备,完全摆脱风冷散热的制约,去除风冷式散热器,配置512 个计算节点,系统峰值功耗为249 kWPUE 1.04,有效解决高密度计算产生的制冷散热问题。网速科技是最早布局液冷数据中心产品线的企业,通过浸没式液冷的散热方式,将散热能耗降低90%~95%、设备能耗降低10%~20%,有效降低数据中心的总体能耗占比。


1.2 冷板式液冷分析


冷板式液冷系统主要由换热冷板、热交换单元和循环管路、冷源等部件构成。冷板式液冷将热量传递给循环管道中的冷却液体,通过液体本身的制冷特性将服务器产生的热量带走,提高冷板的冷却效率,大幅度降低数据中心的能耗。


换热冷板通过空气、水或其他冷却介质在通道中的强迫对流,带走服务器中的耗热能量,可有效降低数据中心的 PUE 值。冷板材质一般由高导热系数的材料构成,使得冷板表面接近等温,带走大量的集中热量。并且冷板的应用减少冷却介质对电子元器件的污染,提高数据中心设施的使用寿命。冷量分配单元主要为竖直和水平种形式,通过竖直和水平分液单元将低温冷却液均匀的分配给每一个分液单元,防止芯片热量无法有效散出,减少因节点温度升高而发生的隐患,提高系统的计算能力。循环管路是连接换热冷板、热交换单元以及其他相关器件的重要部件,一般分为直连式和环路式种类型,大多根据数据中心建设的不同需求,选择合适的管路进行连接。冷源作为带走数据中心产生热量的最终出口,是冷却系统的主要组成部分。大多采用室外冷却设备提供的低温冷却水在热交换单元中充当冷源。冷源与升温后的冷却液进行间接接触,通过带走冷却液的热量进行降温,使冷却液以低温状态进入芯片模块,进而进入散热循环。因此,冷源的选择合理与否,将会直接影响整个系统的使用效率及运行的经济性问题,如阿里巴巴千岛湖数据中心利用周边环境的自然资源,采用湖水自然冷却系统等技术,使PUE 1.28,有效节省数据中心的建设成本。


1.3 喷淋式液冷分析


喷淋式液冷一般不需要对数据中心的基础设施进行大幅度地改动,只需在喷淋模块调整喷淋头,实现喷淋设备与服务器的精准对应。与传统风冷服务器相比,其可以有效降低器件所产生的热量,从而控制数据中心运行的温度。喷淋式液冷服务器是整个喷淋系统的主要内部器件,凭借其高性能、低能耗、高可靠运行的特点,可以有效降低数据中心能耗。当前,先进的喷淋式液冷服务器大多采用芯片级喷淋液冷技术,通过冷却液带走部件产生的热量,冷却液的温度提升后,随即进入冷却系统的换热装置进行换热。


1.4 液冷技术对比


对冷板式、浸没式、喷淋式液冷技术进行比对,具体情况如表 1 所示。由表可以看出,冷板式液冷技术在可维护性、空间利用率、兼容性方面具有较强的应用优势;但在成本方面,由于其单独定制冷板装置的原因,导致技术应用的成本相对较高。而喷淋式液冷技术则通过改造旧式的服务器和机柜的形式,大幅度减少了数据中心基础设施的建设成本。浸没式技术与其他种技术相比,虽然器件的可维护性和兼容性较差,但空间利用率与可循环方面具有较好的表现,降低数据中心的能耗。


 表1 冷板式、浸没式、喷淋式液冷技术比较 


02液冷产业发展分析


2.1 行业应用现状分析


 1 节中液冷技术在数据中心行业已经有一些具体的应用案例。冷板式液冷是应用最早的液冷技术,在数据中心、高性能计算等行业均有应用;浸没式液冷技术具有节能性、高性能的特点,在计算机超算领域具有广阔的应用前景;喷淋式液冷目前公开的应用较少,但近年来应用也逐步加快。本节将结合液冷技术的类型特点,通过不同的应用案例分析浸没式、冷板式、喷淋式的应用技术。


1)浸没式液冷技术。目前,高性能计算是进行科学计算、推动信息社会发展的重要方式。以中科曙光为例,其一直致力于大型超算系统的研发,而高效制冷技术是降低高密度IT 设备的主要形式,经过相关研发和测试,曙光级超算系统已经利用浸没式液体相变的冷却方式,有效降低液冷系统的冷却极限。同时,其采用立体扩展的多层机房模式,完成系统的高效集成。除中科曙光外,北京服务于云渲染的数据中心,通过浸没式液冷技术改变传统的风冷技术,去除制冷主机和末端空调风机,降低数据中心基本设施的电能损耗,提高数据中心的运行效率。


2)冷板式液冷技术。当前,冷板式液冷技术的应用也具有较多的案例,如北京水冷超算中心采用常温水冷技术,解决数据中心的内存散热问题,从而降低数据中心的能耗,使该数据中心达到国内领先的节能水平,成为业界的标杆;百度阳泉数据中心也采用冷板式液冷技术,通过利用系统循环泵驱动温水技术带走升温的芯片热量,进而降低数据中心的能耗。华为研发的冷板式液冷技术也已经开始推广应用,并在PUE 方面取得较好的效果。


3)喷淋式液冷技术。喷淋式液冷技术的理论基础研究相对较少,技术的应用场景也比较有限。因此,只有少量数据中心基础设备采用喷淋式液冷技术,如上海大数据试验场,一方面其采用模块化的集装箱式技术,降低了建设数据中心的应用成本;另一方面,其结合喷淋液冷技术,实现284 kW IT 负载,并将IT 设备的PUE 控制在稳定的范围内,提高数据中心的能效。


2.2 行业应用问题分析


液冷技术在数据中心行业的散热方面具有显著的优势,但在数据中心行业大规模应用,仍需提高技术的创新性和适用性,需要解决以下行业发展问题。


1)液冷适用性。每一种新兴技术的应用,都需要厂商进行长期的实验,才能保证技术稳定性。并且在大批量应用之前需进行小规模的定点实验,提高液冷的实用性。当前,液冷技术应当进一步加强小规模的定点实验,并努力批量应用于数据中心行业中。


2)液冷架构重构性。液冷方式的部署环境与传统的机房有较大的差异,而且部署架构也需要重新构建。因此,采用液冷技术不但面临高额的部署费用,而且也增加运维人员的时间成本,大幅度升高了数据中心的运维成本,因此,需要进一步在架构、运维等方面进行优化。


3)液冷设计规范性。液冷在数据中心的建设和测试过程中缺乏成熟的行业规范,大部分企业均根据自身的需求特点进行研发,未达成业界的统一标准。若未进行标准化统一管理,会导致液冷技术不规范发展,一旦产生破坏性故障,会彻底打击液冷技术的发展。同时,非标产品也不利于成本和应用,因此必须加快标准化进程。


2.3 行业发展建议


液冷技术在数据中心行业的应用中,需要逐步成熟的发展过程,必须依托厂商、用户及行业组织的推进,才能在未来的发展中获得大幅度提升,具体建议如下。


1)完善液冷技术材料的通用性,降低建设成本。如冷板式液冷技术中,冷板的要求规格较多,导致冷板式技术的成本较高。若对液冷应用的原材料和配件进行深入研究,降低制造液冷原材料和配件的成本,将会大幅度提升液冷数据中心的发展速度。


2)提高液冷技术的运维效率。液冷技术的运维与传统风冷技术的运维方式相差较大,从而加剧运维人员的工作成本。因此,需要生产配件的各个厂商及设备商提供安装、调试和运维的规范说明。通过标准化的流程,不但保障其应用的稳定性,而且大幅度提升运维人员的工作效率。


3)加强液冷技术验证力度,确保技术可靠运行。液冷技术的可靠性实施,需要依托于设备商、服务商、用户等企业。从节能性、可靠性和适用性等方面,推进液冷技术示范试点的运行,并在加强验证的基础上,在数据中心行业进行大批量的推广。


03结语


我国数据中心飞速发展的同时,数据中心能耗也逐渐增加,对企业发展和社会能源,均带来了巨大挑战。在数据中心的基础设施建设中,液冷技术虽不是一个全新的概念,但仍存在液冷适用性、架构重构性以及设计规范性等多方面问题。针对液冷技术,本文从技术和行业发展 2 个方面进行分析,并提出液冷技术的发展优势,为未来数据中心行业的发展提供理论参考。


下一阶段仍需高度关注液冷技术和数据中心行业的变革,为推动液冷技术的应用以及实现高效能数据中心建设奠定基础。

 




免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。



电子书<服务器基础知识全解(终极版)>更新完毕。

获取方式:点击“阅读原文”即可查看182页 PPT可编辑版本和PDF阅读版本详情。



温馨提示:

请搜索“AI_Architect”或“扫码”关注公众号实时掌握深度技术分享,点击“阅读原文”获取更多原创技术干货。


智能计算芯世界 聚焦人工智能、芯片设计、异构计算、高性能计算等领域专业知识分享.
评论 (0)
  • 引言在语音芯片设计中,输出电路的设计直接影响音频质量与系统稳定性。WT588系列语音芯片(如WT588F02B、WT588F02A/04A/08A等),因其高集成度与灵活性被广泛应用于智能设备。然而,不同型号在硬件设计上存在关键差异,尤其是DAC加功放输出电路的配置要求。本文将从硬件架构、电路设计要点及选型建议三方面,解析WT588F02B与F02A/04A/08A的核心区别,帮助开发者高效完成产品设计。一、核心硬件差异对比WT588F02B与F02A/04A/08A系列芯片均支持PWM直推喇叭
    广州唯创电子 2025-04-01 08:53 108浏览
  • 在环保与经济挑战交织的当下,企业如何在提升绩效的同时,也为地球尽一份力?普渡大学理工学院教授 查德·劳克斯(Chad Laux),和来自 Maryville 大学、俄亥俄州立大学及 Trine 大学的三位学者,联合撰写了《精益可持续性:迈向循环经济之路(Lean Sustainability: Creating a Sustainable Future through Lean Thinking)》一书,为这一问题提供了深刻的答案。这本书也荣获了 国际精益六西格玛研究所(IL
    优思学院 2025-03-31 11:15 69浏览
  • REACH和RoHS欧盟两项重要的环保法规有什么区别?适用范围有哪些?如何办理?REACH和RoHS是欧盟两项重要的环保法规,主要区别如下:一、核心定义与目标RoHS全称为《关于限制在电子电器设备中使用某些有害成分的指令》,旨在限制电子电器产品中的铅(Pb)、汞(Hg)、镉(Cd)、六价铬(Cr6+)、多溴联苯(PBBs)和多溴二苯醚(PBDEs)共6种物质,通过限制特定材料使用保障健康和环境安全REACH全称为《化学品的注册、评估、授权和限制》,覆盖欧盟市场所有化学品(食品和药品除外),通过登
    张工13144450251 2025-03-31 21:18 65浏览
  • 据先科电子官方信息,其产品包装标签将于2024年5月1日进行全面升级。作为电子元器件行业资讯平台,大鱼芯城为您梳理本次变更的核心内容及影响:一、标签变更核心要点标签整合与环保优化变更前:卷盘、内盒及外箱需分别粘贴2张标签(含独立环保标识)。变更后:环保标识(RoHS/HAF/PbF)整合至单张标签,减少重复贴标流程。标签尺寸调整卷盘/内盒标签:尺寸由5030mm升级至**8040mm**,信息展示更清晰。外箱标签:尺寸统一为8040mm(原7040mm),提升一致性。关键信息新增新增LOT批次编
    大鱼芯城 2025-04-01 15:02 100浏览
  • 在不久前发布的《技术实战 | OK3588-C开发板上部署DeepSeek-R1大模型的完整指南》一文中,小编为大家介绍了DeepSeek-R1在飞凌嵌入式OK3588-C开发板上的移植部署、效果展示以及性能评测,本篇文章不仅将继续为大家带来关于DeepSeek-R1的干货知识,还会深入探讨多种平台的移植方式,并介绍更为丰富的交互方式,帮助大家更好地应用大语言模型。1、移植过程1.1 使用RKLLM-Toolkit部署至NPURKLLM-Toolkit是瑞芯微为大语言模型(LLM)专门开发的转换
    飞凌嵌入式 2025-03-31 11:22 176浏览
  • 提到“质量”这两个字,我们不会忘记那些奠定基础的大师们:休哈特、戴明、朱兰、克劳士比、费根堡姆、石川馨、田口玄一……正是他们的思想和实践,构筑了现代质量管理的核心体系,也深远影响了无数企业和管理者。今天,就让我们一同致敬这些质量管理的先驱!(最近流行『吉卜力风格』AI插图,我们也来玩玩用『吉卜力风格』重绘质量大师画象)1. 休哈特:统计质量控制的奠基者沃尔特·A·休哈特,美国工程师、统计学家,被誉为“统计质量控制之父”。1924年,他提出世界上第一张控制图,并于1931年出版《产品制造质量的经济
    优思学院 2025-04-01 14:02 75浏览
  • 引言随着物联网和智能设备的快速发展,语音交互技术逐渐成为提升用户体验的核心功能之一。在此背景下,WT588E02B-8S语音芯片,凭借其创新的远程更新(OTA)功能、灵活定制能力及高集成度设计,成为智能设备语音方案的优选。本文将从技术特性、远程更新机制及典型应用场景三方面,解析该芯片的技术优势与实际应用价值。一、WT588E02B-8S语音芯片的核心技术特性高性能硬件架构WT588E02B-8S采用16位DSP内核,内部振荡频率达32MHz,支持16位PWM/DAC输出,可直接驱动8Ω/0.5W
    广州唯创电子 2025-04-01 08:38 105浏览
  • 北京贞光科技有限公司作为紫光同芯产品的官方代理商,为客户提供车规安全芯片的硬件、软件SDK销售及专业技术服务,并且可以安排技术人员现场支持客户的选型和定制需求。在全球汽车电子市场竞争日益激烈的背景下,中国芯片厂商正通过与国际领先企业的深度合作,加速融入全球技术生态体系。近日,紫光同芯与德国HighTec达成的战略合作标志着国产高端车规芯片在国际化道路上迈出了关键一步,为中国汽车电子产业的发展注入了新的活力。全栈技术融合:打造国际化开发平台紫光同芯与HighTec共同宣布,HighTec汽车级编译
    贞光科技 2025-03-31 14:44 83浏览
  • 升职这件事,说到底不是单纯靠“干得多”或者“喊得响”。你可能也看过不少人,能力一般,甚至没你努力,却升得飞快;而你,日复一日地拼命干活,升职这两个字却始终离你有点远。这种“不公平”的感觉,其实在很多职场人心里都曾经出现过。但你有没有想过,问题可能就藏在一些你“没当回事”的小细节里?今天,我们就来聊聊你升职总是比别人慢,可能是因为这三个被你忽略的小细节。第一:你做得多,但说得少你可能是那种“默默付出型”的员工。项目来了接着干,困难来了顶上去,别人不愿意做的事情你都做了。但问题是,这些事情你做了,却
    优思学院 2025-03-31 14:58 76浏览
  • 一、温度计不准的原因温度计不准可能由多种原因导致,如温度计本身的质量问题、使用环境的变化、长时间未进行校准等。为了确保温度计的准确性,需要定期进行校准。二、校准前准备工作在进行温度计校准之前,需要做好以下准备工作:1. 选择合适的校准方法和设备,根据温度计的型号和使用需求来确定。2. 确保校准环境稳定,避免外部因素对校准结果产生影响。3. 熟悉温度计的使用说明书和校准流程,以便正确操作。三、温度计校准方法温度计校准方法一般分为以下几步:1. 将温度计放置在
    锦正茂科技 2025-03-31 10:27 54浏览
  •        在“软件定义汽车”的时代浪潮下,车载软件的重要性日益凸显,软件在整车成本中的比重逐步攀升,已成为汽车智能化、网联化、电动化发展的核心驱动力。车载软件的质量直接关系到车辆的安全性、可靠性以及用户体验,因此,构建一套科学、严谨、高效的车载软件研发流程,确保软件质量的稳定性和可控性,已成为行业共识和迫切需求。       作为汽车电子系统领域的杰出企业,经纬恒润深刻理解车载软件研发的复杂性和挑战性,致力于为O
    经纬恒润 2025-03-31 16:48 54浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦