数据中心服务器浸没式液冷技术研究进展

数据中心用于收集、存储、处理和分发大量信息数据,可以为娱乐、商业等不同应用场景提供各种需求服务,已成为支撑现代经济社会发展的战略资源和新型基础设施。随着数据中心的快速发展,服务器单机柜功率密度的提高成为调和算力需求和数据中心承载能力的关键解决方案,随之带来的能耗问题愈发引起人们的关注。预计到2025年,数据中心耗电量将达到全球耗电总量的4.5%,基于市场对数据中心的巨大需求,这一数字预计将以每年12%的速度增长。在数据中心耗电总量中,有40%用于服务器冷却,服务器运行产生的热量可能导致服务器过热,威胁服务器的安全运行。实践表明,数据中心服务器温度每升高10℃,设备可靠性和寿命就会降低50%。浸没式液冷技术的兴起,使得电子元件能够维持相对恒定的工作温度,从而为高密度数据中心提供了一种新的解决方案。

1、浸没式液冷技术研究进展

1964年IBM公司研发出世界首款冷冻水冷却计算机System 360,液冷技术自此逐渐兴起。1966年,IBM的SEVGIN O首次提出进行液体电介质冷却“计算机”的研究,同时,IBM的CHU R C和SEELY J H于1968年获得了“模块化封装组件的浸入式冷却系统”的相关专利。随后,克雷超级电脑公司创始人CRAY S R获得了“浸入式冷却高密度电子组装”专利。20世纪80年代中期,IBM、霍尼韦尔、雷明顿兰德公司、日立等公司联合推出液冷超级计算机,液冷技术逐渐被关注。此外,SAYLOR J R在1955年使用液-液热交换器和单相浸没式冷却进行散热。2007年,普吉特系统公司已成功将传统矿物油用于冷却个人电脑,其使用的是名为“Crystal Plus”的白油,此白油无味、透明且性能稳定。2008年,IBM发布了液冷超级计算机power575。2010年,美国绿色革命冷却技术公司(GRC)建立了世界上第一个商用浸没式液冷数据中心。2012年,英特尔与美国绿色革命冷却技术公司(GRC)合作进行浸没式液冷技术试验,将服务器放入矿物油中,通过对比一年的测试数据可发现,相对于传统风冷技术,液冷技术可节能90%以上,从而使得整个数据中心节能10%~20%。2013年,GRC首创了承载浸没式冷却液的水平机架构造。2014年,全球最大的数据中心运营商之一谷歌于芬兰哈米纳建立了水冷数据中心,利用海水对服务器进行散热。2018年,Google发布TPU3.0 pod,庞大的算力消耗迫使其首次在数据中心采用液冷技术。

国内液冷技术相比于国外起步较晚。2011年,中科曙光率先对服务器液冷技术展开实验室研究,于2013年完成了首台冷板式液冷服务器原理机和首台浸没式液冷服务器原理机验证,2015年实现液冷服务器大规模商业应用项目落地。2016年以来,国内数据中心浸没式液冷技术的发展突飞猛进,中科曙光、阿里巴巴、华为、联想、浪潮等抓住液冷行业发展机遇,开启了浸没式液冷技术的相关研究工作。2017年,浪潮推出了以冷板服务器为核心的解决方案,同年,华为推出Fusion Server液冷解决方案,中科曙光也交付了中国首套商用相变浸没式液冷服务器——Liquidinside曙光液冷服务器。2018年,阿里巴巴在张北数据中心部署了浸没式冷却系统,同年联想也发布了“海神”液冷新技术。2019年中科曙光实现全球首个“刀片式浸没相变液冷技术”部署应用,其单机功率密度可达160kW,液冷部分电源利用效率(PUEPUE)低于1.1。2021年,阿里巴巴在对浸没式液冷服务器进行了2年的试运营后,发现相比于传统风冷服务器,液冷服务器各部件累计失效率可降低52.9%。

2、冷却液分类

目前,国际主流冷却液有两个发展方向,分别是碳氢及有机硅类冷却液(以俄罗斯为代表的矿物油冷却液和以日本为代表的硅油类冷却液)和碳氟类冷却液(以美国为代表)。

2.1 碳氢及有机硅类冷却液

碳氢及有机硅类冷却液在业内统称油类冷却液,其常温下澄清透明,呈黏稠状,密度一般比水低,不易挥发,对金属无腐蚀,毒性较低且价格远低于氟化液。碳氢类冷却液包含矿物油和合成油两种。天然矿物油从石油中提炼出来,在使用中难以避免烃类分子的分解氧化,造成酸性增强和污染物产生,影响冷却液特性甚至导致被冷却器件腐蚀。合成油是在人工合成的烷烃类或酯类化合物的基础上加入添加剂制成的,常见类型有聚α-烯烃(PAO)、煤制油(CTL)、天然气合成油(GTL)、合成酯等。合成油的生成工艺更加精细,杂质质量分数低、抗氧化性、材料兼容性与矿物油相比有较大改善,但是作为碳氢类通病闪点低的问题依然存在。有机硅油主要依赖人工合成,通过改性可以设计出高闪点的产品,但闪点越高黏度越高,可燃风险降低的同时导致了流动和散热困难,必须协调两者之间的关系。另外,硅油还可能发生水解和氧化沉积影响接触性能。在服务器液冷技术兴起前,油类冷却液常被用作变压器油,但是服务器冷却液和变压器油又有许多性能上的差异。比如两者绝缘性能要求不一样,变压器设备与变压器相比电压等级较高,可达到1100kV,服务器与变压器相比电压等级较低,往往只有380V。其次,变压器油使用前,经过真空脱气脱水,使用时是在完全密闭的装置中,这样足以降低油的老化速度,确保变压器能够正常运行30~40年;而服务器处于开放式环境中,因此要求冷却液有更高的长周期稳定性。除此之外,材料相容性方面,变压器内部材料简单,对其材料相容性考虑的较少,而服务器零部件复杂且较为精密,相容性是考虑的关键因素。环保性能方面,由于变压器设备在室外,远离居民区,对其健康、安全、环境(HSE)考虑的相对较少,而服务器要经常操作维护,对其HSE方面考虑的较多。

2.2 碳氟类冷却液

碳氟类冷却液是将碳氢化合物中的氢部分或全部取代为氟所得到的一类化合物,包含四种常见的类型,分别是氢氟饱和化合物(如氢氟烃、氢氟醚)、氢氟不饱和化合物(如氢氟烯烃、不饱和氢氟醚)、全氟饱和化合物(如全氟烷烃、全氟胺、全氟聚醚)以及全氟不饱和化合物(如全氟烯基醚、全氟烯烃、全氟烯基胺等)。由于C—F键的键能较大,因此碳氟类冷却液往往惰性较强,不易与服务器中电子器件发生反应;同时闪点较高,甚至无闪点,具有很好的防火作用。但是氟化液价格昂贵且全球变暖潜能值(GWP)较高,会造成温室效应,对环境造成一定的破坏。且氟化液最大的供应商是3M公司,目前占据全球供应链的80%。2022年4月1日,据Businesskorea报道,因为环保问题,3M公司在比利时的工厂涉及全氟烷基和多氟烷基物质(PFAS)的部分产品因当地环境法规收紧而无限期关闭。近期,欧洲联盟(简称欧盟)也宣布在2028年之前,数据中心全部禁用氟化液产品,美洲部分地区已经出台了相关规定,中国目前并没有制定相关政策,但从国际环保方面来看,未来氟化液发展会受到阻碍,油冷将会在未来浸没式液冷发展上占据主要地位。

3、冷却液关键性能

冷却液关键性能主要包括散热能力、可靠性、环保特性等,在冷却液配方设计过程中,必须着重研究每种性能的交互影响,以挑选最优配方。

3.1 散热能力

随着服务器单机柜功率密度的增加,大量数据和运算使得作为人工智能、大数据等新兴技术“大脑”的数据中心面临着前所未有的散热挑战。数据量的爆炸式增长对作为数据处理核心部件的服务器芯片的性能提出了更高的要求。服务器芯片温度过高会严重影响其性能和使用寿命。未来芯片热流密度将达到20.8W/cm²,服务器芯片工作温度每增加10℃,可靠性将下降50%。传统风冷技术散热能力有限,已经无法满足日益增长的散热需求。液冷所用冷却介质的比热容是空气的1000~3500倍,导热系数是空气的15~25倍,可实现较高的热流密度散热,其在吸收大量的热量后自身温度不会产生明显变化,故而能够稳定中央处理器(CPU)的温度,防止电子元件过热导致的性能下降、能量消耗增加、效率降低和永久性损坏。其次,冷却液传热效果也更好,是空气的25倍,同体积液体可带走的热量是空气的3000倍。液冷系统由于其高达100W/cm²的节能散热能力,在IT设备使用过程中变得尤为重要,展现出独特的技术优势,更好的传热特性使得其更具经济性。PIRES I A等人研究了以自然对流为机制的电子器件浸入绝缘油中的冷却机理,通过试验证明,油冷散热效果是自然空气对流散热的2.5倍。李斌等对3种不同类型冷却液(硅油、矿物油以及氟化液)进行了数值模拟计算,研究其对单相浸没液冷装置传热效果的影响,发现在相同的进口流速下,矿物油传热效果最差,基板温度达到77.7℃,而氟化液FC—3283传热效果最佳,相同条件下基板温度可至54.4℃。

3.2 材料可靠性

单相浸没式油冷服务器结构简单,易于制造,价格低廉,只使用一种冷却介质进行服务器冷却,可以保证服务器的洁净状况。在常规的风冷中,一些灰尘和污垢颗粒会进入服务器设备,在底盘内部积累,导致机械和电气故障。浸没式液冷技术可以最大限度地减少甚至消除许多常见的操作问题,如焊点故障、电触点氧化或腐蚀。同时,由于浸没式液冷没有风扇这些活动部件,对湿度或温度条件都不敏感,所以设备的运行费用极低。新加坡高温高湿地区的数据中心测试显示,浸没式液冷技术可提升服务器运行稳定性,同时可节省成本和空间。因此,浸没式液冷消除了湿度、振动、粉尘等因素对电子设备的破坏,理论上浸没冷却技术可以极大提升IT设备的可靠性。但是,传统机械硬盘(HDD)却无法直接在冷却液下工作,因为在液冷环境下,冷却液会通过呼吸孔流入机械硬盘内部而导致硬盘损坏,因此需借助镭射封装等技术将HDD密封在氦气环境下,而固态硬盘(SSD)大多不存在此方面问题,可以直接浸入冷却液中。

材料兼容性也是材料可靠性的一个重要方面。材料兼容性是指冷却液与服务器原件接触时,冷却液组分与服务器材料是否发生物理或化学反应,导致材料溶解、变形、褪色等现象产生,主要包括与服务器中的金属材料(电子系统中通用的铜、铝、不锈钢、银、锌、铸铁及相关合金)、无机非金属材料电子系统中使用的金属氧化物和陶瓷以及有机材料(包括系统密封材料、结构材料、黏接材料和添加剂)发生的反应。在材料兼容性方面,国内外目前并没有制定相应的标准,开放数据中心委员会(0DCC)在《浸没式冷却液可靠性规范》指出,针对目前的情况,材料兼容性测试多参考DL/T1836-2018《矿物绝缘油与变压器材料相容性测定方法》、GB/T14832-2008《标准弹性体材料与液压液体的相容性》等现有标准,采用浸泡法进行测试。

国内外学者对冷却液的材料兼容性也进行了大量相关试验。如SHZN J M等人对浸没于矿物油6个月服务器设备材料性能的变化进行相关试验研究,图1(a)为风冷服务器,图1(b)为油浸服务器。可以发现油浸服务器组件发生了明显的褪色,这种褪色对机械可靠性没有直接影响,但可能会影响部件的识别。通过对图1(a)风冷服务器和图1(b)油浸服务器获得的焊锡球微观结构进行比较,可以发现焊球没有明显的变形、尺寸变化或开裂,PCB-焊锡球和焊锡球-基体界面之间提供机械和电气连接的金属间化合物(IMC)层在风冷和油冷样品之间的厚度没有变化。

数据中心服务器浸没式液冷技术研究进展

图1 风冷服务器与油浸服务器组件比较

据调研,市场上一些公司,也在积极投身于材料相容性的研发。有公司选用不同材料,包括不同种类金属、橡胶材质,研究不同材料与气液(GTL)技术合成油冷却液的兼容性,通过研究发现,除用于泵的密封件弹性体三元乙丙胶(EPDM)外,其余测试材料均与GTL合成油冷却液具有较好的相容性。

3.3 环保性能

与风冷系统相比,液冷系统能节省约30%能源,可以将PUE从传统的风冷服务器机架的1.60左右降到1.05,实现绿色数据中心的要求。空气和液体冷却系统是数据中心服务器最常用的冷却系统,传统的风冷系统由于其高耗散率而无法进行有效的热管理,因此,高能耗和冷却能力不足是其主要缺点。此外,空气冷却需要使用风力强大的风扇或空调,需要在电子设备之间提供放置庞大散热器的空间,以达到空气流通的目的,从而增加了数据中心占地面积。而液冷系统取消了空调等耗电设施,直接将电子元件浸泡在冷却液中,进一步降低了能源消耗与投资成本。液冷系统下,数据中心机架的最大功率限制从20~30kW提高到100kW以上,单机柜功率密度得到了大幅度提升。CHY I Q等人将液冷系统与风冷系统对比,发现液冷系统下,设备使用功率可达到96kW,并且可节省约88%的冷却能源。噪声方面,传统风冷由于受其整体安装材料等基础设施的限制,在相同的散热水平下,产生的噪声比液冷低20~35dB,因此液冷被认为更环保。还有学者将冷却液吸收的热量进行再利用,以达到节能环保的目的,如HAYWOOD A M等人将数据中心刀片服务器封装在矿物油中,利用直接放置在CPU上方的流管捕获散失的热量,矿物油冷却液可以循环并输送到热交换器,为服务器提供冷却,并为Yazaki冷水机提供持续的热能。MARCINICHEN等人用某大型数据中心产生的60℃的废冷却废水预热电厂给水,使得附近175MW的燃煤电厂的热效率提高2.2%。

4、典型产品对比

目前,市场上碳氢及有机硅类冷却液产品理化性质差异较大,通过调研整理,将典型油类冷却液相关性能指标列于表1。
表1 典型油类冷却液性能比较

数据中心服务器浸没式液冷技术研究进展

浸没式冷却液S5 X是一种合成的单相浸入式冷却液,采用GTL技术生产。它对Asperitas的自然对流驱动浸没式冷却解决方案进行了优化,旨在通过其高冷却效率、出色的流动性能以及热力学特性来降低能源成本和排放。MIVOLT DFK是合成酯型冷却液,由于是酯类油,因此具有很高的闪点,使用安全性较强,但高闪点的同时也带来了高密度、高黏度等问题。EC—110冷却液是一种无毒、可生物降解的合成油,电阻率等级较高,从而确保了使用中的绝缘特性。对比合成油,矿物型SCL6冷却液具有高电阻率和高击穿电压,同时低黏度保证了其优异的散热能力和流动性。

5、前景展望

服务器浸没式冷却液市场近年来经历了快速增长阶段,未来也将保持增长趋势,推动力主要体现在以下方面。

  • 液冷技术能够支持更高密度的服务器配置,有助于提高数据中心的计算能力和效率。同时,随着计算任务的复杂性增加,对高密度服务器的需求不断增加,浸没式冷却液技术因其优越的散热性能而受到重视。除此之外,一些新兴市场,特别是亚太地区,正处于数字化转型和数据中心建设的快速增长时期,这些市场对高效能源散热技术的需求将为浸没式冷却液市场带来更多机遇。
  • 技术创新与发展促使液冷技术得以进步。新型服务器材料与冷却液的研发,使得服务器能够在更广泛的温度范围内运行,并提高了散热效率,不断的技术创新推动了浸没式液冷技术的发展。同时,厂商不断优化浸没式冷却液的散热系统,提高其性能和稳定性。这些技术改进有助于降低能耗、提高散热效率,并进一步推动了浸没式液冷技术的普及。
  • 能源效率和环保意识的强制性推动。面对全球节能减排要求的日益增加,国家对于PUE的规定愈发严格,数据中心和企业需寻求高效的能源解决方案来降低碳排放和能源成本,浸没式液冷技术因其高效的散热性能而成为节能减排的有力工具。随着数据中心和企业对环境保护的关注度提高,浸没式液冷技术的能源节约和碳减排优势更加受到重视,这将促使更多企业采用该技术以降低产品的碳足迹。
  • 数据中心行业发展也促使液冷市场逐步扩大。云计算和大数据等技术的普及推动了数据中心规模的扩大,这些数据中心需要高性能的服务器和散热技术,从而促进了浸没式液冷技术的应用增长。同时,边缘计算技术的兴起,将计算资源推向离用户更近的位置,边缘数据中心的建设增加了对高密度散热技术的需求,浸没式液冷技术因其适应高密度配置的优势而受益。
综上所述,预计未来几年服务器浸没式冷却液市场将继续保持增长态势。市场规模将逐步扩大,更多的数据中心和企业将采用这种高效散热技术来满足不断增长的服务器散热需求。同时,随着技术的进步和市场竞争的加剧,可能会出现更多创新的产品和解决方案,进一步推动浸没式液冷技术的普及和应用。然而,需要注意的是,市场发展仍受到成本、安全性等因素的影响,供应商需要综合考虑市场需求和技术发展,制定相应的竞争战略以确保市场份额和竞争优势。
版权声明:部分内容由互联网用户自行发布,该文仅代表作者本人观点。如有不适或侵权,请联系我们进行反馈,一经查实本站将予以删除。

给TA打赏
共{{data.count}}人
人已打赏
热管理技术

热设计为什么难搞?因为玄之又玄

2025-2-9 12:12:56

热管理技术

空间站里的高效散热技术-液态金属

2025-2-23 10:30:52

关注热管理网公众号-热管理材料 reguanlicom
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索