介绍
随着生命科学、金融服务、能源和医疗保健等行业利用 GPU 来获取更深入的见解并推动创新,空气冷却的极限正在迅速被触及。长期以来,空气冷却一直是行业内的默认标准,而随着 AI 和 HPC 工作负载的不断加速,芯片密度不断增加,这就需要更多的气流来将热量从芯片中带走,从而最大限度地发挥该技术的功能。
液体冷却可以更有效地散热,是数据中心运营商的理想选择,因为他们除了要应对不断增加的密度外,还要应对降低能耗、空间限制、用水限制和恶劣的 IT 环境的压力。是否部署液体冷却的问题正在迅速被何时部署和如何部署的问题所取代。
在本文中,我们将探讨在数据中心实施液体冷却时需要考虑的十件事。我们将比较和对比两种主要的液体冷却类型——直接芯片冷却和精密液体冷却。这些考虑因素将帮助您确定哪种冷却技术最能满足您的需求并最大限度地提高您的竞争优势。
主要内容
-
冷却性能: -
液体冷却比空气冷却提供更好的冷却效果。对于需要极高性能的 HPC 超级计算机集群,每一点性能提升都至关重要。 -
直接到芯片的冷却技术可以最大化 CPU 和 GPU 的性能。 -
精密液体冷却(Precision Liquid Cooling)能够显著提高热性能,比空气冷却解决方案高出 50% 以上。
-
-
数据中心效率: -
高级液体冷却解决方案可以达到 pPUE 1.03 或更低。 -
直接到芯片的冷却技术通过冷板将液体冷却剂直接送到芯片上,可以捕获约 80% 的热量,但仍需风扇辅助散热。 -
精密液体冷却通过密封的机箱和内部循环冷却液系统,可以捕获超过 95% 的热量。
-
-
空气冷却要求: -
空气冷却在未来一段时间内仍然是必要的,但其规模和效率会有所不同。 -
直接到芯片的冷却技术仍需风扇来处理剩余 20% 的热量。 -
精密液体冷却只需处理 5% 的辅助辐射热损失,不需要管理气流,节省了空间。
-
-
IT 级别的冷却功率: -
随着服务器功耗的增加,空气冷却风扇的能耗也会大幅增加。 -
精密液体冷却可以将风扇功耗从 20% 降低到 1%,从而释放更多电力用于其他设备或部署在边缘位置。
-
-
环境保护: -
数据中心需要应对各种恶劣的 IT 环境,如灰尘、气体和湿度。 -
液体冷却消除了许多这些环境问题。 -
精密液体冷却的密封机箱不受尘埃、气体和湿度的影响,保持了机箱内的清洁。
-
-
声学: -
数据中心通常非常嘈杂,高转速风扇和 HVAC 设备是主要噪音源。 -
液体冷却显著减少了噪音污染,精密液体冷却系统消除了服务器风扇的需求,并减少了所需的 HVAC 设备。 -
在噪声敏感的设施中,如医院,无风扇的密封服务器是理想选择。
-
-
水消耗: -
数据中心的水消耗受到越来越多的关注。 -
精密液体冷却可以显著减少甚至完全消除冷却系统中的水使用,使用干冷器可以在大多数气候条件下有效散热。
-
-
可靠性: -
液体冷却技术需要考虑故障域。 -
精密液体冷却的密封机箱和无害的介电冷却液提高了系统的可靠性和组件寿命。 -
直接到芯片的冷却技术存在泄漏风险,可能导致设备损坏。
-
-
服务和支持: -
液体冷却增加了服务和支持的复杂性,但并非不可克服。 -
精密液体冷却简化了维护,组件被少量介电冷却液覆盖,易于访问和更换。 -
无论是在集中式数据中心还是边缘位置,都可以实现一致的服务和支持模型。
-
-
位置灵活性:
-
液体冷却的无位置限制特性使其能够在各种数据中心环境中部署。 -
HPC 和 AI 应用推动了大量数据向边缘迁移,精密液体冷却可以在任何地点支持实时应用,并且由单一支持团队进行维护。 -
直接到芯片的冷却技术在边缘位置的服务性较差,存在组件暴露和水泄漏的风险。
结论
随着数据爆炸和计算密集型工作负载的增加,液体冷却成为高效且经济地应对热负荷的首选方案。正确实施液体冷却可以显著减少能源、水和空间的消耗,并大幅降低数据中心的设计、建设和运营成本。