EN
【原创研究】算力激增,液冷护航
来源: 高级合伙人 汪睿日期:2024-03-08浏览量:1094

在当今数字化与智能化高速发展的时代背景下,全球算力需求呈指数级增长,尤其是由OpenAI发布的ChatGPT等革命性人工智能模型引领的全新算力浪潮,极大地刺激了高性能计算领域对高效、可靠散热解决方案的需求。随着数据中心规模的不断扩大和服务器性能的不断提升,传统风冷散热方式已无法满足日益严苛的高效能、低能耗和绿色低碳运行要求。液冷技术,作为一种更先进的散热策略,凭借其卓越的散热效能、优异的能效比以及环保属性,正迅速成为高性能计算领域散热解决方案的必然选择,它不仅是应对算力倍增时代挑战的有效途径,更是推动数据中心行业转型升级、迈向可持续发展道路的关键驱动力。

液冷技术正成为高性能计算领域散热解决方案的必然趋势

随着信息化社会的飞速发展,大数据、云计算、人工智能等尖端科技领域的强势推进,尤其是在2022年末OPENAI发布CHATGPT所带来的新一轮算力需求热潮,全球对于计算能力的需求正以前所未有的速度飙升。算力成为了衡量国家科技硬实力与数字经济竞争力的核心要素,其提升不仅加快科研创新的步伐,更深刻影响着各个行业乃至国家安全的基础保障。然而,伴随算力需求的激增,服务器性能随之持续提升,特别是CPU和GPU等关键部件的热功耗密度不断提高,硬件设施尤其是数据中心和高性能计算设备面临的散热问题愈发严峻,传统风冷散热方式在面对现代超级计算机和大型数据中心对高效、稳定、低碳运行环境的高标准要求时,显得捉襟见肘。
在此背景下,“液冷技术”犹如破冰之舟,凭借其卓越的散热性能、高效能效比和环保特性,日益凸显出解决算力跃升时代散热难题的重要性。统计数据揭示,数据中心的能耗中有相当比例被用于冷却系统,而液冷技术的引入,则能在大幅提升散热效率的同时,显著降低能耗,提高PUE(电源使用效率),进而减轻噪音污染,优化工作环境,真正意义上为算力倍增时代保驾护航。由此,液冷技术在全球范围内迎来了广泛应用的新高潮,成为高性能计算领域散热解决方案的必然趋势。
近日英伟达的行动有力印证了这种趋势。其宣布:自B100 GPU起,所有后续产品线将逐步摒弃传统的风冷散热方式,全面采用液冷技术作为标准散热解决方案。黄仁勋先生并在公开场合强调,浸没式液冷技术将是定义未来散热领域的重要标杆,他认为这种技术不仅将引发散热市场的深度变革,而且还将引领整个行业向更高能效、更低噪音和更紧凑设计的方向迈进。
 需求、政策、成本优势推动液冷市场迅速扩张

2.1 算力需求指数级提升,带动芯片、服务器、数据中心升级
随着AI模型技术的演进升级,特别是那些具有庞大参数集合和高度复杂的代表性模型如ChatGPT、GPT-4等,在AIGC世界中引领了一场深刻的变革,极大提升了整个行业的发展水平。与此同时,这种革新也引发了对算力资源的强烈需求膨胀。
海量复杂数据处理需求对于算力提出了更高的要求,需要更强大、更高效的计算资源来支持人工智能应用的发展。在此趋势下,算力基础设施加快建设,成为支撑数字经济发展的“重要底座”,数据能力和算力需求循环增强。IDC预测,中国智能算力规模将持续高速增长,预计2027年将达到1117.4EFLOPS,2022-2027年CAGR达33.9%。

算力的需求也显著提高了芯片算力密度和服务器的功耗,根据ODCC(开放数据中心委员会)《冷板式液冷服务器可靠性白皮书》预测,未来15-20kw机柜成为主流,AI集群算力密度普遍达到50kw/柜。根据赛迪顾问预测,2025 年全球数据中心平均密度有望达到 25kw/柜。
高功耗、高密度使得对散热提出了更高的要求,这种趋势下,液冷是最高效的解决办法。
2.2 政策、成本优势助推液冷行业成长
2021年11月,国家发展改革委等部门发布《贯彻落实碳达峰碳中和目标要求推动数据中心和5G等新型基础设施绿色高质量发展实施方案》,要求到2025年,新建大型、超大型数据中心的PUE降到1.3以下,国家枢纽节点进一步降到1.25以下。目前风冷技术已无法满足相关政策要求。
2023年12月,国家发改委、国家数据局、中央网信办、工信部、国家能源局联合印发《深入实施“东数西算”工程加快构建全国一体化算力网的实施意见》,指出到2025年底,普惠易用、绿色安全的综合算力基础设施体系初步成型,并强调要推进数据中心用能设备节能降碳改造,推广液冷等先进散热技术。
在政策推动下的同时,日益明显的成本优势也推动液冷行业快速发展。液冷技术现阶段需求驱动“核心是PUE”,未来规模应用“关键是TCO”。TCO是总拥有成本,为前期采购成本+后期使用/维护成本。相比于传统风冷,液冷散热技术的应用虽然会增加一定的初期投资,但可通过降低运行成本回收投资。
以规模为10MW的数据中心为例,比较液冷方案(PUE1.15)和冷冻水方案(PUE1.35),预计2.2年左右可回收增加的基础设施初投资。

2.3 液冷服务器行业迎来加速发展阶段
据科智咨询报告,2023 年中国液冷数据中心市场将迎来53.2%的高速增长,市场规模将增长至154 亿元。展望未来五年,中国液冷数据中心市场将以59%的复合增长率持续蓬勃发展。预计到2027年,市场规模将突破千亿大关。

 目前液冷的主要技术路线

目前主流液冷技术主要包括冷板式液冷、喷淋式液冷和浸没式液冷技术三种。
3.1. 冷板式液冷技术(Cold Plate Liquid Cooling)
工作原理:冷板式液冷技术通过将一块或多块带有内部流道的冷板直接贴合在发热元件(如CPU、GPU或其他高热密度部件)上,利用冷却液在冷板内部循环流动,将热源产生的热量迅速吸收并通过冷却回路转移至外部冷却装置。冷板通常由具有良好导热性能的金属制成,确保热量能迅速从发热元件转移到冷却液。
特点:
● 定向冷却:针对特定热源实施高效冷却,对周边电子元件影响小。
● 结构相对简洁,易于维护和局部更换。
● 较好的安全性,冷却液不直接接触电子元件,减少了潜在的腐蚀风险。
3.2. 喷淋式液冷技术(Spray Cooling)
工作原理:喷淋式液冷技术通过将冷却液以雾化或滴状的形式直接喷洒在发热元件表面,利用液体瞬间蒸发吸热的原理,快速降低芯片表面温度。冷却液蒸发后形成的蒸汽随后会被收集并冷凝成液态,再循环回到冷却系统中。

特点:

● 高效率:通过液体蒸发迅速吸收大量热量,适合极高热密度场景。

● 对工艺和密封性要求较高,需确保液体回收和控制系统完善,以防泄漏。

● 能够实现局部集中冷却,但可能对机房环境湿度有一定影响。

3.3. 浸没式液冷技术(Immersion Cooling)
工作原理:浸没式液冷技术则是将整个服务器(或者部分组件)完全浸没在一种特殊的、不导电的液体中,如氟化碳等冷却液中。冷却液直接接触到所有的发热元件,实现高效的热交换,将热量均匀分散,然后通过外置的冷却系统将热量排出。

特点:

● 高效散热:由于冷却液与发热元件全方位接触,散热效率非常高。

● 低噪音:无需使用风扇,可显著降低数据中心噪音。

● 高密度部署:允许服务器更紧密地堆叠,提高了数据中心空间利用率。

● 节能环保:能够大幅度降低PUE值,提高能效,符合绿色数据中心建设理念。

目前液冷服务器行业面临的主要挑战

尽管我国液冷行业当前尚处于起步阶段,其在数据中心及服务器集群散热解决方案中的应用还未广泛普及,应用渗透率还较低(不足5%)。然而,不可忽视的是,液冷行业在向前推进的过程中,还需克服一些挑战。
● 缺乏标准化和成熟规范:液冷技术在国内外发展已有十余年,但当前生态不完善,各家产品形态各异,产品规范化程度较低。目前业内尚无服务器与机柜统一接口规范标准,机柜与服务器深度耦合,各家服务器设备、冷却液、制冷管路、供配电等产品形态各异,不同厂家产品接口不同、不能互相兼容,势必限制竞争,影响产业高质量发展。
● 高初始投资与运维成本:液冷系统的建设和改造成本往往高于传统的风冷系统。虽然液冷技术长期来看有助于节约能源和降低PUE,但初始投资包括购买液冷设备、改造现有基础设施和处理冷却液等环节的成本较高,这一问题将影响液冷产品的初期规模应用与推广。
● 改造难度大及整体架构还需迭代:采用液冷技术对现有数据中心进行改造时,需要对空间设计和承重结构做出针对性的调整,这会导致空间利用率下降。现有的建筑物构造也并不总是能适配大规模液冷系统的部署需求,改造难度较大。另一方面,液冷系统的整体架构技术还在迭代中,因缺乏统一标准,目前的架构各异,制冷和供电方案呈现出分布式与集中式等多种形态,这在一定程度上限制了液冷技术的普适性和灵活部署性。
 国内液冷服务器行业的竞争格局

在国内数据中心温控液冷产业链中,上游主要为产品零部件及液冷设备,包括快速接头、CDU、电磁阀、浸没液冷 TANK、manifold、冷却液等组件或产品供应商。部分代表厂商有英维克、3M、云酷、竞鼎、诺亚、广东合一、绿色云图等。中游主要为液冷服务器、芯片厂商以及液冷集成设施、模块与机柜等。部分代表厂商有华为、中兴、浪潮、曙光、新华三、联想、超聚变、英特尔等。下游主要包括三家电信运营商,百度、阿里巴巴、腾讯、京东等互联网企业以及信息化行业应用客户,主要在电信信息、互联网、政府、金融、交通和能源等信息化应用。产业链上,越往下游集中度较高,话语权较强。
综上所述,液冷技术的崛起与算力需求的持续增长相互呼应,伴随着国家政策对绿色数据中心建设和节能降耗的重视加深,以及市场对高效散热解决方案需求的急迫性增强,液冷技术行业正处在薄发增长的黄金时期。预计在未来数年内,国内液冷服务器市场规模将以显著的速度扩容,从百亿迈向千亿级别,显示出强劲的增长动力。
井喷式发展的赛道内的企业均面临着广阔的市场空间和机遇。我们认为,在这其中中游行业里具有先发优势和技术壁垒高的整体方案提供商和上游行业里一些细分领域的“小巨人”在中长期发展中更具竞争优势。