热管理革命:液冷技术与国产冷却液替代(3M退出效应)深度研究报告摘要

热管理革命:液冷技术与国产冷却液替代(3M退出效应)深度研究报告摘要

当前,全球数字基础设施正处于一场由人工智能(AI)爆发式增长引发的历史性重构之中。大模型(LLM)参数量的指数级跃升,不仅推动了算力需求的爆炸式增长,更将底层硬件的物理极限推向了新的临界点。在中美科技博弈的宏观背景下,两国在算力基础设施建设上选择了截然不同的战略路径:中国依托“东数西算”国家战略,通过特高压输电与确定性网络(CENI)技术,试图打破地理与能源的桎梏;而美国则在电力市场化的架构下,面临着核心枢纽电网拥堵、变压器供应链断裂及电力接入排队等严峻挑战。

在这一宏大叙事之下,热管理技术已不再是辅助性的设施保障,而是演变为决定AI算力集群性能释放、能效水平乃至生存能力的各种核心瓶颈。特别是随着英伟达Blackwell架构等新一代高功耗芯片的问世,传统风冷技术在热力学上已难以为继,液冷技术——尤其是浸没式液冷——正从“选修课”变为“必修课”。

与此同时,全球电子氟化液市场的霸主3M公司宣布将于2025年底退出PFAS(全氟及多氟烷基物质)生产,这一“黑天鹅”事件在由此造成的供应链真空中,为中国化工企业提供了千载难逢的国产替代机遇。

本报告将立足于这一复杂的产业背景,深度剖析液冷技术的必要性、技术路线演进、全球供应链重构及中国企业的战略机遇,旨在为行业决策者与投资者提供一份详尽的战略指南。


第一章 宏观背景:中美算力基础设施的战略分野

人工智能算力的竞争,本质上是能源与数据传输效率的竞争。在中美两国不同的资源禀赋与体制架构下,双方构建AI基础设施的路径呈现出显著的差异,这种差异直接决定了冷却技术在各自市场中的演进逻辑与应用速度。

1.1 中国路径:“东数西算”与能源地理的重构

中国的数字基础设施建设具有鲜明的顶层设计特征。面对东部沿海地区土地资源紧张、电力供应趋紧且碳排放指标严格的现状,中国启动了雄心勃勃的“东数西算”工程。这一战略的核心逻辑在于将东部密集的算力需求,有序引导至西部能源富集地区,利用西部丰富的风能、太阳能等可再生能源来支撑算力中心的运行。

1.1.1 能源优势与特高压技术的支撑

中国西部地区(如内蒙古、甘肃、贵州等)拥有巨大的清洁能源储备。为了解决算力中心“西迁”后的能源输送与数据回传问题,中国大力发展特高压(UHV)输电技术。特高压直流输电(UHVDC)具有输送容量大、距离远、损耗低的特点,能够将西部的“绿电”高效输送至算力枢纽,或者直接在西部就地消纳,实现了“瓦特”与“比特”的转化。这种能源布局直接影响了冷却技术的选择:在西部缺水地区,传统依赖大量水蒸发冷却的开式冷却塔系统面临环境制约,促使低水资源消耗(WUE)的闭式液冷系统成为刚需。

1.1.2 确定性网络(CENI)的突破

算力“西迁”的最大技术障碍在于网络延迟。为了确保西部算力能够实时响应东部的推理与训练需求,中国在未来网络试验设施(CENI)方面取得了重大突破。CENI技术通过构建低时延、低抖动、高可靠的骨干网络,犹如为数据传输修建了一条“高铁”,大幅缩短了东西部之间的网络距离。这使得在西部大规模部署对实时性要求较高的AI训练集群成为可能,从而为西部大型液冷数据中心的建设奠定了网络基础。

1.1.3 PUE红线与液冷的政策强制性

为了确保算力增长不以牺牲环境为代价,中国发改委等部门制定了极其严格的能效标准。新建大型数据中心必须将电源使用效率(PUE)控制在1.25以内,国家枢纽节点甚至要求达到1.2。考虑到传统风冷数据中心的PUE通常在1.4至1.6之间,这一政策实际上宣告了风冷技术在新建大规模算力中心中的终结。液冷技术,特别是浸没式液冷,凭借其将PUE降至1.1甚至1.05的能力,成为了通过能评、获取运营牌照的唯一技术解。

1.2 美国路径:电网瓶颈与电力接入危机

相比之下,美国的AI基础设施建设更多由市场驱动,但目前正面临物理基础设施的严重制约。

1.2.1 核心枢纽的电力“熔断”

北弗吉尼亚州(Northern Virginia)作为全球最大的数据中心市场,其电力容量已接近极限。由于输电网络的升级速度远远滞后于数据中心的建设速度,Dominion Energy等公用事业公司不得不暂停新项目的电力接入,部分新建数据中心的电力交付时间已推迟至2026年甚至更晚。这种电力短缺迫使美国算力中心开始向电力资源相对充裕但网络条件较差的中西部腹地外溢。

1.2.2 变压器短缺与供应链危机

在AI算力爆发的推动下,数据中心的建设规模从兆瓦级(MW)向吉瓦级(GW)跃升,导致对高压变压器和配电设备的需求激增。然而,美国本土的变压器制造业早已空心化,高度依赖进口。当前的供应链数据显示,大型电力变压器的交付周期已从以前的12个月延长至3-4年。这一“变压器危机”成为了制约美国AI算力部署的最短板,迫使运营商不得不通过提高单机柜功率密度来挖掘现有电力容量的潜力,而这恰恰是液冷技术的用武之地。

1.2.3 现有设施的改造压力

与中国大量新建“绿地”(Greenfield)数据中心不同,美国拥有庞大的存量“棕地”(Brownfield)数据中心。这些设施大多基于风冷设计,无法直接支持高密度的AI机柜。因此,美国市场对能够兼容现有基础设施的冷板式液冷(Direct-to-Chip)有着强烈的现实需求,通过局部改造来适应AI服务器的热流密度,而不必彻底推翻重建。


第二章 热力学极限:AI算力背后的物理危机

摩尔定律的放缓与丹纳德缩放定律(Dennard Scaling)的失效,使得芯片制程的微缩不再能自动带来功耗的降低。为了追求更高的算力,芯片设计者不得不通过堆叠晶体管和提高频率来换取性能,导致单芯片功耗(TDP)急剧攀升。

2.1 从H100到B200:指数级的热流密度

英伟达(NVIDIA)GPU的演进史,就是一部与热力学定律搏斗的历史。

H100时代: NVIDIA H100 Tensor Core GPU的热设计功耗(TDP)已高达700W。在标准的HGX H100 8卡模组中,仅GPU的产热就达到5600W,加上CPU、NVLink交换芯片和网络设配,单机柜功率密度轻松突破40kW。在这一阶段,风冷技术虽然勉强支撑,但需要巨大的散热器和高速运转的风扇,风扇功耗占比甚至高达服务器总功耗的15%-20%,极大地降低了系统能效。

B200时代: 随着Blackwell架构的推出,B200 GPU的TDP进一步飙升至1000W甚至更高。在如此高的热流密度下,芯片表面的热量无法及时通过空气对流散发,导致结温(Junction Temperature)迅速触及安全红线。风冷散热器的体积将大到无法安装,且风扇产生的噪音和震动将严重影响硬盘等精密部件的稳定性。此时,液冷不再是选项,而是物理学上的必然。

2.2 为什么是液冷?

液冷之所以成为必然选择,根源在于介质的物理属性差异:

  • 比热容: 液体的比热容通常是空气的1000-4000倍。这意味着在吸收相同热量的情况下,液体的温升远小于空气,能够保持芯片在更稳定的低温下运行。
  • 导热率: 液体的导热率是空气的20-25倍。这使得液体能够更快速地将热量从芯片表面带走,有效消除“热点”(Hot Spots)。
  • 能效比: 液体输送热量的能耗远低于气体。泵送液体所需的能量仅为风扇输送同等热量所需空气能量的几十分之一,这直接转化为PUE的显著降低。

2.3 技术路线之争:冷板 vs 浸没

当前液冷市场主要存在两大主流技术路线:冷板式液冷(Cold Plate)与浸没式液冷(Immersion Cooling)。

2.3.1 冷板式液冷(Direct-to-Chip, DLC)

这是目前商业化成熟度最高、应用最广泛的技术。其原理是将装有流道的金属冷板(通常为铜或铝)直接贴合在CPU/GPU等高发热元件上,冷却液在板内流动带走热量。

  • 优势: 能够直接利用现有的服务器架构,只需对机柜进行管路改造;产业链成熟,维护相对容易;兼容性好,目前英伟达GB200 NVL72架构即主要推荐采用单相冷板方案。
  • 局限: 只能冷却高功耗的核心芯片(覆盖率约70%-80%),内存、电源模块(VRM)、硬盘等部件仍需风扇辅助散热,因此难以实现极致的PUE(通常在1.15-1.2);且管路接头众多,存在泄漏风险(Leakage Risk),一旦导电液体泄漏将导致灾难性后果。

2.3.2 浸没式液冷(Immersion Cooling)

这是液冷技术的终极形态。其原理是将整台服务器完全浸泡在绝缘的介电液体中,发热器件直接与液体接触进行热交换。

  • 单相浸没(Single-Phase): 冷却液在循环过程中保持液态,通过对流带走热量。成本相对较低,维护较简单,通常使用合成油或氟化液。

  • 两相浸没(Two-Phase): 冷却液在芯片表面沸腾汽化,利用相变潜热(Latent Heat)带走巨量热量,蒸汽上升冷凝后回流。散热效率极高,可支持单机柜100kW以上密度,PUE可低至1.04。

  • 优势: 100%液体冷却,彻底去除风扇;实现极致PUE;由于液体绝缘且隔绝氧气,硬件寿命更长,故障率更低。

  • 局限: 需要定制化的服务器和槽体(Tank);冷却液成本高昂(尤其是两相使用的氟化液);维护困难,插拔硬件时液体会滴落;目前主要受制于冷却液的环保与供应问题。


第三章 供应链地震:3M退出与“氟化工缺口”

如果说芯片是AI的大脑,那么冷却液就是AI的血液。在浸没式液冷领域,电子氟化液是不可或缺的核心材料。然而,这一关键供应链正面临前所未有的断供危机。

3.1 3M的战略撤退:一个时代的终结

2022年12月20日,全球氟化工巨头3M公司宣布,将于2025年底前全面退出PFAS(全氟及多氟烷基物质)的生产制造,并停止在其产品组合中使用PFAS。这一决定涵盖了其旗下著名的**Novec™(电子工程流体)和Fluorinert™(电子氟化液)**两大产品线。

PFAS因其化学性质极其稳定,在自然界中极难降解,被称为“永久化学品”。随着欧美环保法规(如欧盟REACH法规、美国EPA监管)的日益严苛,以及由此引发的数十亿美元的环境诉讼赔偿,3M不得不做出这一“断臂求生”的战略决策。

3.2 供应链真空与价格冲击

3M在电子氟化液市场拥有绝对的统治地位,其市场份额一度超过60%-70%。Novec 7100、7200以及Fluorinert FC-40、FC-770等型号,长期以来是半导体制造(蚀刻控温、测漏)、精密清洗以及两相浸没式液冷的行业标准。

3M的退出造成了巨大的市场真空,被称为“氟缺口”(Fluorine Gap)。

  • 短期影响: 下游客户(包括半导体晶圆厂、数据中心运营商)陷入恐慌性囤货,导致现货价格暴涨。
  • 中期影响: 2025年停产大限临近,但许多关键应用(尤其是半导体制造和存量两相液冷系统)尚未完成替代品的验证。更换冷却液并非简单的“倒掉重来”,需要重新验证材料兼容性、热工性能和长期稳定性,验证周期通常长达12-18个月。
  • 长期影响: 这将重塑全球氟化工产业格局,将定价权和供应中心从美国转移至其他地区,尤其是中国。

3.3 替代化学品的路线之争

面对3M的退出,市场主要分为两条替代路线:

  • 氟化液替代(Fluorinated Route): 继续使用氟碳化学品,但寻找非3M供应商。
    • 优点: 性能最接近3M原品,不可燃,绝缘性极佳,适合两相浸没。
    • 缺点: 价格依然昂贵,且始终面临PFAS环保法规的潜在威胁(尽管部分新型号致力于降低GWP值)。
  • 碳氢化合物替代(Hydrocarbon Route): 使用合成油(如PAO,聚α-烯烃)或矿物油。
    • 优点: 成本极低(仅为氟化液的1/10甚至更低),无PFAS环保风险。
    • 缺点: 可燃(需高闪点设计),粘度较高(影响散热效率),往往只能用于单相浸没,且清理维护油腻麻烦。

对于追求极致性能和安全性的高端AI数据中心,氟化液仍是首选;而对于成本敏感且能够接受单相方案的矿场或部分云数据中心,合成油正成为主流。


第四章 国产替代的崛起:中国化工产业的战略机遇

3M的退出,对于中国氟化工产业而言,不仅是市场份额的争夺战,更是产业链升级的攻坚战。中国拥有全球最大的萤石(氟化工源头矿产)储量,已建立了从矿山开采到氢氟酸、再到含氟聚合物的完整产业链。现在,中国企业正集体向电子级氟化液这一金字塔尖发起冲击。

4.1 巨化股份(600160.SH):全产业链的“国家队”

浙江巨化作为中国氟化工的龙头企业,其技术中心研发的JHT系列电子冷却液,已被视为3M Novec和Fluorinert的最强力替代者。

  • 技术对标: JHT系列产品(如JHT-7200)在化学结构上与3M Novec 7200(乙氧基九氟丁烷)高度相似甚至相同(同分异构体),属于“Drop-in”直接替换型产品。这意味着用户无需更改设备参数即可直接使用,极大地降低了替代门槛。
  • 产能优势: 巨化拥有庞大的氟化工一体化基地,具备从原材料到终端产品的成本控制能力。其“巨芯冷却液”已实现量产,并正在通过国内头部互联网厂商和服务器厂商的测试认证。
  • 财务表现: 随着高附加值的冷却液业务放量,巨化的营收结构正在优化,2024年报显示其净利润大幅增长,部分得益于制冷剂和高端氟材料的景气度回升。

4.2 浙江诺亚(Zhejiang Noah):专注细分领域的“隐形冠军”

浙江诺亚氟化工专注于含氟电子化学品的研发,其策略更为精准和激进。

  • 产品矩阵: 诺亚推出了针对3M退出产品的全套对应方案。Noah® 5112直接对标Novec 1230(消防液),已在全球市场获得广泛认可。在液冷方面,Noah® 2000/3000系列覆盖了从单相到两相的全温区需求,特别是Noah 2100A两相冷却液,宣称GWP(全球变暖潜能值)仅为1,极具环保竞争力。
  • 市场策略: 诺亚明确打出“3M替代”的旗号,积极拓展海外市场,利用3M退出的窗口期抢占欧洲和东南亚客户,并强调其产品的环保合规性,以缓解客户对PFAS的担忧。

4.3 新宙邦(Capchem):跨界而来的电解液巨头

深圳新宙邦作为全球锂电池电解液的领军者,将其在溶剂提纯和配方方面的深厚积累迁移至氟化工领域。

  • 海斯福(Hexafluo): 其子公司三明海斯福是全球高端氟精细化学品的重要供应商。Boreaf系列氟化液已进入半导体和数据中心市场。
  • 协同效应: 借助在电池热管理领域的经验,新宙邦在理解客户热管理需求方面具有独特视角,且其半导体化学品业务已打入台积电等核心供应链,为冷却液的导入提供了信任基础。

4.4 永和股份(Yonghe):资源为王的后起之秀

永和股份依托其在内蒙古的萤石资源优势,正在快速扩充含氟高分子材料产能。虽然其在电子氟化液领域的起步较巨化稍晚,但凭借上游资源的保供能力和成本优势,正成为市场中不可忽视的力量。

4.5 非氟路线的挑战者:中石化与壳牌

除了氟化工企业,传统石化巨头也在布局非氟(合成油)路线,主要针对单相浸没市场。

  • 中国石化(长城润滑油): 依托强大的化工合成能力,推出了数据中心专用的合成浸没冷却油,并已在商业化项目中应用,实测PUE低于1.1。
  • 壳牌(Shell): 壳牌与阿里云建立了深度战略合作,共同研发基于GTL(天然气制油)技术的浸没式冷却液。这种合成油纯度极高,不含硫氮杂质,绝缘性好,且成本远低于氟化液,是阿里云大规模部署单相浸没液冷的关键推手。

第五章 产业生态与商业化落地

液冷技术的普及不仅仅是冷却液的问题,更需要服务器厂商、芯片巨头和数据中心运营商的协同配合。

5.1 互联网巨头的先行实践

  • 阿里云(Alibaba Cloud): 阿里巴巴是全球浸没式液冷的领跑者。其位于张北的数据中心部署了全球规模最大的浸没式液冷服务器集群。阿里采用的是单相浸没技术,这不仅大幅降低了PUE(年均1.09),还通过与壳牌合作解决了冷却液成本问题。阿里的成功实践为行业树立了标杆,证明了浸没式液冷在超大规模数据中心的可行性。
  • 腾讯与百度: 目前主要侧重于冷板式液冷的大规模部署,这与OCP(开放计算项目)的主流趋势更为贴近,便于快速改造现有设施。但随着西部算力枢纽的建设,其对浸没式技术的储备也在加速。

5.2 服务器厂商的“军备竞赛”

  • 浪潮信息(Inspur): 作为全球领先的AI服务器供应商,浪潮提出了“All in 液冷”战略。其在天池建立了亚洲最大的液冷生产基地,年产能超10万台。浪潮推出了全栈液冷解决方案,涵盖冷板和浸没,并积极与巨化等国内冷却液厂商进行适配认证,推动国产化生态的成熟。
  • 中科曙光(Sugon): 曙光是国内最早布局液冷技术的厂商之一,其子公司曙光数创专注于相变浸没式液冷技术(两相)。曙光的“硅立方”超级计算机采用了全浸没式刀片服务器设计,PUE可降至1.04。曙光的技术路线对冷却液性能要求极高,因此也是国产高端氟化液的重要验证平台。

5.3 关键零部件的国产化

液冷系统的复杂性还体现在管路、接头(Quick Disconnects, QDs)、分液单元(CDU)等部件上。

  • 快插接头(QD): 这是防止漏液的关键部件,过去主要由美国CPC公司垄断。随着供应链安全受到重视,国内精密加工企业开始在此领域实现突破,成本大幅降低。
  • CDU(冷却液分配单元): 英维克(Envicool)、高澜股份等热管理企业在CDU领域占据主导地位。英维克深度参与了国内主要互联网厂商的液冷标准制定,是“东数西算”液冷红利的主要受益者之一。

第六章 投资逻辑与未来展望

6.1 产业链价值分布与投资逻辑

在液冷产业链中,价值量最高、壁垒最深的环节在于冷却液和核心散热部件(如冷板、CDU)。

  • 化工材料端的Alpha收益:
    • 逻辑: 全球含氟冷却液供需失衡,价格维持高位。国产厂商(巨化、诺亚、新宙邦)具备成本和产能双重优势,且不受制于美国PFAS禁令(目前国内政策相对温和),有望承接全球订单。
    • 催化剂: 3M正式停产日期的临近(2025年底),以及国内大厂通过国产冷却液的最终认证(AVL导入)。
  • 设备端的Beta收益:
    • 逻辑: 无论哪种冷却液胜出,液冷服务器的渗透率提升是确定性事件。“东数西算”PUE红线强制存量替换和新建合规。
    • 标的: 英维克(全链条散热龙头)、曙光数创(浸没式技术壁垒)、浪潮信息(服务器份额优势)。

6.2 风险因素与挑战

  • 环保法规的不确定性: 虽然目前中国对PFAS的管控主要集中在特定种类(如PFOA),未像欧盟那样全面,但全球环保趋严是大势所趋。如果未来中国跟进严格的PFAS禁令,氟化液路线将面临生存危机,合成油路线将受益。
  • 技术路线的摇摆: 英伟达等芯片巨头对冷板式液冷的偏好可能延缓浸没式液冷的普及。如果冷板技术能通过改进(如微流道优化)满足1000W+散热需求,浸没式可能仍将局限于超算和极高密度场景。
  • 海外市场准入: 随着地缘政治紧张,中国化工产品出口欧美可能面临关税或非关税壁垒(如碳关税、供应链审查)。

6.3 战略结论

“热管理革命”不仅是技术升级,更是大国博弈在基础设施层面的投射。对于中国而言,液冷技术是实现“东数西算”节能目标、绕过光刻机等制程封锁(通过散热提升芯片性能释放)的关键非对称手段。利用3M退出的窗口期,完成冷却液供应链的国产化替代,是保障国家算力安全的战略必选项。

对于行业而言,2025年将是液冷技术的“爆发元年”。随着3M产能的出清和国产产能的释放,液冷成本有望大幅下降,从而推动其从高端AI集群向通用数据中心下沉。

综上所述,液冷技术已跨越了技术验证的鸿沟,进入了大规模产业化的快车道。在这场变革中,掌握核心化学材料配方与产能的企业,将扼住AI时代的“咽喉”。


表1:主流数据中心冷却技术对比

技术指标传统风冷冷板式液冷 (DLC)单相浸没式液冷两相浸没式液冷
冷却介质空气水/乙二醇 (板内)合成油/氟化液电子氟化液
散热能力 (kW/机柜)< 30 kW30 - 80 kW50 - 100 kW> 100 kW
典型 PUE1.4 - 1.61.15 - 1.251.05 - 1.101.02 - 1.05
静音效果差 (风扇噪音大)中 (仍需少量风扇)优 (无风扇)优 (无风扇)
主要耗能部件压缩机、风扇泵、干冷器泵、冷却塔冷却液
冷却液成本低 (工业用水)中/高 (视液体而定)极高 (氟化液)
维护复杂度中 (防漏液)高 (设备浸油)极高 (密封与回收)
3M退出影响中 (若用氟化液)致命 (高度依赖)

数据来源:综合整理自

表2:3M 退出后主要国产替代产品对照

3M 原型号应用领域巨化股份 (Juhua) 对标产品浙江诺亚 (Noah) 对标产品备注
Novec 1230数据中心消防-Noah® 5112全球公认替代品,低GWP
Novec 7100清洗、热传导JHT-7100Noah® 7100沸点61°C,电子清洗主力
Novec 7200清洗、热传导JHT-7200Noah® 7200沸点76°C,化学结构一致
Fluorinert FC-40半导体测试、液冷JHT系列Noah® 3000系列高绝缘性,用于浸没/测漏
Fluorinert FC-3283电子液冷JHT系列Noah® 3000系列-

信息来源:综合自

来源:https://vestlab.beikee.org/

评论