最强芯片液冷技术突破:冷却性能达此前纪录 10 倍
时间:2026-06-19 23:55
上述文章报告出品方/作者:电子发烧友网;仅供参考,投资者应独立决策并承担投资风险。
人工智能算力竞赛,正演变为一场激烈的 “散热战争”。随着芯片制程工艺逼近物理极限,晶体管密度持续攀升,芯片功耗与热流密度的上涨速度远超摩尔定律预期,散热已从配套成本项,转变为制约 AI 算力上限、决定数据中心 TCO(总拥有成本)的核心约束条件。近日,韩国科学技术院(KAIST)研究团队公布一项超高效芯片内嵌液冷技术:将常温清水直接通入芯片内部微米级流道实现散热,其制冷性能系数达到此前全球世界纪录的 10 倍。该成果刊发于《能源转换与管理》期刊,为行业长期难以解决的 AI 芯片散热瓶颈提供全新技术路线。行业数据显示,AI 芯片功耗正呈爆发式增长:2022 年主流高端 AI 芯片功耗约 700W;2024—2025 年旗舰芯片功耗突破 1000W;2026 年集成式算力整机模组功耗可达 2300W;行业机构预测,2027 年顶级算力模组功耗或将攀升至 3600W。更棘手的是,芯片单位面积发热量同步暴涨,整体热流密度从 86W/cm² 飙升至 160W/cm² 以上,芯片局部热点热流密度甚至突破 500W/cm²。风冷曾是传统数据中心的主流散热方案。传统 IDC 以 CPU 为算力核心,单机柜功率密度仅 6~8kW,风冷系统可完全满足散热需求。但进入 AI 算力时代,传统散热方案已全面触碰物理天花板:当机柜功率密度超过 30~40kW 时,风冷散热效率断崖式下滑,面对 100kW 及以上高密度 AI 机柜已完全无法适用。数据中心能耗结构同样凸显散热痛点:传统风冷机房中,制冷系统能耗占机房总耗电的 30%~43%,能耗占比仅次于服务器 IT 设备。国际能源署统计数据显示,2024 年全球数据中心耗电量占全社会总用电量的 1.5%,其中 40% 的电力消耗用于设备冷却。国内维度,2023 年全国数据中心总耗电量达 2668 亿千瓦时,行业测算 2030 年该数值或将突破 4000 亿千瓦时。集邦咨询(TrendForce)最新调研指出,AI 数据中心液冷渗透率将持续快速提升:2024 年渗透率 14%,2025 年升至 33%,2026 年进一步达到 40%。英伟达 Rubin 平台是旗下首款全液冷算力平台;前代 Blackwell 平台仍保留 15%~20% 风冷辅助散热。与此同时,谷歌 TPU v7p、Meta MTIA T、AWS TRN3、微软 MAIA 200、AMD MI400X 等新一代 AI 芯片平台,均将液冷散热列为核心部署方案。当前商用 AI 数据中心中,冷板式液冷依靠冷板贴合芯片表面导热,是落地最成熟的散热方案;进阶路线为浸没式液冷,将整机服务器浸泡在绝缘冷却液中降温。但面向未来单平方厘米上千乃至两千瓦级超高热流密度场景,散热结构必须进一步贴近芯片裸片(Die),甚至嵌入封装衬底内部 —— 这也是封装级、芯片级微流道冷却(microfluidic/MMC)长期被行业视作终极散热方案的核心原因。KAIST 超高效液冷技术:从外部散热升级为芯片内置 “冷却血管”
KAIST 团队这项技术之所以具备革命性价值,核心逻辑是彻底重构传统散热思路:不再依靠芯片外部吹风、贴合冷板等外置散热手段,而是在硅片内部打造一套完整、原生的微型冷却流体管路,如同给芯片植入内置散热血管。该技术由 KAIST 机械工程系金成镇(Sung Jin Kim)教授、AI 计算学院李益镇(Ikjin Lee)教授联合课题组研发,三大核心创新点如下:歧管微通道(Manifold Microchannel, MMC)结构优化传统微通道散热结构中,冷却液需贯穿芯片整块流道,长距离管路会产生极大流体阻力。研究团队将物流分流网络设计思路引入芯片热管理:采用多入口同步分流、多出口统一汇流的布局,大幅缩短冷却液单程流动距离,显著降低循环泵所需驱动压力。团队并未单纯缩小流体通道尺寸,而是对通道宽、高、数量、排布方式、冷却液流速全参数系统性优化;创新采用 “一维快速计算模型 高精度三维流体动力学仿真” 的多保真度耦合算法,在海量设计参数空间中锁定最优方案,解决传统 MMC 结构冷却液分布不均、局部流道过热的行业痛点。研究基于 5mm×5mm 硅基测试芯片开展实验,在超 2000W/cm² 的极限热流密度条件下,仅使用常温清水作为介质,即可将芯片核心温度稳定控制在 100℃以内,系统流体压降仅 8kPa。实测数据显示,该散热系统制冷性能系数(COP)高达 106000,是 2020 年《自然》期刊刊载的全球最优纪录(约 10000)的十倍。COP 代表单位泵送输入功率可带走的热量,106000 的数值意味着:每输入 1 瓦泵机功耗,就能带走 106 千瓦芯片发热量。该整套系统仅采用普通常温清水作为冷却液,无需特种导热介质、低温制冷机组配套,硬件配套成本大幅降低。在 2000W/cm² 超高发热工况下,芯片核心温度稳定低于 100℃,散热冗余足以覆盖未来十年全品类 AI 芯片散热需求,包含行业预计 2030 年前后商用的 3000W 级超高功耗算力芯片。若 KAIST 此项技术实现规模化商业化落地,将对全球半导体、AI 算力产业产生颠覆性深远影响,价值覆盖全产业链多个环节。首先,其将重构数据中心能效体系。相关数据显示,2020 年全球数据中心平均 PUE(能源使用效率)约 1.5,即每消耗 1 度电用于算力计算,配套散热需额外消耗 0.5 度电;近年全球机房 PUE 优化进度已陷入瓶颈。团队已完成该技术适配标准数据中心冷板的测试,冷板综合冷却效率提升超 30%。当前英伟达 GB200、GB300 等算力整机单机柜功率密度已达 130~250kW,下一代 Rubin 平台机柜功耗将继续走高;仅 30% 的冷板散热效率提升,单座大型数据中心每年即可节省数亿元冷却电费开支。其次,这项技术有望充分释放高端算力芯片性能。当前算力集群普遍存在芯片高温降频问题,直接造成算力损耗。该微流道散热方案具备尺寸可扩展性,能够适配 7.5cm×7.5cm 大尺寸 AI 裸片(GPU、TPU 等);未来可在芯片设计初期就内嵌微型冷却管路,实现芯片电路设计与热管理协同设计(Co-design),从源头消除高温降频约束。此外,这项技术也将支撑 2.5D/3D 先进封装技术迭代。随着芯粒(Chiplet)、三维堆叠封装大规模普及,多层芯片叠加造成内部热源堆积、热量传导受阻。嵌入式硅基微流道液冷可直接在硅中介层、芯片背面刻蚀流体冷却通道,为高集成度 2.5D/3D 先进封装提供配套热管理解决方案。KAIST 本次突破性研究印证一条核心产业趋势:AI 算力的竞争重心,正从单纯比拼晶体管集成密度,转向热管理系统效率的比拼。当芯片制程逐步逼近物理极限,功耗墙带来的约束比摩尔定律放缓更为紧迫;每一次散热技术的跨越式突破,都将解锁算力性能阶跃式提升的全新空间。