扫码体验VIP
网站公告:为了给家人们提供更好的用户体验和服务,股票复盘网V3.0正式上线,新版侧重股市情报和股票资讯,而旧版的复盘工具(连板梯队、热点解读、市场情绪、主线题材、复盘啦、龙虎榜、人气榜等功能)将全部移至VIP复盘网,VIP复盘网是目前市面上最专业的每日涨停复盘工具龙头复盘神器股票复盘工具复盘啦官网复盘盒子股票复盘软件复盘宝,持续上新功能,目前已经上新至V6.5.3版本,请家人们移步至VIP复盘网 / vip.fupanwang.com

扫码VIP小程序
返回 当前位置: 首页 热点财经 中信建投:各厂商AI芯片向大功率不断迭代,推升单机柜功率迅速增长

股市情报:上述文章报告出品方/作者:中信建投证券研究;仅供参考,投资者应独立决策并承担投资风险。

中信建投:各厂商AI芯片向大功率不断迭代,推升单机柜功率迅速增长

时间:2026-01-17 21:52
上述文章报告出品方/作者:中信建投证券研究;仅供参考,投资者应独立决策并承担投资风险。

AI供电方案的根本驱动力是单芯片和单机柜功率的不断提升。

以英伟达为首的AI芯片厂商不断迭代升级其最新AI芯片的功率。英伟达已从Maxwell时代单颗芯片250W提升至B200芯片的超过1000W;谷歌、微软、Meta等自研芯片也向单颗1000W以上迈进。通过NVL72(英伟达)、Superpod(谷歌)等多芯片设计,单机柜功率进一步向MW级迈进。我们认为,至2028年北美新增AI数据中心功率可达71GW。

本报告尝试详尽地梳理AIDC电源技术发展趋势,以及给各环节设备带来的变化。投资机会包括四大类:(1)AIDC电源主机,即PSU、HVDC、SST等环节,价值量集中、技术壁垒和入围门槛高;(2)电站级储能,越来越成为AI数据中心并网的刚需;(3)核心零部件,尤其看好固态断路器、CBU/BBU、DC/DC设备、电子熔断器/继电器等AIDC新增环节;(4)GaN、SiC等第三代半导体。

以英伟达为首,各厂商历代芯片功率不断升级

英伟达作为GPU概念的提出者,历年来推出了若干GPU架构,每个架构代表GPU的代际划分,同时每代GPU包含若干型号。从2014年Maxwell架构第一次发布专用AI计算卡Titan X到最新的Vera Rubin架构中的R100/200/300 GPU,单颗GPU芯片的功耗已从250W提升至900W,并通过双芯片、四芯片设计进一步提升至1800W/3600W。

与英伟达(NVIDIA)的通用GPU(GPGPU)策略不同,谷歌的TPU (Tensor Processing Unit) 是典型的ASIC(专用集成电路),主要用于谷歌自己的数据中心内部,通过Google Cloud对外提供算力,或用于加速谷歌自家的业务(如搜索、YouTube、Gemini模型等)。

谷歌TPU从2015年至今已发展7代,呈现出清晰的演进路径:从从单一推理到训练推理兼备,从低算力到超高算力,从电互连到光互连,从风冷到液冷。特别是最新的 Ironwood,单芯片算力突破 4.6 PFLOPS,是专为 AI 推理时代设计的里程碑产品。

除此之外,微软、Meta等头部AI厂家也推出了自己的AI芯片,但相比英伟达和谷歌,型号尚少,这两家也大量应用英伟达芯片部署在自己的数据中心。

英伟达推出机柜级(Rack-Scale)方案,代表其在AI基础设施领域从提供单卡或单机向提供统一架构系统的战略转变。如英伟达推出NVL72,可使用H100、B200或B300芯片,内含72颗GPU芯片和36颗CPU芯片,单机柜功率达到100kW级别(考虑2N冗余后配置电源功率达到200kW级别)。在Rubin架构推出后,英伟达推出的Kyber机柜结构将包含的GPU数量增加到576颗,单机柜功率达到600kW以上。

同时,谷歌也为其TPU芯片开发了专用机柜系统,称为TPU Pod,类似于英伟达的NVL系列,但采用完全不同的设计理念和互联技术。在Pod设计中,每个标准TPU机柜固定包含64颗TPU芯片(16个托盘×每个托盘4颗芯片),TPU和CPU之间通过PCIe连接。从TPU v3开始,谷歌全面采用液冷系统(之前v1/v2主要为风冷),电源方面采用定制的高压直流(HVDC)供电,单机柜功率从v3的300kW到v7的10MW不等。

作为ASIC阵营的代表,谷歌的TPU Pod方案虽与英伟达的NVL72等方案不同,但都遵循规模越来越大、功耗越来越高、使用液冷取代风冷等的规律。到2027年,普遍迭代至单机柜MW级规模,同时供电方案也由交流供电转为直流供电。

AI数据中心带来巨大的供电需求

由于一台机柜中往往除了GPU外,还含有CPU、交换机、内存、液冷等用电,以英伟达为例,典型的GB200 NVL72机柜包含18个计算托盘,每个含4颗B200 GPU和2颗Grace CPU。单看72颗B200 GPU芯片的功率仅约86.4kW,但加上9个NVLink交流机之后功率增长到约132kW,而实际上标准的NVL72机柜配置多达8套33kW Powershelf,总的供电功率达到264kW,相当于冗余了一倍。因此我们在考虑对应的数据中心功率需求时,大多按芯片总功率×2来考虑。

谷歌的TPU机柜则使用内含16个TPU托盘,每个托盘含4颗TPU芯片。电源(PSU)则安装在机柜上部,目前仍为交流供电方式,即引入416V交流电源,经过PSU进行AC/DC整流后进入机柜内提供电源。从TPU机柜的电源配置来看,预计冗余倍数也为1倍左右。

2025年英伟达NVL72系列机柜出货量约在2.7-3.4万台,芯片主要是GB200,而2026年出货以GB300芯片的NVL72为主,预计出货量将至少达到6万台,对应的机柜功率需求将达到18GW左右。谷歌而言,2025年TPU芯片出货约150-250万颗,对应机柜出货约2.3-3.9万台,芯片型号主要为TPU v6e,v7将Q4小批试产;2026年TPU v7全面量产,受限于CoWoS封装产能,出货量约为310-420万颗,对应机柜数(芯片/64)约4.8-6.6万个;至2027年,TPU v7成为主流,出货预计达到500-700万颗,机柜台数达到7.8-10.9万个。对应2025、2026、2027年谷歌数据中心每年的新增功耗约为5GW、8GW、10GW。

基于北美主要厂商芯片最新出货,我们测算2025-2028年美国AI需求带来的电力容量需求分别为19、32、49、71GW,三年CAGR约为55.7%。其中,对于英伟达考虑60%供美国本土,其他ASIC阵营则考虑全部供美国本土。

1)需求方面:海外、国内云厂商资本开支不及预期;海外、国内先进AI芯片出货量不及预期;终端算力需求不及预期等。

2)供给方面:先进芯片产能不及预期;关键功率半导体产能不及预期等。

3)政策方面:算力支持政策不及预期;能耗、环评、土地审批不及预期;项目指标审批不及预期等。

4)国际形势方面:AI芯片进口受阻;国际贸易壁垒加深等。

5)市场方面:竞争格局大幅变动;竞争加剧导致设备单价迅速下降;运输等费用上涨。

6)技术方面:技术降本进度低于预期;技术可靠性难以进一步提升等。

股票复盘网
当前版本:V3.0