扫码体验VIP
网站公告:为了给家人们提供更好的用户体验和服务,股票复盘网V3.0正式上线,新版侧重股市情报和股票资讯,而旧版的复盘工具(连板梯队、热点解读、市场情绪、主线题材、复盘啦、龙虎榜、人气榜等功能)将全部移至VIP复盘网,VIP复盘网是目前市面上最专业的每日涨停复盘工具龙头复盘神器股票复盘工具复盘啦官网复盘盒子股票复盘软件复盘宝,持续上新功能,目前已经上新至V6.56版本,请家人们移步至VIP复盘网 / vip.fupanwang.com

扫码VIP小程序
返回 当前位置: 首页 热点财经 科技|超节点:AI训推大势所趋,关注三大增量环节

股市情报:上述文章报告出品方/作者:中信证券研究;仅供参考,投资者应独立决策并承担投资风险。

科技|超节点:AI训推大势所趋,关注三大增量环节

时间:2026-03-29 15:53
上述文章报告出品方/作者:中信证券研究;仅供参考,投资者应独立决策并承担投资风险。


超节点将多张加速卡通过高带宽、低时延的Scale-up网络紧密连接,并提供内存池化、内存直连等机制,极大提升了AI训推效率,已经成为明确产业趋势。随着英伟达等厂商推动超节点提效扩容,GPU间交换芯片、液冷、柜内电源环节将分别受益于Scale-up纯增量用量、机柜高功率推动的渗透率与ASP提升、机柜高功率推动的ASP提升,实现增长;我们预计2028年增量空间将分别达到1000、130、240亿美元。其中,交换芯片的国产替代机遇值得期待;交换芯片的好商业属性塑造稳定的寡头格局,GPU间连接增量空间大而明确、国产空间预计2028年将达到50亿美元,目前以太网方案正成为其主要技术方向,随算力芯片国产化趋势已有配套国产方案落地;目前,龙头收入体量约10亿元,成长空间巨大;建议关注国内以太网交换芯片玩家;此外,基于交换芯片的光互联CPO/NPO环节的国产替代亦值得关注


报告缘起:


大模型训练与推理对卡间高带宽、低时延互联提出更高要求。具备GPU、互联与软件全栈能力的英伟达最早提出并产品化超节点,当前在售主力产品为72卡NVL72,后续有望升级至144卡和576卡;华为则在2025年9月全联接大会上明确了以灵衢协议、UB-Mesh和跨柜全光互联为核心的技术路线,在384卡产品基础上继续推进8192卡Atlas 950与15488卡Atlas 960。我们认为产业拐点会在2027至2028年发生:随着算力芯片性能的提升,超节点渗透率预计将从当前的10%~20%提升至50%~60%;随着NVL576、Atlas960等头部方案的互联速度要求、单柜功耗进一步提升,各环节量价将迅猛增长



必要性:训练侧便利并行计算,推理侧缓解存储带宽瓶颈。


超节点相较于普通服务器增加了高带宽的Scale-up网络、引入“内存池”等机制,能有效提升大模型的训推效率。训练阶段,大规模分布式训练必须引入多种并行策略,张量、序列、专家三种并行策略的通信开销较大;低通信带宽将导致算力芯片空闲,进而影响模型训练的MFU(模型每秒浮点运算次数利用率);因而,超节点的高带宽Scale-up网络能有效提升训练效率。推理阶段,一般情况下的瓶颈环节Decode是访存密集型任务,也即存储是最瓶颈的算力基础设施;我们测算低存储带宽(或容量)已使得Decode环节的MFU低至5%;而超节点的内存直连、内存池化等机制可变相提升有效内存资源,将MFU提升至10%。此外,超节点的优势还在于适配MoE架构,以及其资源池机制能便利多业务场景下的混合负载等。我们预计,超节点将成为训练侧的必然趋势;而推理侧需要探索最优的节点规模以保证推理性价比,目前产业采纳路线的趋势也较为明确。



增量环节:GPU间交换芯片、液冷、柜内电源增长确定性高。


在算力需求提升、超节点趋势明确的大前提下,GPU间交换芯片、液冷、柜内电源将增长:


GPU间交换芯片:Scale-up用量为纯增量。Scale-out路线下,用量依据网络架构相对稳定,容量随着端口速率升级而不断提升(端口800G→1.6T,容量51.2T→102.4T,假设按64端口划分);因而XPU:交换芯片可认为近似21:1且不变(无收敛两层CLOS架构,64端口),ASP根据容量从51.2T的1万美元不断提升。Scale-up路线下,用量视芯片交换容量与XPU通信速率共同决定(交换容量/双向通信速率=XPU:交换芯片),容量视产品方案各不相同;因而可固定交换容量,考虑XPU通信速率的升级以确定XPU:交换芯片,我们预计有望达到4:1、2:1;而ASP则因制造降本而年降。以2028年来看,Scale-up(GPU间)交换芯片空间有望达到1000亿美元(国内50亿美元),整体约为Scale-out的3倍


液冷:高功率下渗透加速且ASP提升。我们基于国产/海外算力年增量预计和超节点形式出货比例预计,通过国产/海外算力方案的单位功率算力(PFLOPS/kW)水平,分别得出国产/海外超节点功率需求;进而基于液冷技术渗透率、价值量假设,得出液冷市场空间;在测算过程中我们充分考虑芯片算力密度升级、液冷技术渗透与升级、超节点渗透等影响因素。以2028年来看,我们测算空间或达到130亿美元


柜内电源:高功率下ASP提升。我们基于国产/海外超节点功率需求,再结合国产/海外的超节点柜内电源价值量,考虑冗余备份,得出市场规模。以2028年来看,我们预测空间或达到240亿美元



交换芯片:商业属性好、空间弹性大、以太网占优,国产替代伊始。


在所有环节中,我们重点推荐交换芯片的国产替代机会。首先,交换芯片优异的商业属性塑造了长期稳定的寡头格局;交换芯片占下游AI数据中心的价值量比例较低(10%左右),作为AI的“运力”核心影响AI服务器的性能表现,客户导入期长达5-7年且客户反馈能指导技术迭代;以以太网交换芯片为例,整体CR3接近80%,参与者长期稳定。其次,超节点趋势下,GPU间交换芯片是确定性最高、弹性最大的增量环节;我们此前测算Scale-up(GPU间)交换芯片需求2028年将达到1000亿美元(国内50亿美元),对比参考,当前以太网交换芯片市场约为80~100亿美元。从技术路径上看,以太网协议由于其标准化、兼容性、成熟性等优势,已经在Scale-out与Scale-up中逐步成为主流方案,后续有望占据较多增量空间。最后,随着算力芯片的国产替代推进,GPU间交换芯片的国产化也成为趋势;近期的阿里云3.2T NPO方案即采用国产以太网交换芯片。整体看,我们认为国内以太网交换芯片玩家将深度受益。



风险因素:


地缘政治风险不确定性;云厂商资本支出不及预期;人工智能ROI提升不及预期;宏观经济滞胀风险;技术路线的不确定性;产业政策的不确定性。



投资策略:


在算力需求不断繁荣、算力芯片出货高速增长的大前提下,超节点方案凭借其在AI训练、推理场景下的优异表现,渗透率正快速提升。我们建议把握两条投资主线:一、超节点方案带来的增量环节,推荐高确定性的GPU间交换芯片及CPO/NPO、液冷、柜内电源。二、超节点方案试图解决的瓶颈问题,低算力(特别是国产算力)和低存力(海内外共同的瓶颈)后续必然需要正面突破,建议关注GPU/ASIC、存储

股票复盘网
当前版本:V3.0