科技｜超节点：AI训推大势所趋，关注三大增量环节

超节点将多张加速卡通过高带宽、低时延的Scale-up网络紧密连接，并提供内存池化、内存直连等机制，极大提升了AI训推效率，已经成为明确产业趋势。随着英伟达等厂商推动超节点提效扩容，GPU间交换芯片、液冷、柜内电源环节将分别受益于Scale-up纯增量用量、机柜高功率推动的渗透率与ASP提升、机柜高功率推动的ASP提升，实现增长；我们预计2028年增量空间将分别达到1000、130、240亿美元。其中，交换芯片的国产替代机遇值得期待；交换芯片的好商业属性塑造稳定的寡头格局，GPU间连接增量空间大而明确、国产空间预计2028年将达到50亿美元，目前以太网方案正成为其主要技术方向，随算力芯片国产化趋势已有配套国产方案落地；目前，龙头收入体量约10亿元，成长空间巨大；建议关注国内以太网交换芯片玩家；此外，基于交换芯片的光互联CPO/NPO环节的国产替代亦值得关注

▍报告缘起:

大模型训练与推理对卡间高带宽、低时延互联提出更高要求。具备GPU、互联与软件全栈能力的英伟达最早提出并产品化超节点，当前在售主力产品为72卡NVL72，后续有望升级至144卡和576卡；华为则在2025年9月全联接大会上明确了以灵衢协议、UB-Mesh和跨柜全光互联为核心的技术路线，在384卡产品基础上继续推进8192卡Atlas 950与15488卡Atlas 960。我们认为产业拐点会在2027至2028年发生：随着算力芯片性能的提升，超节点渗透率预计将从当前的10%~20%提升至50%~60%；随着NVL576、Atlas960等头部方案的互联速度要求、单柜功耗进一步提升，各环节量价将迅猛增长。

▍必要性：训练侧便利并行计算，推理侧缓解存储带宽瓶颈。

超节点相较于普通服务器增加了高带宽的Scale-up网络、引入“内存池”等机制，能有效提升大模型的训推效率。训练阶段，大规模分布式训练必须引入多种并行策略，张量、序列、专家三种并行策略的通信开销较大；低通信带宽将导致算力芯片空闲，进而影响模型训练的MFU（模型每秒浮点运算次数利用率）；因而，超节点的高带宽Scale-up网络能有效提升训练效率。推理阶段，一般情况下的瓶颈环节Decode是访存密集型任务，也即存储是最瓶颈的算力基础设施；我们测算低存储带宽（或容量）已使得Decode环节的MFU低至5%；而超节点的内存直连、内存池化等机制可变相提升有效内存资源，将MFU提升至10%。此外，超节点的优势还在于适配MoE架构，以及其资源池机制能便利多业务场景下的混合负载等。我们预计，超节点将成为训练侧的必然趋势；而推理侧需要探索最优的节点规模以保证推理性价比，目前产业采纳路线的趋势也较为明确。

▍增量环节：GPU间交换芯片、液冷、柜内电源增长确定性高。

在算力需求提升、超节点趋势明确的大前提下，GPU间交换芯片、液冷、柜内电源将增长：

GPU间交换芯片：Scale-up用量为纯增量。Scale-out路线下，用量依据网络架构相对稳定，容量随着端口速率升级而不断提升（端口800G→1.6T，容量51.2T→102.4T，假设按64端口划分）；因而XPU:交换芯片可认为近似21:1且不变（无收敛两层CLOS架构，64端口），ASP根据容量从51.2T的1万美元不断提升。Scale-up路线下，用量视芯片交换容量与XPU通信速率共同决定（交换容量/双向通信速率=XPU:交换芯片），容量视产品方案各不相同；因而可固定交换容量，考虑XPU通信速率的升级以确定XPU:交换芯片，我们预计有望达到4:1、2:1；而ASP则因制造降本而年降。以2028年来看，Scale-up（GPU间）交换芯片空间有望达到1000亿美元（国内50亿美元），整体约为Scale-out的3倍。

液冷：高功率下渗透加速且ASP提升。我们基于国产/海外算力年增量预计和超节点形式出货比例预计，通过国产/海外算力方案的单位功率算力（PFLOPS/kW）水平，分别得出国产/海外超节点功率需求；进而基于液冷技术渗透率、价值量假设，得出液冷市场空间；在测算过程中我们充分考虑芯片算力密度升级、液冷技术渗透与升级、超节点渗透等影响因素。以2028年来看，我们测算空间或达到130亿美元。

柜内电源：高功率下ASP提升。我们基于国产/海外超节点功率需求，再结合国产/海外的超节点柜内电源价值量，考虑冗余备份，得出市场规模。以2028年来看，我们预测空间或达到240亿美元。

▍交换芯片：商业属性好、空间弹性大、以太网占优，国产替代伊始。

在所有环节中，我们重点推荐交换芯片的国产替代机会。首先，交换芯片优异的商业属性塑造了长期稳定的寡头格局；交换芯片占下游AI数据中心的价值量比例较低（10%左右），作为AI的“运力”核心影响AI服务器的性能表现，客户导入期长达5-7年且客户反馈能指导技术迭代；以以太网交换芯片为例，整体CR3接近80%，参与者长期稳定。其次，超节点趋势下，GPU间交换芯片是确定性最高、弹性最大的增量环节；我们此前测算Scale-up（GPU间）交换芯片需求2028年将达到1000亿美元（国内50亿美元），对比参考，当前以太网交换芯片市场约为80~100亿美元。从技术路径上看，以太网协议由于其标准化、兼容性、成熟性等优势，已经在Scale-out与Scale-up中逐步成为主流方案，后续有望占据较多增量空间。最后，随着算力芯片的国产替代推进，GPU间交换芯片的国产化也成为趋势；近期的阿里云3.2T NPO方案即采用国产以太网交换芯片。整体看，我们认为国内以太网交换芯片玩家将深度受益。

▍风险因素：

地缘政治风险不确定性；云厂商资本支出不及预期；人工智能ROI提升不及预期；宏观经济滞胀风险；技术路线的不确定性；产业政策的不确定性。

▍投资策略：

在算力需求不断繁荣、算力芯片出货高速增长的大前提下，超节点方案凭借其在AI训练、推理场景下的优异表现，渗透率正快速提升。我们建议把握两条投资主线：一、超节点方案带来的增量环节，推荐高确定性的GPU间交换芯片及CPO/NPO、液冷、柜内电源。二、超节点方案试图解决的瓶颈问题，低算力（特别是国产算力）和低存力（海内外共同的瓶颈）后续必然需要正面突破，建议关注GPU/ASIC、存储