投资要点
Vera Rubin平台定义“Token工厂”,AI旗舰芯片三年指引万亿需求
在GTC大会上,英伟达正式推出Vera Rubin平台,系全新一代AI计算系统,由7种芯片和5种机架系统组成。
1)数量:专为智能体AI时代设计的Vera Rubin平台共40个机柜,5种机柜Rubin计算柜:CPU柜:LPX推理柜:存储柜:CPO交换柜=16:2:10:2:10。LPX柜和CPU柜为优化推理而生,使得每瓦特吞吐量与Token性能得以突破,将催生超高端万亿参数推理服务。
2)性能:Vera Rubin平台从芯片层级重新定义了CPU、存储、网络与安全,通过搭载NVLink 6实现3.6 EFLOPS整机算力,并采用100%全液冷无缆化设计。该平台由Vera CPU机架、基于BlueField-4的STX AI原生存储机架、采用Spectrum-6共封装光学技术的横向扩展,以及与集成230MB片上SRAM的Groq 3 LPX机架深度互联组成,使每兆瓦算力吞吐量提升35倍,打造出一台面向通用智能的革命性AI超级计算机。
3)经济性:Blackwell与Rubin的AI芯片,25-27年底收入预计为1万亿美元,相比去年10月的5k亿美元销售预测,实现翻倍。
LPU:补齐推理时代最关键的低时延解码短板
大模型推理分为Prefill和Decode两个阶段:GPU在前者的矩阵计算中优势显著,但在后者的顺序生成中因难以并行而导致算力利用率下降。Groq 3 LPU正是专门为优化Decode阶段而设计,在Vera Rubin平台中与GPU协同工作。它采用约500MB片上SRAM,提供高达150TB/s的片上带宽,并通过数据流架构将数据留在芯片内高速流动,以大幅降低延迟;其FP8算力达1.2 PFLOPs,集成980亿晶体管,从根本上优化了推理过程中的关键延迟瓶颈。
CPO:从可选技术走向高密度AI网络的必选项
随着Rubin、LPU等高性能芯片规模化应用,超大规模AI集群的数据传输需求激增,传统可插拔光模块在功耗、带宽密度上逐渐触及“物理天花板”,无法匹配兆瓦级“AI工厂”的互连需求,CPO技术应运而生并成为突破瓶颈的关键选择。产品落地方面,大会发布了全球首款量产的Spectrum-X CPO交换机(如Quantum3400)。其将电信号传输距离从厘米级缩短至1毫米以内,能耗仅为传统铜缆的5%,传输损耗降低60%,系统带宽与可靠性大幅提升,适配全液冷机柜的高密度散热需求;产业路线方面,黄仁勋表态“铜和光都会作为选择”,确立“铜缆扩展、光学扩展、CPO扩展”并行推进的路线。这一表态彻底打消了市场对“铜退光进”替代逻辑的忧虑,确立Scale-Out网络采用CPO光互联、Scale-Up网络保留铜缆/背板方案的协同发展格局。
NemoClaw:将OpenClaw推向企业级,标志英伟达跃迁为AI软件基础设施标准制定者
黄仁勋将OpenClaw定义为“个人AI的操作系统”,类比PC时代的Mac/Windows。NemoClaw是英伟达为OpenClaw打造的企业级运行与管理软件栈,提供基于Nemotron模型和OpenShell的安全隔离执行环境,并集成数据隐私与策略控制机制,以提升AI Agent的可靠性与可扩展性。它可部署于GeForce RTX台式机或笔记本、RTX PRO工作站以及DGX系列AI超级计算机,为本地运行的自主化Agent提供全天候计算支持。
投资建议
建议关注:
2)CPO:Himax、AIXTRON、Lumentum、AAOI、易中天、光库科技、仕佳光子等;
3)存储:三星、海力士、美光、闪迪、香农芯创、德明利、佰维存储、时空科技等。
风险提示
技术迭代不及预期、token需求增长不及预期、供应链风险等。


VIP复盘网