中邮·人工智能|GTC 2026：英伟达从“卖芯片”进一步走向“交付AI工厂”

投资要点

Vera Rubin平台定义“Token工厂”，AI旗舰芯片三年指引万亿需求

在GTC大会上，英伟达正式推出Vera Rubin平台，系全新一代AI计算系统，由‌7种芯片和5种机架系统组成‌。

1）数量：专为智能体AI时代设计的Vera Rubin平台共40个机柜，5种机柜Rubin计算柜：CPU柜：LPX推理柜：存储柜：CPO交换柜=16：2：10：2：10。LPX柜和CPU柜为优化推理而生，使得每瓦特吞吐量与Token性能得以突破，将催生超高端万亿参数推理服务。

2）性能：Vera Rubin平台从芯片层级重新定义了CPU、存储、网络与安全，通过搭载NVLink 6实现3.6 EFLOPS整机算力，并采用100%全液冷无缆化设计。该平台由Vera CPU机架、基于BlueField-4的STX AI原生存储机架、采用Spectrum-6共封装光学技术的横向扩展，以及与集成230MB片上SRAM的Groq 3 LPX机架深度互联组成，使每兆瓦算力吞吐量提升35倍，打造出一台面向通用智能的革命性AI超级计算机。

3）经济性：Blackwell与Rubin的AI芯片，25-27年底收入预计为1万亿美元，相比去年10月的5k亿美元销售预测，实现翻倍。

LPU：补齐推理时代最关键的低时延解码短板

大模型推理分为Prefill和Decode两个阶段：GPU在前者的矩阵计算中优势显著，但在后者的顺序生成中因难以并行而导致算力利用率下降。Groq 3 LPU正是专门为优化Decode阶段而设计，在Vera Rubin平台中与GPU协同工作。它采用约500MB片上SRAM，提供高达150TB/s的片上带宽，并通过数据流架构将数据留在芯片内高速流动，以大幅降低延迟；其FP8算力达1.2 PFLOPs，集成980亿晶体管，从根本上优化了推理过程中的关键延迟瓶颈。

CPO：从可选技术走向高密度AI网络的必选项

随着Rubin、LPU等高性能芯片规模化应用，超大规模AI集群的数据传输需求激增，传统可插拔光模块在功耗、带宽密度上逐渐触及“物理天花板”，无法匹配兆瓦级“AI工厂”的互连需求，CPO技术应运而生并成为突破瓶颈的关键选择。产品落地方面，大会发布了全球首款量产的Spectrum-X CPO交换机（如Quantum3400）。其将电信号传输距离从厘米级缩短至1毫米以内，能耗仅为传统铜缆的5%，传输损耗降低60%，系统带宽与可靠性大幅提升，适配全液冷机柜的高密度散热需求；产业路线方面，黄仁勋表态“铜和光都会作为选择”，确立“铜缆扩展、光学扩展、CPO扩展”并行推进的路线。这一表态彻底打消了市场对“铜退光进”替代逻辑的忧虑，确立Scale-Out网络采用CPO光互联、Scale-Up网络保留铜缆/背板方案的协同发展格局。

NemoClaw：将OpenClaw推向企业级，标志英伟达跃迁为AI软件基础设施标准制定者

黄仁勋将OpenClaw定义为“个人AI的操作系统”，类比PC时代的Mac/Windows。NemoClaw是英伟达为OpenClaw打造的企业级运行与管理软件栈，提供基于Nemotron模型和OpenShell的安全隔离执行环境，并集成数据隐私与策略控制机制，以提升AI Agent的可靠性与可扩展性。它可部署于GeForce RTX台式机或笔记本、RTX PRO工作站以及DGX系列AI超级计算机，为本地运行的自主化Agent提供全天候计算支持。

投资建议

建议关注：

1）LPU：沪电股份、胜宏科技、深南电路等；

2）CPO：Himax、AIXTRON、Lumentum、AAOI、易中天、光库科技、仕佳光子等；

3）存储：三星、海力士、美光、闪迪、香农芯创、德明利、佰维存储、时空科技等。

风险提示

技术迭代不及预期、token需求增长不及预期、供应链风险等。