英伟达正式发布Arm PC芯片，黄仁勋台北演讲：计算产业变天了！

2026 年6月1日的台北，再次因为人工智能的巨浪而沸腾。

在今日举行的 NVIDIA GTC 台北 2026 主题演讲上，身着标志性皮衣的 NVIDIA 创始人兼 CEO 黄仁勋登台。黄仁勋表示：“两年前我在台北开始谈论生成式 AI 以及即将到来的 AI 浪潮。而今天我们可以宣告：智能体 AI（Agentic AI）已经真正到来，实用化 AI 已经真正到来。而算力需求将是唯一的限制。”

本次两小时的大会中，黄仁勋的发布要点总结如下：

1.过去六个月，计算机产业已经发生根本变化。Agent 与前沿模型融合，使 AI 终于能够完成真正有用的工作。未来十年，Agentic AI 将成为新的应用模式和计算模式。无论是在云端、本地、PC、机器人、汽车、卫星、基站，还是工厂，这种模式都会不断重复：模型负责思考，harness 负责编排，工具和 skills 负责执行，runtime 负责承载系统。

2.从底层硬件来看，芯片的进化轨迹已经完全被这套模式重塑。黄仁勋解释道，过去的 Grace Blackwell 是为了处理 AI，尤其是推理而打造的；而本次首发的 Vera Rubin 则是为了运行 Agent 而打造的。它不是一颗 GPU，而是一个完整的解耦式、分布式 Agent 处理系统。

3.与此相应，CPU 也要随之改变。过去的 CPU 是为人类设计的，而未来的 CPU 要为 Agent 设计。Agent 没有耐心，Agent 需要低延迟、高带宽、高能效。NVIDIA Vera 正是为此而来。

4.在端侧，PC 同样要改变。Microsoft 和 NVIDIA 正在共同创建新的 PC 产品线，让 Agent 运行在个人电脑、本地工作站和家庭设备中。未来，人们对 PC 的理解，很可能会像智能手机重塑电话一样被彻底改写。

5.在数字世界之外，机器人和自动驾驶汽车同样会改变。Cosmos 3、Alpamayo 2 和 Isaac GR00T 代表了 NVIDIA 在 Physical AI 上的布局：用模型理解物理世界，用仿真生成数据，用参考平台降低开发门槛，让 AI 从数字世界走向真实世界。

6.NVIDIA角色不再是GPU芯片公司。

Agentic AI掀起9万亿美元生产力海啸

通过全球最大开源代码托管平台GitHub 的一组爆发式数据，黄仁勋向外界展示了 Agentic AI 对生产力的恐怖拉动效应：2023年全球代码提交量为 3 亿次；2024年增长至 4 亿次；2025年达到 5 亿次；2026年（仅前几个月）代码提交量已接近 2025 年全年的三倍。

在这背后，是全球约3000万至4000万名专业软件工程师正在全盘接受 AI 智能体的辅助。黄仁勋算了一笔账：全球软件工程师的薪酬总额约为 3 万亿美元，这笔投入间接撬动了全球各行各业约 100 万亿美元的经济产出。而在 Agentic AI 的加持下，这 3 万亿美元的薪酬成本，正在创造出接近 3 倍的产出。“这相当于用 3 万亿美元的薪酬，变相实现了价值 9 万亿美元的惊人生产力提升。” 黄仁勋表示。

这就是 AI 的潜力，也是 AI 的承诺。有人说 AI 会减少工作岗位，这是完全错误的。黄仁勋指出：“很多人在谈论 AI 会减少工作岗位，这完全是无稽之谈。AI 反而促使企业雇用更多的软件工程师。原因非常简单：如果雇用一名工程师能借助 AI 创造出价值 9 万亿美元的生产力，你为什么不多雇几个人呢？”

实用化AI 正在来临。“Token已经变成了能够直接盈利的收入单元。正因其有利可图，AI 公司想要建造更多的 AI 工厂来生成更多 Token，这也是算力需求暴涨、大家的股票都在大涨的根本原因。”黄仁勋表示。

计算时代已经改变，一切都改变了。AI 现在是利润生成器，AI 现在也是 GDP 生成器。而在这一切背后，是一种全新的计算模式。它不只是大语言模型，而是 Agent。今天我们要谈的几乎所有内容，都会围绕这个新计算模式展开。

Agent 是一种新的应用形态。过去，我们有应用程序，有代码，有操作系统，代码运行在应用程序里面。而今天，我们有 Agent。一个 Agent 由一个或多个大语言模型组成，它们运行在一个 harness，也就是编排框架之中，由这个框架来调度它完成生产性工作。

当输入进入 Agent，它需要理解、观察、推理、行动，并使用工具。这个工具可以是电子表格、网页浏览器、数据处理引擎、数据库引擎，也可以是其他计算工具。整个信息流由 harness 进行编排。每一次它处理上下文、理解发生了什么、推理下一步应该做什么、制定计划并执行计划时，背后都有软件在调度这条路径。

所以，本质上这就是 Agent。它会处理短期记忆，也就是 working memory，也会处理长期记忆。就像人类一样，我们有短期记忆和长期记忆。因此，记忆管理系统会变得非常重要。整个系统被称为 Agent。大语言模型负责思考，harness 把所有部分连接起来，就像操作系统一样。这就是新的计算模型。

Agent 可以做非常惊人的事情。真正的突破在于，大语言模型现在已经能够很好地进行思考、推理、规划和使用工具，同时我们也有了能够管理记忆、进行编排、调用工具的 harness。两者结合之后，我们就能做出非常多令人惊讶的事情。

黄仁勋在现场展示了几个极具震撼力的 Prompt（提示词）实例：用户只需用自然语言解释自己的意图（Intent），AI 智能体就能在瞬间调用工具生成极其复杂的 Python 代码，甚至当场生成一个带有 NVIDIA 绿点、台北 101 烟花、GTC Taipei 2026 以及 NVIDIA AI 标志的 GIF 动图。更让人惊叹的是，当黄仁勋提出“我的遥控器电池盖丢了”这一生活痛点时，智能体能迅速调用 CAD 工具，直接生成一个可以直接用于 3D 打印的机器工程文件

“未来计算机的运行方式将彻底改变，”黄仁勋总结道，“我们不再需要复杂的点击和键入，取而代之的是向 AI 阐述我们的意图，由 AI 智能体来生成代码或操作工具。”这就是 Agentic AI。过去两年我们一直在朝这个方向建设，现在它已经到来。

这是软件公司的绝佳时代

有些人说，Agentic AI 来了，所以软件公司都会倒闭。黄仁勋给出了完全相反的论调。“我认为恰恰相反，这正是一个成为软件公司的绝佳时代。NVIDIA 真正的宝藏是我们的 CUDA-X 函数库。现在，我们能够将这些 CUDA-X 库直接交付给 AI 智能体，它们调用这些工具的效率甚至比人类还要高。”

20 年前，我们构建了 CUDA，这是一个面向加速计算的统一架构。我们重新定义了计算。今天，超过一千个 CUDA-X 库正在帮助开发者在科学和工程的各个领域实现突破。CUDA-X 库将成为 Agent 的工具，比如用于计算光刻的库，用于决策优化的 cuOpt，用于直接稀疏求解的 cuDSS，用于在结构化和非结构化文档中进行深度研究的 AI-Q，用于 AI-RAN 的相关库，以及面向物理、经济学等不同领域的计算库。它们的基础都是算法。

Agent 由模型、harness、工具、技能和 runtime 构成。所有这些部分都运行在数据中心的不同位置。你可以把模型看作大脑，把 harness 看作身体，把工具运行的 runtime 看作工作间。就像一个人在工作间里使用工具工作。当然，在 AI 场景下，这一切都以极大的规模发生。

其中每一个步骤都运行在计算机的不同部分。大语言模型在进行思考、上下文处理、观察、理解环境、推理、制定计划，并执行计划。每一次发生这样的过程，整整一个 Grace Blackwell NVL72 机架都会被激活。大语言模型负责思考；每当它使用工具时，CPU 就会参与。这个工具可能是 C 编译器，可能是 Python，可能是 JavaScript，也可能是加速计算

今天的 Agent 还只是相对简单的工具使用者。明天，它们会成为非常复杂的工具使用者。这就是为什么我刚才展示的 CUDA-X 库会变得极其受 Agent 欢迎。它们能够解决世界上一些最重要的问题。我们的 CUDA-X 库也会配套 skills，也就是让 AI 学习如何使用这些库的说明。某种意义上，这就是一本手册，AI 读完之后就会明白：原来应该这样使用它。

Agent 使用这些库的能力会非常强大。工具会运行在 CPU 和 GPU 上，大语言模型负责思考，安全 harness 会运行在 CPU 和名为 DPU 的安全处理器上，也就是 NVIDIA BlueField。整个系统的编排运行在 CPU 上。CPU 负责调度所有工作，这就是完整的 harness。

其中最难的部分之一是记忆。工作记忆就是 KV cache。问题不仅是记住什么，还包括如何压缩、如何整理、如何检索。你要检索的是结构化数据，还是非结构化数据？这些数据之间的本体关系是什么？它们彼此之间有什么关联？整个处理过程极其复杂。AI 的记忆系统，将彻底改变存储系统

这种计算模型、这种计算模式、这种叫作 Agent 的新应用，在每一个方面都和过去的应用运行方式完全不同。过去是大量软件打包成二进制文件，运行在操作系统里。而现在，这是一个解耦的、分布式的、异构计算问题。也正因为如此，我们构建了下一代系统：Vera Rubin。

Vera Rubin不是一颗芯片，

而是为Agent打造的系统

在这场演讲中，最重要的硬件主角之一便是Vera Rubin。

黄仁勋在现场极其严谨地纠正了市场对下一代产品的认知：“Vera Rubin不是一颗芯片。Vera Rubin 也不只是一个GPU。它是一个从端到端解耦、分布式且异构的超大规模系统，它包含 GPU、Vera Rubin NVLink 72，由 Vera CPU 进行编排，还包括革命性的存储系统、ConnectX-9、DOCA 软件栈，以及内部的安全处理器。

黄仁勋说，Vera Rubin是NVIDIA 历史上最具雄心的工程之一，有6 万亿个晶体管，采用台积电3nm工艺与领先的 CoWoS 封装。整个公司超过 4 万名工程师都参与其中，中国台湾的供应链也深度参与了这一系统的建设。

从 Grace Blackwell 到Vera Rubin，NVIDIA 的系统尺度进一步扩大。Grace Blackwell NVL72 面向推理和机架级 AI 超级计算，而 Vera Rubin则被定位为面向 Agentic AI 的多机架、POD 级系统。

演讲中提到，Vera Rubin NVL72 是一个没有线缆、没有软管、没有风扇的液冷系统。过去需要大量线缆连接的部分，现在通过中间的 PCB 完成连接。过去需要约 2 小时完成的装配，如今只需要 5 分钟。这不仅提升了制造吞吐，也大幅提高了系统可靠性和韧性。

在现场展示中，黄仁勋介绍了 Vera Rubin NVLink 72、Groq LPX、Vera CPU Rack、Vera BlueField 存储处理系统，以及 Mellanox 网络系统。他强调，这些系统共同构成了一个面向 AI Agent 的超级计算机。

其中，Vera Rubin NVL72 负责高吞吐 Token 生成，Groq LPX 则面向极低延迟推理；BlueField-4 负责存储处理、安全和内存访问；Spectrum-X Ethernet 则承担横向扩展网络任务。它们共同构成一个解耦、分布式、异构的 Agentic AI 基础设施

黄仁勋说，这正是 NVIDIA 所谓的“extreme co-design”——极致协同设计

黄仁勋在现场高调展示了全球首款搭载200Gbps光电共封装（CPO，Co-Packaged Optics）技术的以太网交换机原型。

该产品集成了台积电最前沿的 COUPE 芯片级光电封装工艺。

目前Vera Rubin已经全面量产。微软和戴尔已率先部署了其工程样机

算力就是收入，发布DSX AI工厂平台

世界正在竞相建设 AI 工厂，这是人类历史上最大规模的基础设施建设。随着计算模型跃升至智能体级别，数据中心已经演变为工业规模的“AI 工厂”。黄仁勋指出，如今吉瓦（Gigawatt）级别的 AI 工厂建造成本已经从过去的 200 亿~300 亿美元，暴涨至 800 亿~1000 亿美元。

“面对如此恐怖的资本投入与复杂性，AI 工厂必须在开机的第一时间就完美运转。”为此，NVIDIA推出了与消费级 RTX、超算系统 DGX 并列的全新基础设施级蓝图——NVIDIA DSX。用于帮助客户设计、仿真、建设和运营 AI 工厂。通过 Omniverse 和 DSX，合作伙伴可以在真正动工之前，就完成 AI 工厂的布局、电力、冷却、网络和系统集成验证；在工厂运行之后，再通过软件系统进行配置、监控、调度和优化

下图展现了DSX AI工厂的生态。在黄仁勋看来，AI 工厂是人类历史上最大规模的基础设施建设之一。芯片、机架、网络、电力、冷却和电网必须从端到端协同设计。黄仁勋表示，正因为我们在整个技术栈上，包括系统和软件，都做了这些工作，我们才能帮助很多原本很小的公司成长为世界级 AI 云服务商。在会上，他列举了CoreWeave、Nebius、Nscale、韩国的Naver Cloud、印度的Yotta、中国台湾的GMI等等

“在今天，Token就是收入，算力就是利润。缺乏算力和利润，带来的就是巨额亏损。当你建造一个耗资 500 亿、600 亿乃至 1000 亿美元的吉瓦级 AI 工厂时，资本成本和复杂性是极其恐怖的，它必须在开机的第一时间就完美运转。”

“如果你的数据中心拥有 1 吉瓦的电力，1 吉瓦就是你的绝对物理上限，你无法发更多的电。在这种情况下，每瓦特带来的吞吐量就是你的全部收入。仅仅因为芯片便宜就选择错误的架构是完全站不住脚的。你真正需要看的是‘每瓦特产生的代币数量（Tokens per Watt）’以及‘每瓦特带来的营收’——在英伟达的架构里，买得越多，赚得越多（The more you buy, the more you make）。”

“AI 软件技术演进极快。六年前 Ampere 时代我们在谈 CNN（卷积神经网络），四年前 Hopper 时代我们在谈 Transformer，随后是混合专家模型（MoE），而现在每隔几个月软件界就会甩出全新的智能体系统（Agentic Systems）。如果你的硬件架构不够灵活，生态系统不够丰富，你根本无法预测你的系统能用多久。而全球的软件开发者，生命周期都是从 NVIDIA CUDA 开始的，这意味着 NVIDIA 算力资产的useful寿命会更长，整体拥有成本（TCO）更低。”

凭借这种全栈集成与极速的代码协同设计，NVIDIA 帮助客户极大地缩短了“首次推理时间”与“首字延迟（Time to First Token）”。黄仁勋在现场列举了一大批由于接入英伟达算力栈而实现估值暴涨或业务飙升的区域型、全球型 AI 云服务商与企业客户：包括估值已达 500~700亿美元的 CoreWeave、高速增长的Nebius、代码工具Cursor、新加坡AI Singapore、印尼Indosat，以及中国台湾的GMI Cloud。

Vera CPU成为智能体时代的“顶级指挥家”

在 Vera Rubin 之后，黄仁勋重点介绍了 Vera CPU。

“过去二十年里，全球所有的CPU都是为了人类设计的，”黄仁勋一针见血地指出传统架构的逻辑，“我们作为使用者，习惯了以秒为单位的延迟，习惯了在云端按核租用算力。但 AI 智能体毫无耐心，它们生活在纳秒级的世界里。”

但 Agent 完全不同。“Agents are impatient。（Agent 是没有耐心的。）”

在 Agentic AI 时代，黄仁勋提出了一个全新的行业比喻：“CPU 是指挥家（Conductor），GPU 是管弦乐队（Orchestra）。”

为了解决 CPU 这一阻碍 Token 吞吐量的瓶颈，NVIDIA 从零开始重构，打造了这款专为智能体loop量身定制的自研芯片——NVIDIA Vera CPU。

Vera CPU 彻底抛弃了传统 CPU 的诸多设计惯例，它关注的不只是核心数量，而是低延迟、单线程性能、每核心带宽、总体带宽和能效。

具体而言，Vera CPU使用 NVIDIA Olympus Core，并通过第二代可扩展一致性互连 fabric 将 88 个 Olympus 核心连接在一起。核心不会被拆分到多个 chiplet 中，因此核心之间通信速度比传统 CPU 更快。它还支持 PCIe Gen 6、LPDDR5X 内存，内存带宽达到每秒 1.2TB，内部 fabric 带宽达到每秒 3.6TB。

在性能上，演讲提到 Vera 相比 x86 CPU，峰值内存延迟降低 40%，核心到核心通信快 50%，Agentic Sandbox 性能达到 x86 CPU 的 1.8 倍。黄仁勋特别强调，在 CPU 领域，能够提升 5% 已经非常困难，提升 10% 已经非常惊人，而 Vera 在真实工作负载上实现数倍级提升，是极其罕见的。

在全栈极端协同设计的加持下，Vera CPU 兑现了令人难以置信的性能跃升：在智能体沙盒性能上，它轻松跑出了 1.8 倍于 X86 的成绩；而在企业级刚需的 SQL 数据库运行上，Vera 的速度暴涨 3 倍。在实时流数据处理上，在与纽约证券交易所（NYSE）的深度合作中，面对洪峰般涌入的金融遥测数据，Vera CPU跑出了6倍于传统架构的吞吐量。

黄仁勋指出，真正令人兴奋的是，几乎所有人都在支持 Vera。Vera 正在打开一个全新的市场。Agent 是一种新的工作负载。过去我们为人类构建 CPU，现在我们需要为 Agent 构建 CPU。我们正在制造数以百万计的 Vera CPU。台湾的 ODM 厂商、计算机制造商，以及所有 OEM 厂商，都会与我们一起把它推向市场。你可以看到，早期采用者正是那些 Agent 公司。

它不会取代旧市场，但这是一个新市场：面向 Agent 的 CPU。而且这个市场一定会比上一个市场更大。原因是，未来 Agent 的数量会远远超过人类，而且 Agent 非常没有耐心。

“在 Grace Blackwell 时代，行业曾认为从 X86大换血到 ARM架构的 Grace 是极度危险的一跃，”黄仁勋在台上坦言，“但我们以完美的执行力完成了这个转折。如今，随着数以百万计的 Vera 芯片随 Rubin 系统一起铺向全球，NVIDIA 事实上已经演变成了全球最大的 CPU 制造商之一。”

企业 AI工具包：

每家公司都将成为Agent公司

“任何一家企业要想进入智能体时代，必须集齐四样东西：模型、编排框架（Harness）、工具技能库（Tools），以及作为灵动核心的操作系统——运行时（Runtime）。”黄仁勋指出。这套组合就是现代企业的新操作系统。

对此，NVIDIA 推出了面向企业 AI 的 Agent Toolkit，其中包括开放模型、可运行 Agent 的 harness、CUDA-X 工具库，以及 OpenShell runtime。OpenShell 用于保护 Agent，让它遵守安全策略，保护隐私，管理权限和身份，并可以在云端、本地环境以及设备端运行。

在黄仁勋看来，每家公司未来都会运行 Agent，每家公司都会成为 Agent 公司。Agent 会需要自己的操作系统，而企业会需要一整套安全、可控、可扩展的 Agentic AI 技术栈。

在会上，黄仁勋介绍了与EDA 巨头Cadence 联合打造的芯片设计超级智能体。

传统的芯片设计与验证是一场近乎疯狂的微观工程：数万亿个晶体管、复杂的 3D 封装、无容错率的硅片仿真，英伟达每年都要为此烧掉数十亿的计算时数。而通过 Cadence 超级智能体的介入，其内部由 Codex 负责宏观编排，利用英伟达原生 Nemotron 3 Ultra 模型驱动，直接对架构规格书与 RTL 代码进行自驱动的“验证-纠错”闭环。

这一重构，让曾经需要数周才能跑完的芯片验证与Debug流程，只需要数小时内就可以完成，验证效率暴增 40倍。黄仁勋在现场兴奋地表示：“英伟达目前有数千名芯片设计师。接下来，我们将‘雇佣’数十万个 Cadence 超级智能体来和我们一起工作，去设计更加野心勃勃的半导体架构！”

而作为这一生态的基石，现场首发了Nemotron 3 Ultra开源大模型。它是全球首款采用 SSM（状态空间模型）与 MoE（混合专家模型）混合架构的前沿大模型。在展现卓越的长考与推理能力的同时，其运行速度比同级别前沿开源模型快 5 倍，总体推理成本（Flops & TCO）直接便宜了 30%。更展现英伟达开源诚意的是，他们不仅开源了模型本身，还一并向全球开发者开放了全部训练脚本以及极其珍贵的长周期工具调用数据集。

黄仁勋强调，NVIDIA 不只提供模型，还会提供训练模型所用的数据、训练脚本和相关方法。这是 NVIDIA 开放模型策略的一部分：让企业可以拿走模型，加入自己的数据和知识，把它变成自己的专有 Agent。

联手微软、联发科重塑 PC 40年版图：

RTX Spark PC芯片

在数据中心和企业AI之后，黄仁勋把话题转向 PC。

今天的手机，最不常做的事情反而是打电话。它已经和过去的电话完全不同。未来十年的 PC，也会和今天这种“启动应用、点击、输入”的工具完全不同。

他认为，40 年前 Windows 95 让 PC 真正个人化，把 PC 从企业带进消费者市场，使其成为每个人都应该拥有的设备。40 年后，Microsoft 和 NVIDIA 正在重新发明 PC。

在本次会上，黄仁勋亮出了与微软历时三年悉心打磨、旨在彻底颠覆 Windows 40 年软件形态的核弹级大杀器——NVIDIA RTX Spark PC 生态芯片。RTX Spark把 NVIDIA 过去 33 年积累的软件和硬件能力浓缩到一颗芯片中。该芯片由 NVIDIA 与 MediaTek合作打造，它拥有 RTX GPU，提供 1 PFLOP AI 性能；集成了20核基于 Arm架构的 NVIDIA Grace CPU（包含10个 Arm Cortex-X925 核心和 10 个 Arm Cortex-A725核心）；拥有 128GB 统一内存；采用台积电 3 纳米制程，共有700 亿晶体管。

依托 100%兼容 Windows 驱动与 CUDA 栈的特性，这一芯片让 PC 首次具备了无电网和延迟焦虑、全天候 24 小时在本地运行“主权智能体沙盒”的能力。在现场播放的建筑设计演示中，本地智能体可以通过 OpenShell 驱动 Rhino、Blender 和 Flux 2 等工具，自动完成地形修改、室内排布与照片级光追渲染，并能自主发现并修正图纸错误。

Adobe 也加入了这一生态。黄仁勋提到，Adobe 重新设计了 Photoshop 和 Premiere 的核心架构，并针对 RTX Spark 发布，速度提升 2 倍。同时，Adobe 通过 MCP Server 让应用可以和笔记本上的 Agent 交互，使其变成 Agent 友好的创作工具。

但 RTX Spark 只是开始。Microsoft 和 NVIDIA 正在推出一整条全新的 PC 产品线，覆盖桌面电脑、笔记本电脑和工作站，全部 100% 兼容 Windows，100% 支持 CUDA，100% 支持 NVIDIA AI Tensor Core。

除了搭载 RTX Spark 的主流笔记本电脑，英伟达还联合微星（MSI）等厂商推出了具备全屋智能指挥官属性的桌面级 Desktop，以及专门面向大模型开发者、能在桌面上直接啃下“万亿参数大模型”的终极怪兽——DGX Station for Windows 工作站，它具备 768GB 统一内存、20 Petaflops 算力和高达 8 TB/s 的逆天内存带宽。

黄仁勋甚至设想，未来每一个家庭都会像拥有家庭影院和游戏机一样，拥有一台本地的 AI 超级计算机，它将更像《星球大战》里的 R2-D2 或 C-3PO，成为真正有血有肉的数字伴侣。

自动驾驶与人形机器人进入 Agent 时代

演讲的最末尾，黄仁勋将目光投向了物理 AI（Physical AI）与具身智能。

随着Agentic AI 从数字世界走向物理世界，黄仁勋认为，Agentic AI 本质上就是一种数字机器人。它能够理解、推理、规划、行动并使用工具。而这种计算模式不仅会运行在云端、PC 和企业内部，还会进入机器人、自动驾驶汽车、卫星、基站、工厂、农业设备、制造设备和重工业设备。未来会有数百亿甚至数千亿个Agentic System 会运行在世界各地。

但物理 AI 最大的问题是数据。语言模型可以从互联网上学习人类写下的语言数据，因为这些数据来自人类视角。但机器人需要的是从机器人视角出发的物理世界数据，而世界上大多数视频数据都是第三人称视角，不是机器人第一人称视角。

因此，Physical AI 的核心难题是如何获取、生成和转换物理世界数据。NVIDIA的路径是从 teleoperation，也就是人类遥操作示范开始，再进入 Omniverse 仿真，通过仿真和可验证奖励引导模型学习。最终，系统能够从第三人称视频中学习，并重新投影为第一人称视角，从而获得能够从任意视角理解物理世界的 World Foundation Model。

在此基础上，NVIDIA发布Cosmos 3。Cosmos 3 被定位为 Physical AI 的前沿开放模型。它基于Mixture of Transformers 架构，能够处理像素、动作、声音和语言。自回归 Transformer 负责推理、规划和指导，扩散 Transformer 负责生成接下来会发生的内容。

作为 VLM，Cosmos 可以观察物理世界、理解正在发生什么、描述场景并标记关键信息；作为 World Model，它可以从图像、文本或视频生成符合物理规律的合成视频；作为仿真器，它可以为机器人策略训练和评估提供闭环环境；作为 World Action Model，它可以感知、推理、规划并生成动作。

作为 Cosmos 3 技术的具身延伸，NVIDIA 还在现场发布了全球首款具备原生“推理/长考能力”的第二代自动驾驶大模型——Alpamayo 2。

在现场与梅赛德斯-奔驰的实车联动演示中，搭载 Alpamayo 2 的车辆表现出了像人类司机一样的自主思考与碎碎念式的连续逻辑推理能力。黄仁勋在最后披露了一组足令汽车半导体同行窒息的生态数字：目前，全球签约并正在基于 NVIDIA Hyperion 算力平台与 Kalos 车载操作系统构建汽车的传统与新势力车企，已经直接占到了全球汽车总产量的 80%；同时，全球高达 97% 的智能移动出行服务商，均已完成了与英伟达端到端智能车生态的深度锚定。

在物理 AI（Physical AI）的最前沿，黄仁勋正式发布了专为人形机器人打造的通用基座大模型与全栈参考平台——NVIDIA Isaac GR00T。

“开发通用人形机器人是当今 AI 领域最复杂的挑战之一，”黄仁勋在现场表示。

NVIDIA Isaac GR00T 覆盖模型、数据生成、仿真、runtime 和操作系统。黄仁勋强调，不论是云端 Agent、PC Agent、自动驾驶汽车，还是人形机器人，本质上都遵循同一种计算模式：模型、harness、工具、skills 和 runtime。

Isaac GR00T 参考人形机器人平台，面向高校和研究机构提供完整集成的开发平台。演讲中提到，这个平台双手每只手有 25 个自由度，整台机器人有 31 个自由度，身高约 6 英尺，体重约 150 磅，运行新的 Thor 计算平台，并集成 NVIDIA 的数据生成、仿真、训练和部署软件栈。

写在最后

所以，这场演讲的真正主题，可以说是 NVIDIA 对下一代计算产业的系统性重构。在这个新世界里，Token 是收入单位，算力是产能，AI 工厂是新的工业基础设施，Agent 是新的应用形态，PC 会变成个人 AI 计算机，机器人会成为 Physical AI 的载体。

黄仁勋最后感谢了台湾生态，也感谢了所有供应链伙伴。

从 GPU，到系统，再到 AI 工厂；从云端，到 PC，再到机器人和物理世界，NVIDIA 正在把自己的角色推向一个更大的位置。它不再只是卖芯片，也不只是卖服务器，而是在试图定义 AI 时代的计算基础设施。