英伟达All in的物理AI路线，居然是中国黑马提前一年就定义好了

【新智元导读】当全球具身智能行业还在争论技术路线时，一家中国公司已经率先定义并跑通了自己的答案。深度机智提出的「人类学习」路线——以人类数据为起点、动作建模为中心、机器人为 AI 而生——正在被英伟达、Physical Intelligence 等海外头部机构沿同一方向跟进。成立仅一年，数据、模型、本体、场景全线落地，核心布局节奏领先美国同类项目近一年。

具身智能行业眼下最大的不确定性，在路线层面。

过去两年，行业在 VLA 端到端、仿真训练、遥操作三条路线上各有押注，每家都在大量投入，但谁也不确定哪条能走到终点。

数据从哪来、模型学什么、机器人怎么造——不同团队给出的答案截然不同。

而路线一旦选错，前期积累的数据、模型和硬件可能全部推倒重来。

在这个赛道，路线选择的权重，可能超过任何单点技术的突破。

2024 年 11 月，深度机智（DeepCybo）创始人陈凯在行业内率先提出了「人类学习」原创技术路线。

这条路线的野心远不止于换一种数据采集方式——它试图以人类认知和行为模式为蓝本，重新组织具身智能的整个技术栈：数据怎么采、模型怎么训、机器人怎么造，三者围绕同一套逻辑协同设计。

短短一年多时间内，英伟达 GR00T 体系、Physical Intelligence π 系列、Generalist AI GEN-1 陆续沿相似方向布局。

全球头部机构正在验证同一个判断——而深度机智是最早做出这个判断、并且最早完成全栈落地的团队。

一条路线：源于人，超越人

理解深度机智，首先要区分两件事：「用人类数据训练机器人」是一种技术手段，「人类学习」是一套完整的技术范式。

前者只解决数据来源问题，后者重新定义了数据、模型和硬件三者之间的关系。

当前具身智能的数据困境，是理解这条路线价值的起点。

训练大语言模型时，互联网上有数万亿 Token 的现成文本可直接使用。

机器人没有这样的数据矿藏——人怎么拿杯子、开抽屉、打鸡蛋，这些动作每天发生无数次，却从未被系统性数字化。

主流的遥操作采集产能极低，一人一机一天不过几小时有效数据；

仿真数据成本低但存在 Sim2Real Gap，到了真实环境性能大幅折损。

深度机智的选择是直接从人类日常操作中采集第一视角数据。

但这只是路线的第一层，更关键的是后面两层：

模型要能从人类视频中提取出物理常识、空间结构和交互规律，再「翻译」成机器人可执行的动作指令——这要求模型具备深层的物理世界理解能力；

而机器人本体也要为此专门设计，比例和自由度贴近人体，以最大化人类数据的迁移效率。

2025 年 10 月，深度机智发布《源于人超越人》通用具身智能路线图，将这套逻辑概括为三位一体战略：Human-Centric Data（人类数据为起点）、Action-Centric Modeling（动作建模为中心）、Robot for AI（机器人为 AI 而生）。

三者协同设计，构成一条完整的技术范式，而非三个独立模块的简单拼接。

全栈落地：数据、模型、本体三线并进

路线图的说服力在于落地速度。

深度机智成立仅一年，已完成数据、模型、本体三条线的全栈技术落地，核心布局节奏领先美国同类项目近一年。

数据基建

数据是物理 AI 迭代的核心燃料。深度机智从硬件、范式、数据集三个维度，搭建了完整的第一视角数据基建体系。

深度机智自研的分体式第一视角感知采集方案，早在去年 6 月就完成定型落地，布局节奏领先美国 Scale AI 同类同质方案近一年。

比数据规模更关键的是数据范式。

首创 ICDC 情境数采范式，在真实场景中记录人与世界交互的时空经验，并通过自动化的数据转化管道，将真实世界中的人类行为转化为可被模型学习的时空经验。

在此基础上，构建了 DeepAct 第一视角多模态数据体系，整体规划早于英伟达 EgoScale 项目。

目前数据规模已达到数十万小时级，并正在向更大规模真实世界数据基础设施推进。

基座模型

深度机智的目标不是训练一个只会执行单一任务的机器人策略，而是构建面向物理世界的具身智能基座模型。

围绕「动作建模为中心」的核心战略，深度机智打造了多维度协同的模型技术矩阵，在七大国际权威评测中全面领跑。

2026 年 3 月，深度机智在中关村论坛全球首发 PhysBrain 1.0 具身通用智能基座体系，围绕物理世界理解、空间关系建模和连续动作生成进行训练。

发布时间比美国 Generalist AI 的 GEN-1 早一周，核心技术框架被 Physical Intelligence 旗下前沿模型 π0.7 公开引用。

模型层面最具说服力的进展是 Zero-shot 泛化验证：机器人在未针对特定物体或任务做过专项训练的情况下，仅凭人类数据预训练获得的能力，在真机上完成了自主操作。

这是国内首次在全自研技术体系下，验证纯人类数据从模型训练到真机执行的完整路径——人类数据不仅能帮机器人「理解世界」，更能直接转化为执行能力。

硬件本体

遵循「机器人为 AI 而生」的设计哲学，深度机智从结构比例、自由度配置到控制逻辑，全部为 AI 模型的数据迁移量身设计。

2025 年 9 月发布的 Prime 是全球首款工业级可自主站立的全自由度拟人体机器人，已实现纯人类数据驱动、零真机微调的技术路径，在世界范围内率先跑通 Robot for AI 的技术闭环。

围绕不同场景需求，公司进一步拓展产品矩阵，公司还推出了面向精细操作的轮式双臂机器人 Prime U，以及面向教育和开发者的 3D 打印轻量化机器人 Prime Lite。

三条线单独看各有别家在做，但三者围绕同一条技术路线做协同设计、并完整跑通从数据到模型到真机的闭环——深度机智是国内最早做到这一点的团队。

深度机智全尺寸拟人体机器人：Prime

进入真实场景

全栈能力的价值在于技术成果能快速转化为场景落地，而非仅仅停留在实验室 Demo。

深度机智目前在两类场景持续推进。

一类是高价值科研场景：全自由度拟人体机器人已进入真实的生物科学实验室，围绕柔性操作和精密实验流程做验证，面向 AI 自主科学发现方向探索。

合作方包括中国科学技术大学多学科无人实验室、香港首个全栈具身智能实验室，以及海内外多所顶尖高校与科研机构。

另一类是教育与开发者场景：Prime Lite 已进入北京市十一学校和中关村学院等课堂，覆盖从结构设计、3D 打印、本体拼装到模型训练部署的完整教学链路，教育方案还实现了出海，进入澳大利亚等海外市场。

商业化方面，深度机智坚持「克制又灵活」的节奏——核心资源集中在基座模型的长期建设上，研发过程中沉淀的技术成果同步推向市场验证。

截止目前数采设备及方案、教育机器人、人形机器人及其遥操作系统等全产品线均已实现订单落地，累计签约金额达数千万元。

融资方面，深度机智近期再获数亿元融资，由国寿长三角科创基金领投，老股东普华资本、诚通科创基金持续加注，蓝湖资本、博彦科技、磐谷创投、朝晖资本、财鑫资本、道禾长期投资、易高资本、明德资本等多方资本参与。

凭借其前瞻的技术路线与扎实的落地兑现能力，本轮融资受到数十家机构高度关注与参与。

据悉，下一轮融资已进入收尾阶段。

先发一步的意义

具身智能的范式之争远未尘埃落定。

Transformer 论文到 ChatGPT 之间隔了五年，具身智能面对的物理世界复杂度远超数字世界，路线从提出到规模化兑现的周期只会更长。

深度机智自身也将当前阶段定义为「从技术验证走向系统性验证」。

全球竞争格局中，英伟达、Physical Intelligence、Genesis AI、Generalist AI 都在类似方向投入重兵，算力和生态资源远比中国创业公司充裕。

深度机智先发近一年，宝贵的时间差能形成多深的护城河？

先发一步的优势是具体的：早一年出发意味着早一年踩坑、早一年积累工程经验、早一年让数据飞轮转起来。

而深度机智真正的壁垒，不止于先发一年的时间差，更是全栈协同带来的复合放大效应：当数据、模型、硬件围绕同一路线同向迭代，每一次技术突破都会同时反哺另外两个环节，形成正向循环，持续放大先发优势。

深度机智创始人陈凯认为，物理 AI 的发展将依次经历三个阶段：人类数据规模化预训练、本体数据回流迭代、真实环境自主进化。当前行业正处于第一阶段的关键窗口期。

谁能在这个窗口期内率先跑通全栈闭环、建立数据飞轮，谁就有可能定义下一阶段的行业标准。

作为中关村学院与中关村人工智能研究院联合孵化的首家具身通用智能企业，深度机智的目标不仅是做一家技术公司，更要探索一条属于中国的物理 AI 原创技术路径。

本月，深度机智登陆央视《新闻联播》、《朝闻天下》，成为产学研协同创新的标杆案例。

这条中国原创的「人类学习」技术路线能走多远，不只关乎一家企业的成长，更在验证一个核心命题：中国能否在物理 AI 这条全新赛道，掌握属于自己的底层技术定义权与产业话语权。