视触觉传感:特斯拉灵巧手“最后一块拼图”
自特斯拉开发Optimus人形机器人以来,灵巧手研发一直是核心重点方向,马斯克曾指出其工程量占整机开发的一半。触觉传感器作为灵巧手的关键组成,成为Optimus灵巧手优化的重点方向。视触觉技术是一种融合光学成像与触觉感知的传感方法,其核心原理是通过捕捉弹性材料与物体接触时的微观形变,将其转化为高分辨率触觉信息。特斯拉坚持“视觉为主”的感知路线,其核心需求是机器人能够在未标注、复杂环境中抓取和操作各种零件和工具,视触觉及相关多模态触觉技术最为匹配,因此灵巧手很可能采用视触觉方案。(1)高维感知能力:视触觉可同时感知法向力、剪切力、相对滑动、物体位姿、纹理、软硬度等信息,接近人手触觉维度,为机器人提供更丰富的环境交互信息,是理解和操作物理世界的重要一环。(2)VLM大模型适配性:视触觉输出为图像形式,与视觉数据高度一致,可直接接入视觉-语言-动作(VLA)大模型,天然适配其端到端架构。(3)低成本与易集成:GelSight视触觉传感器单价仅350美元,远低于六维力传感器;支持五分钟内快速接入、二次开发,兼容多种机器人平台与操作系统。(4)抗干扰能力强:光学信号不易受温度、磁场、电磁干扰影响,可在高低温(冶金、低温仓储)、电磁干扰(焊接、电机装配、核电站)、动态作业(工厂流水线)等环境中稳定工作。国内视触觉技术在材料设计、薄化工艺、标定技术及深度学习模型方面均有大量产出,技术与海外差距不明显,但在部分高端光学材料及国际品牌认知度上仍需时间追赶。GelSight 作为全球视触觉传感器的龙头,技术奠定了行业根基,Meta通过与其合作切入视触觉赛道。国内创业公司依托本地产业链优势及落地场景,通过产学研协同加快追赶:①叠动科技(隆盛科技战略投资 5%):结合 MEMS 工艺与视触觉传感,研发毫米级高性能传感器,解决小型化痛点,并与隆盛科技形成“硬件 感知”协同,赋能机器人末端执行器,目前隆盛科技已搭载自研灵巧手的兰森机器人用于工厂产线,双方有望在工业机器人领域形成强大的协同效应。②帕西尼感知(比亚迪、新国都投资):多维触觉技术领导者,发布集成视触觉的灵巧手DexH13 及人形机器人 TORA-ONE,明显提高机器人感知和交互能力,同时启用全模态具身智能超级数据工厂,强调触觉与 AI 融合。③一目科技(松霖科技投资):聚焦多模态感知与具身智能,打造全球首个专为精细操作设计的全栈触觉系统,在视触觉传感及标定方法上有专利和产品落地。④戴盟机器人(火星人参股):创新采用单色光技术路线,推出高分辨率视触觉传感器 DM-Tac W(每平方厘米 4 万个感知单元),可捕捉多模态信息,完成数亿元融资。⑤纬钛机器人:创始人为全球GelSight传感器开创者,具备从技术研发到市场应用的全流程经验,专注视触觉与手眼协同,有望成为定义行业标准的关键参与者。⑥系统厂商自研与合作:智元机器人发布自研19自由度视触觉灵巧手,集成基于 MEMS 原理的触觉与视触觉感知技术;此外,千觉机器人的高分辨率多模态触觉传感器 G1-WS也已在智元机器人上落地。风险提示:宏观经济波动风险;机器人量产不及预期;供应链发展不及预期
1、 视触觉传感:补全特斯拉灵巧手“最后一块拼图”
1.1、 触觉传感器是特斯拉Optimus灵巧手优化的重点方向
触觉传感器是特斯拉Optimus灵巧手优化的重点方向。自特斯拉首次公布Optimus项目以来,灵巧手的研发一直是核心重点方向,马斯克曾表示Optimus灵巧手的工程量占整机开发的一半。灵巧手必须兼具高负载能力、精细触觉感知和多自由度灵巧运动,才能完成复杂多样的操作。特斯拉Gen2机器人灵巧手拥有22个自由度,并且所有手指配置均触觉传感器。触觉传感器作为灵巧手的关键组成部分,是实现精细操作和人机协作的基础,也是特斯拉Optimus灵巧手优化的重点方向。

1.2、 视触觉传感:补全特斯拉灵巧手“最后一块拼图”视触觉技术是一种融合光学成像与触觉感知的传感方法,其核心原理是通过捕捉弹性材料与物体接触时的微观形变,转化为高分辨率的触觉信息。视触觉传感器的原理是用摄像头拍下弹性材料接触物体时的细微形变,再把这些变化转化成高清的“触觉照片”,通过摄像头观察柔软层的形变来“感受力量、纹理和滑动”。与传统按压传感器不同,触觉传感器能同时“感受”物体的软硬、纹理甚至滑动趋势。这种高保真的触觉信息,能帮机器人更精准地“理解”物体特性,像人类一样完成精细操作。视触觉传感器分为硬件和算法两个部分,由接触模块、照明模块、图像采集模块和信息处理模块组成。其工作流程如下:当涂有反光膜的胶等柔性介质与物体接触时,其形态会随外力发生形变;内部光源照射下,形变的介质会呈现出不同的光影变化;集成的小型摄像机实时拍摄这些光影图像后,通过算法将图像信息转化为压力分布、物体纹理、滑动方向等具体触觉数据。这种工作机制使其能生成高分辨率的“触觉照片”,借助硬件(接触模块、照明模块、图像采集模块)与算法(信息处理模块)的协同,让机器人实现通过“读图”感知物理世界的能力。特斯拉总体策略为以“视觉为主”的核心感知路线,大概率在灵巧手采用视触觉方案。特斯拉Optimus的技术逻辑是视觉主导、大模型驱动操作决策,公开路线长期强调“camera-first/vision-only”的环境感知,接入大模型获取信息,自动驾驶系统依赖于围绕基于视觉AI的复杂识别框架,通过触觉学习构建世界模型是重要一环。此外,特斯拉机器人核心需求是要在未标注、复杂的环境中抓取和操作各种零件和工具,对于物体信息数量及完整性要求较高。从技术路线及任务需求看,视触觉传感器或多模态触觉技术为特斯拉机器人最为适配的方案,尤其是在灵巧手这类需要精细操作的末端执行器中。按照感知原理触觉传感器可以分为压阻式传感器、电容式传感器、压电式传感器、视触觉传感器、磁电式(霍尔式)传感器、光电式传感器。不同类型触觉传感器各具特点:压阻式通过力的作用改变导电材料电阻值,鲁棒性好、结构简单,但存在迟滞性大、温漂高等问题;电容式则通过外部刺激对电容的变化获取信息,分辨率和灵敏度较高,易受干扰且负载能力差;压电式是力的作用产生电荷极化,无需外部电源、动态特性佳,不适用于静态压力,难测切向力;视触觉则利用光学原理感知多维信息且无电气干扰,但实时反馈和柔性响应有局限,易受温度影响且体积较大;磁电式(霍尔式)将作用力转换为感应电,动态响应范围宽、支持三维力感知,却泛化能力弱、结构复杂,易受磁场等干扰;光电式是将光信号转变为电信号,响应快、稳定性好、可多模态感知,不过光学系统成本高,长期工作易信号漂移。与传统的触觉传感器相比,视触觉传感器方案具有接近人手的动态感知与高灵敏度、适配 AI 与大模型的图像化数据格式、低成本且易集成以及抗干扰能力强的显著优势。(1)可获取法向力、剪切力、相对滑动和物体的位姿等全部信息,具有动态感知与高灵敏度,非常接近于人手:多数传统传感器仅能感受法向力,而视触觉传感器尤为突出,其柔性层接触物体形变后,可动态感知完整表面纹理和力信息,结合算法实时解析动态接触,法向力检测达毫牛级,能支撑机器人复制人类多种抓取策略。比如,完成稳定抓取鸡蛋(不从手中滑落且不能捏碎蛋壳对灵巧手技术提出极高要求)、依据触觉反馈来调整物体或多物体的抓取策略等灵巧操作。这些过程中,机械手通过触觉与视觉的融合,触觉感知实时修正视觉偏差,动态优化操作策略,展现出接近人类的复杂环境操作能力。(2)与机器人视觉数据格式高度一致,适配AI与大模型:相较于传统电容式、电阻式或压阻式等触觉传感器,视触觉传感器的最大优势在于它本质是“视觉”的传感方式。这意味着其输出数据天然是“图像化”的触觉信息,形式与机器人已有的视觉传感数据高度一致。因此,视觉与触觉的融合不再需要复杂的模态转换,能够在统一的数据空间中实现特征对齐与共享。主流视觉-语言-动作(VLA)大模型的核心输入模态是图像、语言和动作轨迹。传统触觉信号需要经过复杂转换才能输入,而视触觉传感器输出的触觉图像可以直接与视觉数据拼接进入大模型,天然适配其架构,还为机器人提供更丰富的环境交互信息,使其更好理解和操控物理世界。(3)低成本 易集成:视触觉传感器是一种低成本、微型触觉传感器。GelSight 与 Meta AI Research 合作生产的视触觉传感器单个售价仅350美金,让机器人拥有人类的触觉,成本远低于六维力传感器。DIGIT 传感器的设计考虑到了易于集成和应用,可以在五分钟内完成设备的连接和配置、支持二次开发和定制、适用于多种机器人平台和操作系统,具有良好的兼容性。(4)稳定性高、抗干扰能力强:视触觉传感器依赖光学信号传播特性,使其不易受温度波动、电磁辐射等外界因素的干扰,即便在高温车间、强磁场设备旁等严苛场景,也能稳定捕捉触觉信息。相比之下,压阻式传感器易因温度变化出现电阻漂移,电容式传感器则常受周围导电物体的边缘电容干扰,导致信号失真。这种强鲁棒性让视触觉传感器在工业精密装配、医疗手术等对稳定性要求极高的场景中更具适用性,能持续输出可靠的力反馈与纹理信息,为机器人精准操作提供稳定保障。视触觉传感器也存在一些局限,包括体积大且集成难度高、柔性材料易损耗影响性能与寿命、对算力要求较高等缺点:(1)体积大和集成难度高:视触觉传感器通常需要内置摄像头、照明装置、光学路径和软弹性触感材料,使得整体结构厚重、占空间。优化方向包括微型光学系统(小型高清摄像头、微型镜头和低功耗光源)、集成化柔性材料与传感器结构(优化柔性触觉层的厚度和折射率)及算法补偿(更小的成像区域实现高精度触觉),解决视触觉传感器的体积大的问题,从而更容易集成到多关节机器人和灵巧手末端。(2)柔性材料:柔性材料是视触觉传感器的核心技术之一,直接决定了触觉传感器的敏感性、分辨率、响应速度以及寿命。柔性凝胶或触摸膜易受磨损、污染或老化影响,长期使用可能导致成像质量下降,进而影响触觉图像的准确性与传感器寿命。优化方向包括开发耐磨、耐污染、弹性可控的复合柔性材料,如在凝胶中添加微粒或纳米材料,提升耐用性和灵敏度。(3)算力要求较高:输出图像信号信息量大,图像处理和触觉重建需要高算力支持。GelSight是全球视触觉传感器龙头,近年来国内涌现多家视触觉技术创业公司,依托本地供应链优势及落地场景,加快产业链合作实现追赶。GelSight 作为全球视触觉传感器的龙头,其技术源自 2009 年 MIT 团队的开创性研究,奠定了行业技术根基。Meta 于 2022 年通过与 GelSight 合作切入该赛道,联合开发 DIGIT 系列传感器并推进商业化。近年来国内视触觉技术创业公司加速涌现,视触觉的基础原理和开源论文已被全球研究者广泛复制与改良,中国高校、研究团队及企业在材料设计、薄化工艺、标定技术及深度学习模型方面均有大量产出,学术深度与技术原理与海外差距不明显。纬钛机器人创始人师从 GelSight 创始人,延续前沿技术脉络;戴盟机器人孵化于香港科技大学科研团队,叠动科技融合 MEMS 工艺与视触觉技术,千觉机器人、智元机器人、帕西尼感知、一目科技等则通过自主研发,从多维触觉、全栈系统等方向切入新赛道。这些企业多成立近两年,依托融资支持与产学研协同快速补位,在产业化落地上持续突破,有望凭借本土化优势实现追赶。2.1、 叠动科技:首创MEMS与视触觉传感融合,隆盛科技投资5%股权叠动科技首创 MEMS 工艺与视触觉传感器融合方案,产品获日内瓦发明奖金奖。叠动科技成立于2022年,核心团队源自香港科技大学、清华大学等国际高校,依托深厚的传感器技术积累,全球首创 MEMS 工艺与视触觉传感器融合方案,研发出全球首个毫米级高性能产品,并获第 50届日内瓦发明奖金奖。其技术直击传统传感器体积大、性能受限的痛点,可让机器人精准感知接触力、物体纹理等信息,为精密组装、医疗辅助等场景提供类人类触觉”支撑,填补了行业在小型化、高性能感知领域的空白,技术优势显著。与隆盛科技战略合作,形成“硬件 感知”的协同生态。隆盛科技战略投资叠动科技5%股权,叠动科技的核心技术赋能隆盛科技及其生态在机器人末端执行器等领域的升级,提升智能化与精密化水平;隆盛科技则以精密制造能力和场景资源,助力叠动科技技术规模化落地。双方协作有望推动视触觉技术的技术突破和在工业、医疗等领域的场景应用,加速机器人产业升级。隆盛科技联合江南大学、无锡市产业创新研究院,灵巧手技术能力领先。2024年6月,隆盛科技与江南大学等多家高校院所与产业公司成立唯睿-隆盛企业联创中心,布局人形机器人核心零部件应用研究。截至2024年7月底,搭载公司自研灵巧手的机器人已用于公司转子加工产线的自检、称重及上油等工序。目前隆盛科技已有搭载自研灵巧手的兰森机器人用于工厂产线,并正在进行第三代灵巧手的开发。叠动科技与隆盛科技及其生态公司在工业机器人领域的技术能力有望形成强大的协同效应:(1)视触觉传感器为灵巧手及末端执行器注入新动能:叠动科技的传感器能大幅增强机器人末端执行器的灵敏性与精准度,让其在抓取、装配、检测等复杂作业中具备接近人类的灵活操作本领。(2)助力柔性生产与自动化革新:依托隆盛科技在智能制造领域的应用场景,双方将携手促进触觉技术在自动化生产、工业检测等环节的深度渗透,进而提高生产效率与产品品质。(3)打造机器人领域全新生态:叠动科技与隆盛科技将通过技术研发和市场拓展,合力推动视触觉传感技术在工业自动化、医疗机器人、高端服务机器人等关键领域实现规模化应用,加速技术的实际落地。2.2、 帕西尼:多维触觉技术领导者,获比亚迪超亿元战略投资帕西尼以“高精度触觉感知 全模态数据”为核心竞争力,致力于构建人形机器人生态。2021年成立后,聚焦多维触觉驱动的商用人形机器人研发,产品包括传感器、灵巧手和人形机器人,打造从“传感器核心零部件”到“整机制造”的全链路产品矩阵。在灵巧手方面,帕西尼已推出“多维触觉 AI视觉”双模态灵巧手DexH13,集成1956颗ITPU传感单元,可解析7824路信号、识别15种物理属性,搭配800万像素相机实现全模态数据融合,0.01N力控精度、5kg负载能力,覆盖工业、医疗等场景。在人形机器人方面,帕西尼发布的多维触觉人形机器人TORA-ONE,集成了视触觉双模态灵巧手,搭载2000多个ITPU多维触觉传感单元,加持VTLA-Mode与PX-Core,赋予机器人精细灵敏的全面感知能力与强大的交互能力。值得一提的是,帕西尼于6月23日启用全模态具身智能超级数据工厂,作为全球数据采集体量领先的采集与训练基地,将为技术迭代、生态拓展持续赋能。帕西尼获比亚迪、英伟达、京东、新国都等公司及产业资本加持,加速技术落地。公司已完成多轮融资,投资方包括比亚迪(超亿元战略投资,比亚迪占股约13%)、京东(战略领投)、新国都、北汽产投等,资金用于产品迭代与批量生产。同时,与英伟达在算力及模型领域合作,推动触觉感知融入AI大闭环。这些合作不仅为其技术规模化落地提供支撑,更通过“传感器-算法-整机”协同,强化了高精度触觉与全模态数据的产业化能力,加速技术落地。2.3、 一目科技:打造全球首个全栈触觉系统,获松霖科技跟投一目科技依托仿生传感硬件 感知行动闭环架构,打造了专为精细操作设计的全栈触觉系统。公司主业产品包括软件服务与硬件设备,并形成了智慧家居、智慧水务、生命科学领域的解决方案。在多模态感知领域,公司依托仿生传感硬件 感知行动闭环架构,打造出全球首个专为精细操作设计的全栈触觉系统。该系统借助一目科技自研的仿生传感器,突破传统触觉仅测压力的局限,通过多模态力觉解耦复现人类指尖力学感知维度;通过构建神经网络世界模型,将高保真触觉信号转化为机器可理解的物理语言,实现对脆弱物体、柔性物体的精准抓取;再通过自适应学习框架,赋予机器人实时理解物体形态、位姿并操作的能力。一目科技获松霖科技等资本助力,推动多模态感知技术深化及具身智能业务扩展。公司完成数亿元 D 轮融资,上市公司松霖科技参与跟投,这一合作既体现了传统产业资本对感知层技术的重视,也为其技术迭代提供了资金支撑,所融资金主要用于多模态感知技术深化及具身智能业务扩展。借助资本协同与产业链资源对接,一目科技有望进一步强化视触觉传感器的性能优势,推动技术在更多场景的规模化应用。2.4、戴盟机器人:创新提出单色光技术路线,“超人类触觉”颠覆机器人未来戴盟机器人创新地提出单色光视触觉技术路线,实现降维打击。公司由香港科技大学科研团队孵化,专注于颠覆式的触觉感知与灵巧操作技术研发,产品涵盖高分辨率多模态触觉传感器、触觉灵巧手及穿戴式遥操作数据采集系统。其基于创新的单色光技术路线,推出了多维高分辨率高频率视触觉传感器 DM-Tac W,每平方厘米集成 4 万个感知单元,密度远超人手指尖,相较于传统阵列式触觉传感器每平方厘米不足 100 个感知单元,实现了感知精度上的“降维打击”。目前,公司已完成三轮融资,天使轮、天使 轮与天使 轮累计融资金额达数亿元,刷新了触觉传感领域天使轮融资的最高纪录,彰显其创新技术路线的强竞争力。此外,A 股上市公司火星人也参股其中(比例较小),资金用于视触觉技术全球落地,有望加速推动人形机器人的泛社会化应用。2.5、 纬钛机器人:全球GelSight传感器开创者,技术背景顶尖创始人为全球头部视触觉传感器GelSight的开创者之一,技术实力雄厚。李瑞博士在MIT计算机科学与人工智能实验室(CSAIL)读博期间与导师 Edward Adelson(美国两院院士)共同开创视触觉传感器研究领域,研发的 GelSight 指尖传感器成为全球首款分辨率超越人类手指的触觉方案,目前GelSight已成为全球视触觉传感器龙头,不仅填补了行业内的技术空白,更为纬钛科技的创立奠定了坚实的技术基础。李瑞博士拥有将近20年的机器人、计算机视觉、视触觉传感器、自动驾驶等研发及产业化经历,于2024年成立纬钛机器人公司,专注于视触觉传感与手眼协同系统,源自全球顶尖视触觉传感器公司,形成独特技术传承优势。技术 场景的三重壁垒,有望成为定义触觉感知行业标准的关键参与者。技术层面,其研发的仿生指尖传感器,作为首款同时服务于产业和科研领域的视触觉传感器,不仅具备超越人类的触觉分辨能力,还能实现多维力检测,攻克了上一代产品在耐用性和体积方面的短板;场景落地方面,公司创始人及团队具备从技术研发到市场应用的全流程经验,曾成功推动数十个工业场景解决方案的实施。当前,纬钛已与多家科研单位及制造业头部客户达成合作,在精密装配等场景完成了初期商业化测试,且于 4 月接连完成近亿元的天使轮及天使 轮融资(其中天使轮由小米战投牵头投资),所获资金将用于深化技术研发与商业化进程,打造适用于通用类人机器人的相关系统、算法及场景解决方案。2.6、 智元机器人:首发视触觉灵巧手,携千觉拓展应用场景智元机器人首次推出视触觉灵巧手,有望进一步促进复杂场景落地。智元机器人于 2024 年新品发布会上,推出 19 自由度(12 主动)视触觉灵巧手,该产品集成了基于 MEMS 原理的触觉感知与视触觉感知技术,提升了机器人在抓取、操作等任务中的精度和效率,更为其在复杂环境中的自主决策和适应性提供了有力支持。此外,千觉机器人 推出的多模态高精度触觉传感器 G1-WS,也已应用于智元“远征 A2-D”数采机器人结合的数据采集工作,为其在精密装配、工业智造及智能服务等复杂场景的落地应用奠定数据基础。
3、 投资建议
宏观经济波动风险;机器人量产不及预期;供应链发展不及预期。