九游会(九游会真人游戏股份有限公司)J9-官方网站

下一个万亿市场?动作捕捉系统或许将是人形机器人通向AGI的“核心基建”
发布时间:2026-06-10 05:36:46

  

下一个万亿市场?动作捕捉系统或许将是人形机器人通向AGI的“核心基建”

  具身智能大模型的训练和成长需要大规模数据燃料的“喂养”。目前,所需的“数据燃料”主要有三种类型:互联网数据、合成数据以及真机数据。其中,真机数据质量最高,却获取成本高昂,但对于模型训练优化、性能评估改进、安全可靠性验证至关重要。因此,如何实现低成本、高效率的真机数据采集是人形机器人大规模量产前要解决的关键问题。

  机器人环境感知数据是指机器人通过各类传感器(如摄像头、激光雷达、听觉传感器、力觉传感器等)采集的外部环境数据,涵盖静态场景(物体位置、形状、材质)和动态变化(移动物体轨迹、环境参数波动)。这些信息用于机器人理解周围环境、识别目标、规划路径及安全交互,是实现自主导航、避障、操作等功能的核心输入,支撑其在复杂场景中做出适应性决策,提升智能化水平。

  包括传感器直接感知的环境特征和环境物理属性。其中,传感器直接感知的环境特征包括摄像头拍摄的图像/视频(包含物体颜色、形状、位置、光照条件等)、激光雷达的点云数据(障碍物距离、尺寸、空间结构)、麦克风采集的环境声音(用于噪声检测或语音交互)等;环境物理属性包括地面粗糙度(通过力传感器或 IMU 振动数据推断)、温度/湿度、风力/气压等。

  移动物体轨迹(如行人、车辆的运动状态,通过视觉跟踪或雷达数据获取)、环境变化事件(如门的开闭、物体的摆放位置变化)。

  人机协作场景中人类的动作、手势(通过动作捕捉或视觉识别采集),或物体的物理特性(如重量、摩擦力,通过力传感器与运动数据融合推断)。

  本体数据是机器人实现精准控制(如轨迹跟踪)、状态监控(如故障预警)、算法训练(如动力学模型优化)的核心依据,通常包括运动学与姿态数据、动力学与力控数据、时间与同步元数据等。

  遥操作和动作捕捉是常被提到的两种真机数据采集方式,但是两者之间既有区别,又存在关联,容易混淆。

  两者之间的区别:二者均可作为数据采集手段,但动作捕捉可以理解成是 “专职数据采集工具”,而遥操作是 “控制过程中附带数据采集”。

  在真机数据采集类型方面,动作捕捉主要采集运动学 / 动力学参数,服务于轨迹规划、仿真建模等。而遥操作侧重人机交互闭环数据,包含感知(环境 九游会/ 机器人状态)、交互(人机指令 / 反馈)、任务(目标达成度)三类数据,服务于远程控制策略优化、人机协同效率提升。

  两者之间的关联:动作捕捉可独立使用(如记录机器人自主运动),也可作为遥操作的 “输入源”(机器人遥操作常用的实现方案有基于VR、外骨骼、动作捕捉设备等。),但二者核心功能分属 “数据层” 与 “控制层”。

  接下来,文章将会详细介绍什么是动作捕捉?目前常见的动作捕捉系统数据采集方式有哪些,以及国内目前有哪几家企业在做具身智能机器人领域的动作捕捉解决方案。

  在具身智能机器人领域,穿戴动捕设备的开发人员(演示人员)重复执行任务,执行过程中的每个动作将被动捕系统捕捉,并将人体动作转化为计算机能够处理的数字化的动作数据。

  整个系统通过硬件设备捕捉运动信号,再由软件进行处理和分析,通过运动解算得到连贯的三维运动数据,最终输出目标参数,包括运动目标的三维空间坐标、人体关节的6自由度(3个平移+3个旋转)等,实现对人体动作的准确跟踪、记录以及重建人体关节的运动轨迹。

  按技术原理的不同,动作捕捉系统可以划分为:机械式、声学式、电磁式、惯性式、光学九游会式等五大类。但在具身智能机器人领域,光学式 和 惯性式是常用的两大主流技术路线)光学式动捕系统

  光学式动捕系统,顾名思义,基于光学原理完成物体的捕捉和定位。根据目标特征类型不同,光学式动捕系统可分为标记点式光学和无标记点式光学两类。日常谈到的光学式动作捕捉系统通常是指标记点式动作捕捉系统。

  在运动物体的关键部位(比如,人体的关节处)粘贴反光或主动发光的标记点(Marker点),然后由多个动作捕捉相机(红外相机)从不同角度实时探测Marker点,数据实时传输至数据处理设备,根据三角测量原理精确计算Marker点的空间坐标。在连续视频帧中依据标记点运动连续性将不同帧坐标关联形成轨迹,针对人体捕捉,通过逆向运动学计算各关节旋转角度和位置完成骨骼绑定。

  其标记点通常由小型的 LED 灯或其他发光元件组成,粘贴在运动物体的关键部位,这些标记点会按照一定的规律和频率主动发出特定波长的光(通常为红外线),以便于被光学传感器捕捉。每个标记点都有唯一的编码或标识,这样系统就能区分不同的标记点,从而准确地跟踪它们的位置和运动。但是,这些发光元件需要在运动物体表面安装电源进行供电,发光元件之间通过线缆连接。

  也称反射式光学动作捕捉系统,其标记点通常是反光材料的球体(如反光球),粘贴在运动物体关键部位,无需供电,由动作捕捉镜头上发出的LED照射光经反光球反射至动捕相机,进行标记点的检测和空间定位。

  光学动捕系统追踪精度高,亚毫米级别,能精准还原动作细节。但对场地要求严格,需要布置多视角相机,且易受物体遮挡,导致数据采集中断。此外,该系统价格高昂,这些特点使其应用场景受到一定限制。

  惯性式动捕系统是通过惯性传感器完成物体的捕捉和定位,通过在人体关键部位穿戴惯性传感器,实时采集运动数据,经算法解算出各关节姿态角和空间运动轨迹的动作捕捉技术。

  由真人穿戴动作捕捉设备,在真实环境中遥操作真实机器人本体,完成真实任务。在任务执行过程中,可以采集机器人本体真实的视觉信息、运控信息以及触觉信息等。该方式的优势在于采集到的数据质量非常高。缺点在于成本高昂,一个采集席位就需要一套机器人本体,一套动作捕捉设备,以及一个遥操作采集人员。

  特斯拉要求其穿戴惯性动捕服和VR 头显,执行指定动作(如行走、搬运、上下楼梯等),并携带约 13.6 公斤的设备。这些动捕服集成了九轴惯性传感器(陀螺仪、加速度计、磁力计),能够实时捕捉人体关节的三维运动数据,包括角度、加速度和角速度。

  首先,在仿真环境(如 Gazebo、PyBullet、Unity 等)中构建与真实机器人本体构型一致的机器人数字模型,然后,由真人穿戴动捕设备,遥操作处于仿真环境中的虚拟机器人本体,模拟其运动及与虚拟环境的交互,来完成虚拟任务。在虚拟任务执行过程中,可以采集到虚拟机器人本体在仿真环境中的视觉信息、运控信息以及触觉信息等。

  智元机器人联合诺亦腾以及英伟达,采用虚拟机器人本体的数据采集方式。其中,英伟达提供了物理精确的虚拟环境与数据生成工具链,是规模化数据生产的核心引擎,比如Isaac Sim 仿真平台;诺亦腾作为动作捕捉技术供应商,为合作提供了高精度动作采集硬件与跨平台数据交互能力;智元机器人提供线本体,并在虚拟环境中构建数字孪生,是连接虚拟训练与实际应用的关键环节。

  直接由真人穿戴动作捕捉设备去完成真实任务。在此过程中,借助光学、惯性等动捕设备,精准记录人体关节运动轨迹、姿态变化,为机器人模拟人类动作、实现人机协作提供基础数据支撑 。

  北京诺亦腾科技有限公司成立于 2012年12月,致力于通过对人体以及物体运动的精准感知与智能分析,建立一致性模型,构造运动人体的“数字孪生”,构筑数字世界与物理世界的连接。

  在具身智能机器人领域,诺亦腾可提供基于惯性传感器的 PN Studio 动作捕捉套装以及基于光学和惯性混合追踪技术的HybridTrack光学运动测量系统。其中,HybridTrack将惯性与光学系统的优质特性融合在一起,用光学定位补充惯性末端精度,用惯性传感器的数据源与光学计算进行紧耦合,提升光学系统的抗遮挡能力。

  借助 NVIDIA Isaac Sim & Isaac Lab 平台的系统架构以及数据生态,诺亦腾与机器人领域的多家企业、研究机构一起,打通动作捕捉系统与机器人虚拟本体/真实本体之间的工作回路,进而打造HITL (“Human - in - the - Loop”人在回路)解决方案。

  2024年,诺亦腾携手智元机器人,基于 NVIDIA Isaac 以及动作捕捉/高精度追踪技术构建出 HITL 解决方案。智元远征A2 机器人可通过诺亦腾动作捕捉系统在真实物理世界与虚拟空间中进行遥操作采集数据集,用于训练策略/控制规则,共同探索提升算法的「Sim2Real2Sim」路径。

  2024年,千寻智能与诺亦腾合作,采用诺亦腾PN3 Pro 惯性动作捕捉套装,进行动捕遥操作具身智能机器人。双方共同探索高效率、高精度的遥操作流程和数据产出流程,利用动作捕捉系统捕捉更多关节、更丰富的数据,为机器人训练积累数据。

  Tokyo Robotics是一家日本机器人公司,主营产品是机械臂和人形机器人。从2018年起,他们开展了利用动作捕捉系统操控机器人动作的研究。在2020年,公司成功将诺亦腾PN2.0和PN Studio惯性动作捕捉套装与其产品结合,用于帮助特殊领域工作人员进行安全的远程操作,同时积累训练数据,用于提升机器人性能。

  北京度量科技有限公司成立于2015年8月。公司定位是专业光学动作捕捉设备提供商,致力于为客户提供完善的动作捕捉技术解决方案。

  光学三维动作捕捉系统是度量科技的核心产品。该系统采用高性能红外摄像头捕捉被反光标记点(也被称为被动发光标记点)反射回的红外光,经过信号处理,获得反光标记点在镜头中的二维坐标。一套动捕系统里通常有多个动作捕捉镜头,多个镜头通过标定获取各镜头的位置、姿态参数(外参数)及光学参数(内参数),从而建立各镜头坐标系与世界坐标系的转换关系,最终解算出标记点的三维坐标。

  C. 北京航空航天大学 —— 下肢外骨骼上楼梯的自适应步态生成算法开发:

  北京元客视界科技有限公司成立于2022年11月,是机器视觉头部企业凌云光设立的全资子公司。元客视界专注于运动捕捉、光场重建、虚拟拍摄系统以及智能资产制作等产品和解决方案。

  据相关媒体透露,在具身智能机器人领域,元客视界已经服务宇树科技、优必选、小米等客户。

  2024年11月,在青岛举办的中国自动化大会上,元客视界与宇树科技联合展出了 FZMotion 具身智能数据采集解决方案,向业界展示了该方案在推动自动化、具身智能发展方面的前沿技术和创新应用。

  通过FZMotion 光学运动捕捉系统,元客视界可将人体骨骼数据直接映射到宇树 H1 机器人构型并驱动本体,高精度采集机器人本体的姿态和运动轨迹真值,以此优化任务策略和控制算法,助力人形机器人更好地适应复杂环境和任务。该系统能以亚毫米级精度捕捉人体和机器人的运动数据,减少二次开发成本,显著缩短产品迭代周期。

  2025年4月,依托 FZMotion 光学运动捕捉系统,元客视界联合睿尔曼智能打造的数据采集解决方案入驻北京首个人形机器人数据训练中心。

  虚拟动点于 1996 年成立于美国,专注于运用视觉与图像技术解决运动追踪问题,是全球较大的光学运动捕捉技术供应商。2017年,利亚德集团美国平达公司以 1.25 亿美元收购了虚拟动点公司,使其成为全资子公司。2017年3月,北京虚拟动点科技有限公司在北京注册成立。

  OptiTrack的Motive软件是其动作捕捉系统的核心。Motive3.1软件具有可被训练的标记点集、新增使用IMU传感器融合平滑刚体跟踪功能、新增相机复位功能、刚体骨骼追踪等亮点功能;Motive:Tracker是OptiTrack开发的专业面向物体六自由度跟踪的、支持实时数据处理和离线数据处理的高精度运动跟踪软件。

  2024年12月,虚拟动点与松延动力合作成立了“具身智能机器人联合实验室”。

  虚拟动点与松延动力联合研发,将面部捕捉技术赋能仿生机器人,使松延动力的仿生机器人学会了 “喜怒哀乐” 等拟人化表情,并且可以读懂人类的语言并做出表情回应,提升了机器人的拟人化程度和交互能力。

  2025年3月,虚拟动点赋能松延动力的机器人解锁连续空翻技能。虚拟动点可以为机器人合作伙伴提供高质量的优质动作数据,通过数据开发与动作训练,帮助机器人学会更复杂、更高难度的动作。

  上海青瞳视觉科技有限公司成立于2015年8月,专注于3D智能感知和人机交互系统的研发和生产。据了解,青瞳视觉自主研发的红外光学动作捕捉系统能够达到亚毫米级(±0.02mm)的捕捉精度、毫秒级(2.5ms)的延时性能。该产品广泛应用于元宇宙、数字娱乐、虚拟现实、科研与工业自动化和生命工程等领域。

  2024年,人形机器人(上海)有限公司(国地共建人形机器人创新中心)采用青瞳视觉光学动捕系统,进行全尺寸机器人“青龙”的训练,通过采集“青龙”的数据信息,进行姿态分析、运动评估等工作。

咨询电话
13647210798