北京亦庄加速具身智能“全自主更好用”
近日,北京人形机器人创新中心(以下简称“北京人形”)发布的RoboMIND系列数据集全球下载量突破600万大关,稳居具身智能领域第一梯队。这相当于为全球机器人开发者提供了一本来自北京亦庄的“数据训练集”,让机器人能更快学会倒水、整理衣物、搬运零件等复杂操作。
数据集实现迭代跃升
RoboMIND系列数据集由北京人形与北京大学计算机学院联合推出,旨在构建大规模多构型机器人操作的数据基准。该数据集V1.0版本包含10万条以上高质量双臂操作轨迹,覆盖4种机器人本体、5大场景下的479项任务与38种技能。
2025年底,RoboMIND完成迭代升级,V2.0版本将数据集规模扩展至超31万条轨迹,机器人本体增至6种,任务数量提升至739项,技能扩展至129种,并新增1.2万条以上带触觉的操作数据,同时开源高保真仿真资产,支持数字孪生与批量评测。
如今,该数据集操作轨迹已超40万条,数据规模和质量持续突破,成为全球具身智能领域下载量最高、应用最广泛的开源数据集之一。
助力“大小脑”模型训练
海量数据不仅催生了规模效应,更成为算法迭代的“燃料”。
基于RoboMIND积累的高质量数据与具身基建底座,北京人形构建了“大小脑”算法模型矩阵:全国唯一通过EI Bench国标测试的VLA(视觉-语言-动作)模型XR-1,登顶WorldArena双冠的具身世界模型系列WoW和具身大一统模型Pelican-Unify,以及全球首个全尺寸人形全身VLA模型HEX等。
与此同时,北京人形建设具身智能机器人数据与训练基地,加速数据采集与算法训练。基地一期建筑面积近5000平方米,覆盖家居、商超、办公、工业、医药、康养等领域30余个典型场景,拥有全国构型最丰富的120多台机器人,具备真机遥操作、开放环境采集、动作捕捉采集等全栈式数据采集能力,对外市场化交付数万小时高质量实采数据,服务客户包括多家头部企业及科研机构,应用场景覆盖物流、商超、办公、家居、工业制造等多个领域。
“数据飞轮”加速应用落地
随着RoboMIND全球下载量突破600万,以“具身天工”为代表的通用机器人平台已在工业制造、电力巡检、运动科学测试等真实场景中加速落地,“数据飞轮”效应正被迅速激活——数据越多,模型越强;模型越强,应用越广;应用越广,反哺的数据也更丰富。
这一突破,成为北京亦庄鼓励开源开放的又一创新成果。当前,北京亦庄正全域开放50余个真实世界数采场所,构建真机-无本体UMI(通用操作接口)-人类视频等多层金字塔数据赋能体系。面对600万次下载这一里程碑,北京人形相关负责人表示:“这既是过往见证,也是全新起点。下一步,北京人形将继续坚持开源开放,与全球社区携手,持续优化与丰富数据集,共同攻克更具挑战性的长程任务,并在多机协作等复杂场景中推动具身智能迈向‘全自主、更好用’的新阶段。”融媒体中心 孙艳平