首页 > 创新亦庄 > 科技成果转化承载区 > 科技快报

经开区突破性机器人数据集斩获权威奖项

经开区突破性机器人数据集斩获权威奖项.jpg

RoboMIND数据集获评“最佳开源智能突破奖”。 北京人形机器人创新中心/供图

  本报讯(融媒体中心 孙艳平)近日,第十二届开源操作系统年度技术会议(OS2ATC)在京举行。来自北京经开区的北京人形机器人创新中心(以下简称“北京人形机器人”)凭借全国首个通用具身智能数据集RoboMIND获评“最佳开源智能突破奖”,标志着全球机器人操作系统研究迈入数据驱动的新阶段。

  RoboMIND数据集有何亮点?据北京人形机器人有关负责人介绍,该数据集的核心突破在于,开创性地构建了标准化、规模化、多元化的机器人操作数据体系。在开发过程中,北京人形机器人技术团队联合北京大学等机构协同创新,通过自主研发的智能数据采集平台,投入2000平方米实验场地及超过10万人工时,组建了涵盖机器人学、计算机视觉、自然语言处理等多学科的专业团队,攻克了多构型机器人数据兼容的技术难题。目前,该数据集已包含10.7万条高质量操作轨迹,涵盖479种任务场景和96类物体交互,预计年底将扩展至30万条规模。

  在技术创新方面,RoboMIND数据集实现了三大突破。首先,该数据集采用细粒度语言标注,通过大模型自动分割与人工校验相结合的方式,完成了1万余帧精准标注,为视觉-语言-动作(VLA)模型训练提供了更精密的关键支撑;同时,技术团队在数据集中建立了失败学习机制,创新性地引入5000余条失败轨迹及原因分析,填补了机器人反思学习的数据空白,为机器人反思学习提供关键训练资源;此外,技术团队还构建了高保真数字孪生环境,生成3万余条仿真轨迹,开创了虚实协同训练的新模式。

  在数据标准方面,RoboMIND数据集通过构建一套完善的标准化体系,为具身智能研究提供了高质量的基准数据资源。该数据集确保每条轨迹数据均达到研究级可靠性,填补了异构机器人操作数据标准化缺失的行业空白,形成从数据采集到模型训练的全流程技术闭环。此外,该数据集真正体现了开源精神对技术普惠的推动作用,不仅实现了技术规范的透明化,更通过标准化数据接口显著降低研究门槛,这就好比为全球开发者搭建了一条“数据高速公路”,让他们能基于统一基准开展创新工作。

  当前,RoboMIND数据集已在全球范围内产生深远影响。超过百家顶尖研究机构和企业将其作为基准数据集应用于算法研发,仅北京智算平台的下载量就已达数千次。该数据集不仅解决了机器人学习领域长期存在的数据匮乏问题,更通过标准化数据格式和完备的工具链,大幅降低了研究门槛,推动整个领域的快速发展。

  “本次获奖标志着我们在具身智能研究领域的创新成果受到行业的充分认可。”北京人形机器人有关负责人表示,“随着数据规模的扩充和应用生态的完善,RoboMIND数据集将成为连接学术研究与产业应用的关键桥梁,为具身智能技术的产业化落地提供数据基础。北京人形机器人也将继续深化产学研合作,推动开源生态建设,助力我国在新一轮科技革命和产业变革中占据战略主动地位。”

相关新闻