北京人形“具身大脑”登顶行业数据引擎榜单
本报讯(融媒体中心 孙艳平)近日,北京人形机器人创新中心(以下简称“北京人形”)研发的WoW(World-Omniscient World Model)具身世界模型正式登顶WorldArena Challenge Track 2(Data Engine,数据引擎)评测榜单。在这个由国内外顶尖高校“监考”的全球AI实战大考中,这款诞生自北京亦庄的“机器人大脑”,在“理解真实物理世界并生成数据”这项核心能力上,达到行业领先水平。
WorldArena是由清华、北大、上交大、普林斯顿等顶尖高校联合推出的首个统一、全面评估具身世界模型感知与功能实用性的基准平台。其中,在WorldArena挑战赛中,Track 2(Data Engine)的实战检测性能主要在于:不只看模型生成的视频是否“好看”,更看模型生成的合成数据是否“好用”,即这些数据能否真正提升下游机器人策略的训练效果。
WoW是北京人形推出的具身世界模型,旨在为机器人提供能够理解并预测物理规律的“大脑”。该模型不仅能模拟真实物理世界规律,还能够自主生成高质量、符合物理逻辑的交互数据,解决具身智能行业长期以来的“数据饥渴”难题。尤其是,本次参与测试并取得榜首成绩的是WoW系列中尺寸最小的1.3B模型。作为“轻量级选手”,WoW 1.3B在数据引擎赛道的表现已经超越许多规模更大的通用视频模型和专用具身模型。
在技术层面,WoW模型实现了三大突破。该模型具备物理引擎级生成能力,能从数百万条机器人交互轨迹中学习,进而精准预演未来场景,极大缩小了“模拟与现实的鸿沟”。该模型打造“自我进化”的数据闭环,北京人形首创的SOPHIA自反范式通过“生成—批评—修正”机制,让模型像人类一样在想象中验证物理合理性,能从少量真实轨迹衍生出数以百万计的高质量交互数据,成为名副其实的“虚拟物理工厂”。此外,该模型能实现“从画面到动作”的闭环推理,相当于给算法装上了触摸真实世界的“双手”。
在WorldArena挑战赛严苛的评价体系下,WoW生成的数据在驱动机器人完成抓取、放置、长程任务等实验中,表现显著优于国内外顶级基线模型。这意味着WoW产出的不仅是“看起来真”的视频,更是“用起来顺”的训练燃料。
作为北京亦庄在具身智能开源开放领域的又一里程碑,WoW模型的此次登顶并非终点。未来,北京人形将继续推动WoW作为交互式模拟沙盒,为各类机器人本体提供“自我造数”和“逻辑调试”的能力,加速具身智能从实验室走向千家万户。