北京亦庄具身大脑能力跻身世界第一梯队
近日,北京人形机器人创新中心(以下简称“北京人形”)在全球权威评测榜单World Arena中连夺两项第一——继WoW具身世界模型登顶数据引擎赛道后,首个“具身大一统”模型Pelican-Unify 1.0又斩获综合评测榜首。至此,北京人形成为全球唯一在两大核心赛道同时夺冠的企业,成为具身智能领域首个“双冠王”,北京亦庄“具身大脑”能力跻身世界第一梯队。
全球评测独占鳌头
World Arena由清华大学联合普林斯顿大学、新加坡国立大学、北京大学、香港大学、中国科学院、上海交通大学、中国科学技术大学等8所顶尖机构共同发起,涵盖6大评测维度+16项细分指标+3大真实应用任务。因其学术严谨性与行业公信力,吸引了全球几乎所有头部世界模型团队参评,在激烈角逐中,Pelican-Unify 1.0凭借硬核技术实力脱颖而出,登顶World Arena。
此次登顶并非“偏科”取胜。在包括视觉质量、运动质量、内容一致性、物理遵循、3D准确性等多维度的EWM Score(综合得分)中,Pelican-Unify 1.0稳居榜首,各项能力的平衡能全方位支撑复杂的具身长程任务。尤其在具身智能至关重要的3D Accuracy指标上,该模型已接近满分,充分验证了其对场景空间几何关系的理解与构建能力。
打破“看想动”割裂
过去,具身智能领域各路线“各自为战”:VLM(视觉语言模型)擅长理解图像和指令,VLA(视觉-语言-动作模型)能将视觉信息和指令“翻译”为动作,世界模型可预测未来状态。但这些能力往往分段连接,容易形成“看、想、动”之间的断裂——理解无法被行动验证,行动缺少未来后果约束,世界想象也难以被语言推理稳定引导。
Pelican-Unify 1.0的核心突破在于,实现了理解-推理-想象-行动闭环,不再是“先看、再想、后做”的串行链条,而是让各环节同步演进、相互约束,让具身智能从“功能拼凑”迈入了“协同进化”的新阶段。对于复杂操作任务,这种机制能帮助模型更好地处理长程依赖、物体接触、遮挡和空间变化等问题。
实验数据证明了这条路线的有效性。在VLM评测中,Pelican-Unify 1.0在8个通用及具身基准测试中取得64.7的平均分,均达业界最优水平;在更具具身属性的Where2Place和PhyX测试中,相比基座模型分别提升28.2分和20.6分,证明统一训练并没有削弱通用多模态能力,反而增强了空间理解、物理理解和行动相关语义。在动作执行层面,该模型在RoboTwin 50项双臂操作任务中取得93.5%的平均成功率,其中31项任务成功率超过95%,15项达到100%,覆盖插拔、堆叠、交接等复杂场景,与当前最佳模型性能基本持平。
迈向通用具身智能
Pelican-Unify 1.0作为通用具身智能平台“慧思开物”的重要组成部分,其登顶意义不止于榜单第一,更在于提出了一条更接近通用具身智能的建模路径:它让模型既能保持专家能力,又能在真实任务中形成更完整的闭环智能,形成一个能够把“看见、思考、想象、行动”统一起来的自适应系统。
当前,北京人形以通用机器人平台“具身天工”和通用具身智能平台“慧思开物”为双核心,正构建起覆盖“本体-大脑-小脑-平台-生态”的全栈式闭环体系。北京人形凭借“双冠王”技术积累,降低具身智能的进入门槛,加速人形机器人从专用设备向通用生产力工具的演进。在北京亦庄这片创新热土上,一个能理解目标、推理过程、预判后果并精准执行的通用具身智能平台,正从实验室走向千行百业。 融媒体中心 孙艳平