北京亦庄具身大脑能力跻身世界第一梯队_科技前沿

北京亦庄具身大脑能力跻身世界第一梯队

来源：亦城时报时间：2026年05月20日 14:14

【字体：大中小】

　　近日，北京人形机器人创新中心（以下简称“北京人形”）在全球权威评测榜单World Arena中连夺两项第一——继WoW具身世界模型登顶数据引擎赛道后，首个“具身大一统”模型Pelican-Unify 1.0又斩获综合评测榜首。至此，北京人形成为全球唯一在两大核心赛道同时夺冠的企业，成为具身智能领域首个“双冠王”，北京亦庄“具身大脑”能力跻身世界第一梯队。

　　全球评测独占鳌头

　　World Arena由清华大学联合普林斯顿大学、新加坡国立大学、北京大学、香港大学、中国科学院、上海交通大学、中国科学技术大学等8所顶尖机构共同发起，涵盖6大评测维度+16项细分指标+3大真实应用任务。因其学术严谨性与行业公信力，吸引了全球几乎所有头部世界模型团队参评，在激烈角逐中，Pelican-Unify 1.0凭借硬核技术实力脱颖而出，登顶World Arena。

　　此次登顶并非“偏科”取胜。在包括视觉质量、运动质量、内容一致性、物理遵循、3D准确性等多维度的EWM Score（综合得分）中，Pelican-Unify 1.0稳居榜首，各项能力的平衡能全方位支撑复杂的具身长程任务。尤其在具身智能至关重要的3D Accuracy指标上，该模型已接近满分，充分验证了其对场景空间几何关系的理解与构建能力。

　　打破“看想动”割裂

　　过去，具身智能领域各路线“各自为战”：VLM（视觉语言模型）擅长理解图像和指令，VLA（视觉-语言-动作模型）能将视觉信息和指令“翻译”为动作，世界模型可预测未来状态。但这些能力往往分段连接，容易形成“看、想、动”之间的断裂——理解无法被行动验证，行动缺少未来后果约束，世界想象也难以被语言推理稳定引导。

　　Pelican-Unify 1.0的核心突破在于，实现了理解-推理-想象-行动闭环，不再是“先看、再想、后做”的串行链条，而是让各环节同步演进、相互约束，让具身智能从“功能拼凑”迈入了“协同进化”的新阶段。对于复杂操作任务，这种机制能帮助模型更好地处理长程依赖、物体接触、遮挡和空间变化等问题。

　　实验数据证明了这条路线的有效性。在VLM评测中，Pelican-Unify 1.0在8个通用及具身基准测试中取得64.7的平均分，均达业界最优水平；在更具具身属性的Where2Place和PhyX测试中，相比基座模型分别提升28.2分和20.6分，证明统一训练并没有削弱通用多模态能力，反而增强了空间理解、物理理解和行动相关语义。在动作执行层面，该模型在RoboTwin 50项双臂操作任务中取得93.5%的平均成功率，其中31项任务成功率超过95%，15项达到100%，覆盖插拔、堆叠、交接等复杂场景，与当前最佳模型性能基本持平。

　　迈向通用具身智能

　　Pelican-Unify 1.0作为通用具身智能平台“慧思开物”的重要组成部分，其登顶意义不止于榜单第一，更在于提出了一条更接近通用具身智能的建模路径：它让模型既能保持专家能力，又能在真实任务中形成更完整的闭环智能，形成一个能够把“看见、思考、想象、行动”统一起来的自适应系统。

　　当前，北京人形以通用机器人平台“具身天工”和通用具身智能平台“慧思开物”为双核心，正构建起覆盖“本体-大脑-小脑-平台-生态”的全栈式闭环体系。北京人形凭借“双冠王”技术积累，降低具身智能的进入门槛，加速人形机器人从专用设备向通用生产力工具的演进。在北京亦庄这片创新热土上，一个能理解目标、推理过程、预判后果并精准执行的通用具身智能平台，正从实验室走向千行百业。融媒体中心孙艳平

相关新闻