北京人形发布全国首个多智能体协同系统
同构臂遥操作真机和仿真天工实时演示,精准复现操作员的动作。 北京人形/供图
本报讯(融媒体中心 孙艳平)近日,世界人工智能大会(WAIC)在上海开幕。在这一被视为全球人工智能技术风向标的盛会上,北京人形机器人创新中心(又称“国家地方共建具身智能机器人创新中心”,以下简称“北京人形”)发布全国首个工业“多本体、多场景、多任务自主协同作业”实战演示,意味着其自研的通用具身智能平台“慧思开物”在分布式具身智能体系统能力方面已实现全面升级。
当前,具身智能仍停留在“单场景、单任务、单构型”的早期阶段。行业亟需一套通用、可扩展的平台,支持多个结构不同的机器人在复杂真实环境中的应用。为此,北京人形带来多个工业场景具身智能体协作展示,该系统基于“慧思开物”构建,具备跨本体兼容、任务异步协同自主调度,实现了真正意义上的“一脑多机、一脑多能”。这也是业内首个实现了公开真机演示的多具身智能体协作应用。
在WAIC展区,北京人形呈现了一条完整的工业场景任务链:在通用具身智能平台“慧思开物”的统一指挥下,各智能体机器人自主相互通报进展、沟通工作,电控柜操作区模拟精细操作,灯泡质检线完成工业检测,物品封装区执行封装作业,还有机器人穿梭于三个场景之间,完成搬运工作。
在观众看来,操作员只需在“慧思开物”App上发送“开始”指令,多个机器人就能协同完成全链路操作。这背后,“慧思开物”系统通过分布式具身智能体架构,在四个机器人本体上分别部署“电工大师”“搬运工”“质检员”“封装助手”四个任务执行智能体,并同时在云端部署了任务调度智能体,将子任务分发给四个机器人协同完成,现场多个智能体共同构建起一个高效的“任务执行网络”。
在常见的智能体工作流中,同一时刻仅有一个或部分智能体被激活,只能支持同步工作流,而“慧思开物”系统让所有智能体都处于活跃异步协作状态。机器人根据任务优先级与自身状态自主执行任务,能够像人一样通过自然语言而非程序代码相互沟通,完成后触发下一阶段协作流程,实现真正意义上的“机器决策机器”。
相比同步工作流,多具身智能体异步协作对整体系统提出更高级别的挑战:每个智能体机器人都配备独立的大脑与小脑,使得它们既可以完全独立工作,又能协同作业,具备从认知到执行的全链条能力。为攻克这一难题,北京人形研发团队在分布式具身智能体系统、多模态操作VLA大模型、视觉理解、空间感知、复杂任务理解、任务精准拆解、工具调用、双臂协作、自主纠错等关键技术上实现了持续迭代进化,构筑起支持未来多场景泛化、跨机器人协同的核心技术底座。
在展区另一侧,人形机器人“天工2.0”正伴随音乐展示动感舞蹈,成为围观人群的焦点。
秀“动感舞蹈”是对人形机器人全身运动控制能力的集中展示。全尺寸的人形机器人跳舞,因为身高和体重的增加会导致整体难度呈指数级增长;同时42个高自由度的动态联动,还考验系统多关节协同、实时规划与抗干扰能力的极限,想要顺利完成全身协同的复杂动作难度极大。在高速舞动中,“天工2.0”凭借下肢的大运动范围与高扭矩、上肢的精准控制和躯干的灵动姿态,实现了全身重心的持续稳定和高动态平衡控制。除了在运动控制与系统协同方面的精彩表现之外,更长的续航能力、更灵活的上肢操作,也为“天工2.0”未来广泛应用于工业场景、物流场景奠定了基础。
此外,在现场的数据采集区,观众还能直观了解北京人形自研的同构臂遥操作真机和仿真“天工”的实时演示。操作员的每一个动作,都能被真机和仿真机器人精准复现和完整记录,这种高动态、高保真的数据采集为算法训练提供了素材。配合北京人形自研数据采集平台,完整呈现了从虚实结合的数据获取到模型训练的全链条技术能力。这些数据不仅支撑了算法的快速迭代,更为行业标准化发展奠定基础。北京人形发布的RoboMIND数据集已累计下载使用超4万次,成为具身智能研究的重要开源资源。
工业场景“多本体、多场景、多任务自主协同作业”能力的突破,预示着具身智能正在从“展示型”向“应用型”演进。北京人形的这次亮相不仅完成了对具身智能技术能力的全面检阅,也为工业制造的智能化升级提供了全新路径。接下来,在8月8日即将在北京经开区开幕的2025世界机器人大会上,全新升级的“天工”还将重点展示其自主导航能力,以及全身控制的自主操作等核心技术,加速人形机器人在实际场景中的规模化落地。