首页 > 要闻动态 > 高端产业发展高地 > 智能创新

北京亦庄企业发布新一代具身基础模型

  本报讯(融媒体中心 孙艳平)“帮我把毛巾放进洗手池。”面对同一指令,过去,机器人只会机械地执行预设动作;如今,北京经济技术开发区(简称北京经开区,又称北京亦庄)企业星海图发布的新一代具身基础模型G0.5,让机器人做到边思考、边行动。星海图有关负责人表示:“通过创新VLA(视觉-语言-行动)模型架构设计,G0.5能同时完成推理和行动,让机器人能像人一样拥有‘行动中的思考能力’,即先想毛巾在哪、洗手池在哪,然后根据情况拿起毛巾、移动并放下。”

  在星海图R1 Lite机器人上,G0.5实现了“零样本”直接干活。面对从未见过的环境布局、物体类别和指令组合,仅凭自然语言,搭载该模型的机器人就能实时理解意图、分解动作,并输出流畅的双臂控制。该负责人表示:“过去,机器人每学习一项新任务,就需要重新采集数据、微调模型和适配场景,很难泛化到新环境,G0.5则让机器人形成了可迁移、可组合的操作智能。”

  G0.5如何实现这一跨越?关键在于三大核心能力的突破。首先,星海图设计了统一异构动作编解码器,让一种“动作语言”覆盖各类机器人。不同机器人的形态、自由度、控制频率千差万别,导致知识无法共享、计算资源浪费。G0.5设计了统一的异构动作编解码器,用一套动作词表就能覆盖从桌面双臂到全身移动操作的各类本体,让知识在不同机器人之间自由迁移,计算资源开销也控制在合理范围。

  其次,星海图打造了原生动作思维链,让机器人不仅“边思考边行动”,还听得懂“怎么做”。传统做法中,机器人的“思考”和“行动”是两套系统——推理结果要压缩成中间状态再传给动作模块,信息损失大、反应慢。G0.5把思维链与动作生成融合在同一流程中,模型先输出子任务分解、目标识别、轨迹规划等推理结果,再输出动作指令。

  此外,星海图研发时空注意力模块,让机器人有上下文记忆、不怕“断片”。真实环境中,当视线被机械臂短暂遮挡,或任务意外失败时,机器人必须依赖历史上下文才能维持稳定的空间感知。G0.5配备轻量级时空注意力模块,融合数秒的历史视觉信息,使机器人在局部视野丢失时依然能稳健执行。

  在行业测试表现中,星海图G0.5不仅在七大独立评测基准上取得全面SOTA(业界最优)成绩,还登顶了全球最难长程移动操作基准BEHAVIOR-1K。

  从“执行预设程序”到“边思考边行动”,星海图此次的模型突破,也为北京亦庄具身智能产业发展注入新活力。该负责人表示:“下一步,星海图将在更多机器人数据、更复杂的环境、更长时序的任务中持续推进模型应用和迭代,并计划开源模型,支持多种机器人本体的‘开箱即用’部署,助力开发者开展落地实践。”


相关新闻