北京亦庄企业发布新一代具身基础模型_智能创新

北京亦庄企业发布新一代具身基础模型

来源：亦城时报时间：2026年06月08日 14:32

【字体：大中小】

　　本报讯（融媒体中心孙艳平）“帮我把毛巾放进洗手池。”面对同一指令，过去，机器人只会机械地执行预设动作；如今，北京经济技术开发区（简称北京经开区，又称北京亦庄）企业星海图发布的新一代具身基础模型G0.5，让机器人做到边思考、边行动。星海图有关负责人表示：“通过创新VLA（视觉-语言-行动）模型架构设计，G0.5能同时完成推理和行动，让机器人能像人一样拥有‘行动中的思考能力’，即先想毛巾在哪、洗手池在哪，然后根据情况拿起毛巾、移动并放下。”

　　在星海图R1 Lite机器人上，G0.5实现了“零样本”直接干活。面对从未见过的环境布局、物体类别和指令组合，仅凭自然语言，搭载该模型的机器人就能实时理解意图、分解动作，并输出流畅的双臂控制。该负责人表示：“过去，机器人每学习一项新任务，就需要重新采集数据、微调模型和适配场景，很难泛化到新环境，G0.5则让机器人形成了可迁移、可组合的操作智能。”

　　G0.5如何实现这一跨越？关键在于三大核心能力的突破。首先，星海图设计了统一异构动作编解码器，让一种“动作语言”覆盖各类机器人。不同机器人的形态、自由度、控制频率千差万别，导致知识无法共享、计算资源浪费。G0.5设计了统一的异构动作编解码器，用一套动作词表就能覆盖从桌面双臂到全身移动操作的各类本体，让知识在不同机器人之间自由迁移，计算资源开销也控制在合理范围。

　　其次，星海图打造了原生动作思维链，让机器人不仅“边思考边行动”，还听得懂“怎么做”。传统做法中，机器人的“思考”和“行动”是两套系统——推理结果要压缩成中间状态再传给动作模块，信息损失大、反应慢。G0.5把思维链与动作生成融合在同一流程中，模型先输出子任务分解、目标识别、轨迹规划等推理结果，再输出动作指令。

　　此外，星海图研发时空注意力模块，让机器人有上下文记忆、不怕“断片”。真实环境中，当视线被机械臂短暂遮挡，或任务意外失败时，机器人必须依赖历史上下文才能维持稳定的空间感知。G0.5配备轻量级时空注意力模块，融合数秒的历史视觉信息，使机器人在局部视野丢失时依然能稳健执行。

　　在行业测试表现中，星海图G0.5不仅在七大独立评测基准上取得全面SOTA（业界最优）成绩，还登顶了全球最难长程移动操作基准BEHAVIOR-1K。

　　从“执行预设程序”到“边思考边行动”，星海图此次的模型突破，也为北京亦庄具身智能产业发展注入新活力。该负责人表示：“下一步，星海图将在更多机器人数据、更复杂的环境、更长时序的任务中持续推进模型应用和迭代，并计划开源模型，支持多种机器人本体的‘开箱即用’部署，助力开发者开展落地实践。”

相关新闻