亦庄智慧为无人驾驶车打造“超级物理大脑”
“目前,我们的全无人物理AI商业化运营里程累计突破1.6亿公里。”北京亦庄企业智行者董事长兼CEO张德兆说。基于这一数据沉淀,智行者6月1日正式发布物理AI世界模型TransWorld,通过三重异构数据采集、四级数据精炼蒸馏与五层金字塔模型架构,构建起闭环自进化体系,为无人驾驶车辆打造“超级物理大脑”。
三重异构 让数据“长”在真实物理世界里
“算法与算力搭建了物理AI的骨架,但真正决定其智力上限的,是数据的‘真实物理浓度’。算法和算力可以快速拉升,唯独高质量的物理世界数据无法速成。”张德兆表示。成立11年来,智行者通过布局极限作业、智慧清洁、智能出行等多元场景,让1.6亿公里数据具备多维度、多形态、多场景三大异构特征。
聚焦维度异构,智行者搭载多元传感器阵列,实现全息数据融合。激光雷达感知三维空间,摄像头捕捉多视角画面,超声传感器探测近距离障碍物与透明物体,惯性测量单元(IMU)记录运动姿态,交互系统预判人车意图……这种多传感器融合的数据,不仅能记录机器看见什么,更完整记录了物理世界如何回应机器的每一个动作,为物理AI的深度训练提供稀缺、真实的燃料。
形态异构,体现在数据采集不局限于单一终端。蜗小白AI清洁机器人、蜗大白重型无人驾驶清扫车、提供应急巡检救援的极限作业智能体,以及服务于景区与公共出行的AI漫游车与Robobus,不同形态的智能体由同一个“物理AI大脑”调度,数据天然具备跨形态泛化能力,比如清洁场景中学到的避障策略,可以直接迁移给巡检机器人。
场景异构则体现在,覆盖工业仓储、交通枢纽、商综楼宇、医院校园、公园景区,乃至无地图的森林荒漠。这种“全场景深覆盖”,为模型提供了丰富的真实世界教材。
四级精炼 从里程积累到规律提纯
有了数据,如何释放价值?智行者对1.6亿公里里程进行了四级分层拆解与数据蒸馏,把原始数据变成驱动世界模型持续迭代的“超级燃料”。
具体来看,基础级是脱敏多模态数据,完整保留从视觉、雷达到底盘执行器的所有物理反馈与交互轨迹,支持世界模型自监督预训练和物理规律学习。第二级提炼出结构化场景数据,对写字楼、工厂、公园等场景精细打标聚类,转化为数字孪生中的标准化环境模板,为世界模型的推演与强化训练搭建基础场景库。第三级沉淀交互与博弈数据,涵盖低速漫游车礼让行人、中速清扫车避让外卖骑手、极限作业智能体高速协同通行等微观互动序列,构成训练物理AI意图预判与博弈决策能力的语料库。
作为“黄金集”的第四级高质量标注数据,经人机双重审核,实现机器感知与物理执行的全模态对齐。例如,蜗小白驶过带油污的减速带时,数据会精细标注“视觉识别为反光积液区域、雷达定位前方6厘米凸起、底盘记录摩擦系数瞬间降低40%并伴随垂直冲击力”。这种教科书般的样本,构成了AI理解物理常识的核心骨架,在强化学习中承担奖励评判职能,为模型推演试错提供清晰的进化方向。
五层架构 驱动物理AI进化
基于高价值数据沉淀,TransWorld采用五层金字塔架构,从底层感知到顶层泛化,形成完整的闭环自进化体系。
L1多模态感知基座层,将视觉、力学、本体感知等多模态数据深度融合,建立物理时空一致性,为构建覆盖低速、中速、高速的全速域数据集提供关键基础。
L2物理常识内化层,从海量数据中提炼摩擦、惯性、物体恒常性等规律,构建“物理常识脑”,这使得模型不再简单模仿,而是理解因果,即使面对从未见过的场景,也能预判交互结果。
L3物理世界仿真层,在数字孪生空间中搭建虚拟仿真工厂,相较于真实数据采集,仿真数据边际成本趋近于零,可无限生成高质量训练样本。
L4强化学习训练层,打通虚拟与现实的映射,校正仿真偏差,让智能体从“在仿真中学会思考”走向“在现实中稳健行动”。
L5泛化推理层,突破跨形态、跨场景迁移瓶颈,最终实现“同一个大脑”指挥“千姿百态的身体”。这意味着,无论是AI清洁机器人、AI漫游车还是极限作业智能体,新设备无需从头开始积累交互数据,只要给定少量适配样本甚至完全零样本,就能直接获得较高的执行性能,实现“一次学习,多形态部署”的能力闭环。
“1.6亿公里不是终点。”张德兆表示,“作为北京亦庄无人驾驶产业的重要一员,下一步,智行者将以TransWorld为超级基座,从北京亦庄的测试道路驶向更广阔的世界,加速打造全球领先的移动智能体平台。”融媒体中心 孙艳平