多机器人系统的学习型协同感知与控制多机器人系统(MRS)通过多智能体协同可解决复杂现实问题,但受困于维度灾难——问题规模扩大时,求解难度呈指数级增长。基于学习的方法为多机器人规划带来新机遇:其将昂贵集中式求解器的在线计算负担转移至离线学习过程,显著提升可扩展性。近年研究表明,**图神经网络(GNNs)**能学习显式通信策略以实现复杂多机协同。在MRS中,机器人被建模为图节点,通信链路为边,各机器人内部状态为图信号。通过通信链路传递消息,每个机器人可获得比局部观测更精确的全局状态估计。然而,将这些策略从理论模型迁移至实际MRS仍面临关键挑战:专家数据通常生成于仿真环境,但仿真训练的策略往往难以泛化至现实世界。这种可迁移性缺失被称为现实鸿沟,而跨越该鸿沟的仿真到现实(sim-to-real)迁移成为核心难题。单机器人领域的sim-to-real迁移主要处理机器人与物理环境的交互,而多机器人领域还需考虑机器人间交互。通信是高效多机协同的关键,但现实鸿沟对通信的影响尚未明晰。例如:多机协同训练通常采用同步通信,而实际部署需异步分布式通信;消息丢包、延迟等随机因素在同步训练中常被忽略。现有研究鲜少评估模型对此类因素的鲁棒性及其对策略性能的影响。现实MRS需依赖去中心化网状通信网络,这为sim-to-real迁移带来额外挑战。
研究贡献本论文提出一系列创新框架,用于去中心化现实MRS的控制与感知策略部署验证:1. 可学习通信的多机协同控制首次通过可微分通信信道结合强化学习(RL),训练支持可学习通信的多机协同策略,并在多种仿真场景验证;构建包含9台敏捷地面机器人的Cambridge RoboMaster实验平台,实证对比集中式与去中心化部署方法,揭示sim-to-real迁移效应。2. 可学习通信的多机协同感知突破依赖外部定位基础设施的全局状态协同范式,探索基于单目相机局部感知的策略训练:开发GNN视觉导航策略,实现无需标定的移动机器人目标引导;融合控制与感知技术,提出多机器人视觉空间基础模型,支持实时去中心化感知与控制。该模型通过单目图像预测相对位姿与局部地图,性能超越需重叠视野与预设网络架构的传统方法;在多机编队控制任务中验证模型有效性,展示室内外场景下的去中心化部署能力。研究意义本论文弥合了MRS理论学习与实际部署的鸿沟,所提方法为构建高效、自适应的现实MRS奠定基础。