针对多智能体路径规划(multi-agent path finding, MAPF)问题研究的算法在智能仓储物流、户外危险场地 和城市道路网络等领域有着广泛的应用。 根据不同的求解思路,关于 MAPF 问题研究设计的算法主要可以分为基 于搜索的传统算法和基于学习的智能算法 2 类。 在基于搜索的传统算法研究中,按照路径规划效果不同,又可分 为最优 MAPF 算法和次优 MAPF 算法。 最优 MAPF 算法主要分为基于 A*的搜索、基于代价增长树的搜索 (increasing cost tree search, ICTS)和基于冲突的搜索(conflict based search, CBS)这 3 类;次优 MAPF 算法主要分为 无边界次优的算法和有边界次优的算法 2 类。 基于学习的智能 MAPF 算法可以大致分为结合专家经验的算法和 基于图神经网络(graph neural network, GNN)的算法 2 类。 根据上述分类介绍了近年来具有代表性的研究成果,分 析了各种算法的特点,并对 MAPF 问题未来的研究方向进行了展望。

多智能体路径规划( multi-agent path finding, MAPF)是指在不发生碰撞的前提下对不同起始位 置的多个智能体规划到达各自目标位置的路径,同 时保证一定的路径质量[1] 。 针对该问题的研究在 户外危险场地[2-3] 、智能仓储系统[4] 、城市道路网 络[5] 、电子游戏[6]和航空航天[7] 等领域有着广泛的 应用前景。 特别是在物流运输领域,随着电子技术 和控制理论的快速发展, 自动导引车 ( automated guided vehicle,AGV)作为一种高度智能化的移动机 器人,以较高的可靠性和独特的安全性在实际生活 中得到了广泛的发展和应用,将逐渐替代传统的人 工运输,进而实现运输的智能化。 在部署了大量 AGV 的场景中,高效的 MAPF 算法对于智能体协同 完成任务至关重要。 因此,该领域的研究得到了学 术界和业界的广泛关注。 近年来,针对 MAPF 问题的研究取得了众多极 具价值的进展。 传统的基于搜索的 MAPF 算法通常 为集中式路径规划算法,采用在联合状态空间中搜 索有效路径的方法,因而计算复杂度较高,需要消耗 大量的计算资源,适用于场景地图信息已知且智能 体数量较少的场景,在静态环境下有着良好的表现。 随着完成任务所需的智能体数量的增加、应用场景 规模的扩大以及环境中存在障碍物的动态变化, MAPF 问题变得更加复杂。 研究人员进一步引入了 优先级规划和重规划来提升 MAPF 算法的有效性和 运行效率。 近年来,在人工智能以及机器学习算法 发展的推动下,基于学习的 MAPF 算法逐渐成为了 研究趋势,其在环境信息部分可感知的大规模动态 环境的情况下展示出良好的性能与潜力。 虽然国内外针对 MAPF 问题的研究已经逐渐成 熟,但是对该问题及其派生问题的综述文献较 少[8-11] 。 最新的相关综述文献只给出了经典 MAPF 问题的定义和静态环境下的小规模问题中传统 MAPF 算法的简单分类,没有涉及最新的基于学习 的 MAPF 技术研究。 因此,本文对 MAPF 问题的研 究发展进程进行了详细的调研,从传统的基于搜索 的 MAPF 算法和新兴的基于学习的智能 MAPF 算法 2 个分支对相关研究工作进行了全面的归纳总结, 以便于相关研究人员对 MAPF 问题建立清晰的认 识,进而开拓新的发展方向。 MAPF 算法可分为基于搜索的 MAPF 算法和基 于学习的 MAPF 算法。 基于搜索的传统算法按照路 径规划效果不同,又可分为最优 MAPF 算法和次优 MAPF 算法。 最优 MAPF 算法主要分为基于 A*的 搜索、基于代价增长树的搜索( increasing cost tree search, ICTS ) 和 基 于 冲 突 的 搜 索 ( conflict鄄based search, CBS)这3 类算法;次优 MAPF 算法主要分为 无边界次优算法和有边界次优算法 2 类。 基于学习 的智能 MAPF 算法可以大致分为结合专家经验的算 法和基于图神经网络( graph neural network, GNN) 的算法 2 类,其中结合专家经验的智能算法又可分 为结合多智能体经验和单智能体经验 2 种。 本文首先介绍了经典的 MAPF 问题及相关概 念,给出了问题定义和问题性质。 其次,介绍了传统 的基于搜索的 MAPF 算法,主要从求解结果的最优 性、次优性进行分类,阐述了相关算法的基本思想。 然后,介绍了基于学习的智能 MAPF 算法,按照结合 专家经验的算法和基于 GNN 的算法分别进行阐述, 并且对算法设计的独特之处进行提取。 在归纳整理 现有研究的基础上,总结了现有场景中针对 MAPF 问题所面临的实际挑战,并对未来的研究方向进行 了展望。

成为VIP会员查看完整内容
41

相关内容

“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
时序知识图谱补全方法研究综述
专知会员服务
35+阅读 · 3月22日
无人机集群协同搜索研究综述
专知会员服务
61+阅读 · 3月4日
大规模图神经网络研究综述
专知会员服务
78+阅读 · 2023年8月25日
逆强化学习算法、理论与应用研究综述
专知会员服务
61+阅读 · 2023年8月2日
视觉惯性导航系统初始化方法综述
专知会员服务
33+阅读 · 2023年4月14日
多智能体协同决策方法研究
专知会员服务
117+阅读 · 2022年12月15日
专知会员服务
40+阅读 · 2021年7月24日
专知会员服务
142+阅读 · 2021年2月3日
专知会员服务
18+阅读 · 2020年12月23日
专知会员服务
106+阅读 · 2020年10月27日
「基于通信的多智能体强化学习」 进展综述
智能合约的形式化验证方法研究综述
专知
15+阅读 · 2021年5月8日
多模态情绪识别研究综述
专知
21+阅读 · 2020年12月21日
多模态视觉语言表征学习研究综述
专知
27+阅读 · 2020年12月3日
时空序列预测方法综述
专知
20+阅读 · 2020年10月19日
实体关系抽取方法研究综述
专知
11+阅读 · 2020年7月19日
【综述】生成式对抗网络GAN最新进展综述
专知
57+阅读 · 2019年6月5日
红外弱小目标处理研究获进展
中科院之声
17+阅读 · 2017年11月19日
综述——隐私保护集合交集计算技术研究
计算机研究与发展
22+阅读 · 2017年10月24日
国家自然科学基金
5+阅读 · 2017年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
148+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
375+阅读 · 2023年3月31日
Arxiv
63+阅读 · 2023年3月26日
Arxiv
132+阅读 · 2023年3月24日
Arxiv
19+阅读 · 2023年3月17日
VIP会员
相关VIP内容
时序知识图谱补全方法研究综述
专知会员服务
35+阅读 · 3月22日
无人机集群协同搜索研究综述
专知会员服务
61+阅读 · 3月4日
大规模图神经网络研究综述
专知会员服务
78+阅读 · 2023年8月25日
逆强化学习算法、理论与应用研究综述
专知会员服务
61+阅读 · 2023年8月2日
视觉惯性导航系统初始化方法综述
专知会员服务
33+阅读 · 2023年4月14日
多智能体协同决策方法研究
专知会员服务
117+阅读 · 2022年12月15日
专知会员服务
40+阅读 · 2021年7月24日
专知会员服务
142+阅读 · 2021年2月3日
专知会员服务
18+阅读 · 2020年12月23日
专知会员服务
106+阅读 · 2020年10月27日
相关资讯
「基于通信的多智能体强化学习」 进展综述
智能合约的形式化验证方法研究综述
专知
15+阅读 · 2021年5月8日
多模态情绪识别研究综述
专知
21+阅读 · 2020年12月21日
多模态视觉语言表征学习研究综述
专知
27+阅读 · 2020年12月3日
时空序列预测方法综述
专知
20+阅读 · 2020年10月19日
实体关系抽取方法研究综述
专知
11+阅读 · 2020年7月19日
【综述】生成式对抗网络GAN最新进展综述
专知
57+阅读 · 2019年6月5日
红外弱小目标处理研究获进展
中科院之声
17+阅读 · 2017年11月19日
综述——隐私保护集合交集计算技术研究
计算机研究与发展
22+阅读 · 2017年10月24日
相关基金
国家自然科学基金
5+阅读 · 2017年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员