无人机(UAVs),通常被称为无人飞行器或无人机,由于其灵活性(即在三维空间中自由移动的独特能力)和持续降低的成本,具有深刻影响众多应用的潜力,如检查、灾后评估和搜索及救援(SaR)。然而,尽管最近技术取得了进步,商业上可用的无人机要么由经验丰富的飞行员手动操作,要么主要基于GPS以半自动模式飞行。为了使用小型旋翼无人机自动化上述任务,研究社区一直在专注于提高它们在依赖机载传感器进行姿态估计、制图和路径规划的同时,自主导航未知环境的能力。还提出了部署多个机器人的更高级的扩展,以进一步提高机器人任务的有效性,因为在时间关键的应用,如救援行动中,效率尤为重要。然而,在大大加速任务的同时,部署多个无人机涉及到一系列在群体协同定位和协调方面的困难。受这些挑战的启发,本论文首先解决了多机器人协作进行检查和探索任务的问题,而在第二部分,它集中于感知感知导航的问题,这在文献中也被称为主动规划。
为了放宽多机器人规划中的典型假设,例如代理的基准位置的可用性以及环境的先验地图,第一种方法提出了一个集中式的多机器人架构,包括状态估计、密集制图和多代理协调。目标是使用一队执行预定义粗略任务计划的无人机生成大规模感兴趣结构的一致性3D地图。然而,尽管提出了一个完整的、可应用的解决方案,这种方法需要人类操作员的初始指导。为了解决这个局限性,在后续的方法中,提出了一种用于自动探索森林的分散协调策略。由于这种类型的场景在搜索和救援(SaR)中很常见,最小化完成感兴趣区域覆盖所需的时间至关重要;因此,在这里,我们提出了一种能够利用无人机的敏捷性的高效策略,在任务期间始终保持较高的飞行速度,尽管环境中可能存在大量的障碍物和遮挡物。
尽管这两种方法展示出有前景的性能,但它们都依赖于一个假设,即通过诸如GPS之类的传感器可以直接并准确地估计无人机的姿态,但在很多情况下,这可能会失败,例如,当靠近建筑结构或靠近建筑物时。在无人机导航文献中,一种广为接受的替代GPS定位的方法是视觉-惯性同时定位与地图构建(VI-SLAM),其中使用图像序列和高速惯性测量来估计机器人的姿态。另一方面,VI-SLAM对无人机的运动非常敏感,而且基于摄像头的状态估计的性能与环境的视觉外观密切相关。由这些局限性推动,本论文的第二部分关注感知感知路径规划的问题,目标是通过产生对摄像头敏感的运动来最小化姿态估计的误差。受计算机视觉文献中语义分割成熟度的启发,将场景划分为语义上有意义的像素簇,本论文解决了使用语义提示进行主动规划的问题。与自动驾驶文献中进行的大量研究形成对比,据我们所知,这是首次提出用于无人机的语义感知主动感知方法。 在语义场景注释的指导下,首个提出的主动规划方法鼓励机器人在视觉可靠的区域上导航,例如固体场景结构(如建筑物),同时避免感知退化的区域,这些区域的特点是高动态或反射表面(例如水池)。在后续的方法中,这种使用语义来进行可靠的基于视觉的导航的概念得到了进一步推动,其中深度强化学习(RL)策略被训练用于在线识别VI-SLAM在任务执行过程中的有用区域。这允许无人机动态地根据所看到的场景调整其未来的轨迹,从而在鲁棒性和定位误差方面提高性能。然而,在实际任务的部署过程中,小型无人机容易受到一系列可能的威胁,如强风或传感器故障,这可能导致坠机。因此,在这些情况下,使它们能够找到合适的着陆点以自主着陆是至关重要的。为确保机器人和环境(特别是在城市地区)的安全,本论文以一种适用于多旋翼无人机的语义感知自主紧急着陆方法作为结尾。在这里,遵循深度RL范式,我们展示了语义信息通过利用语义类别之间的高级空间关联(例如,汽车和道路)能够更快地找到着陆点。所提出的流程可以在策略训练完成后立即直接部署在现实世界的实验中,无需额外的微调或领域适应。通过关注多机器人协调和无人机的感知感知主动规划,本论文提出的方法和系统有助于在具有挑战性的实际场景中部署自主空中导航。此外,还证明了在基于视觉的飞行和自主紧急着陆过程中,使用语义分割对路径规划非常有益。这导致了更加稳健的方法,能够在最先进的系统失败的地方取得成功,为机器人的更可靠的自主导航铺平了道路。