第二次世界大战后,化学战剂和弹药被倾倒在波罗的海和北海。由于暴露在海水中长达数十年,其容器正在被腐蚀,其内容物正在被释放到海水中。为了评估环境后果的严重性,必须尽快找到这些化学战剂并调查其状况。遗憾的是,搜索这两个海域需要很长的时间。为了缩短搜索时间,可以使用自动潜航器(AUV)进行搜索,这种潜航器可以同时搜索多个区域。使用自动潜航器的一个缺点是,由于无线电信号在海水中会衰减,在操作过程中与自动潜航器的通信非常有限。因此,当 AUV 出现故障或扫描性能下降时,很难重新分配分配区域。本论文的目标是开发可用于水下作业的算法,让 AUV 在没有集中通信的情况下,根据全局目标函数优化其行动。
无线电信号在海水中的衰减严重影响了水下通信能力。因此,需要采用分布式方法来优化 AUV 的行动。搜索问题可在分布式约束优化问题(DCOP)框架内建模,以明确定义计算智能体及其通信。由于变量域的定义,传统的 DCOP 无法有效地模拟现实世界中的应用。域定义了可分配给变量的所有可能值。在 DCOP 中,这些域是离散的,而现实世界中的问题通常以连续域为特征。我们在连续 DCOP(C-DCOP)框架内对基准问题和具有连续域的实际问题进行建模,并将其应用于 AUV 操作。这既保留了 DCOP 中固有的建模灵活性,又消除了离散域定义所带来的限制。
本文介绍了两种 C-DCOP 算法。这两种算法都直接在 C-DCOP 上运行,不需要对(标量)变量的连续域进行先验离散化。压缩-DPOP(C-DPOP)算法在每次迭代时对每个变量的域进行离散化,并对域进行压缩。压缩指的是以中间解为中心更新域的上下限的过程。这一过程的重点是搜索空间中效用值较高的区域。为了能够调整算法的通信要求,优化过程中交换信息的大小是通过参数设置的。该算法的这一特性有利于通信带宽较低的应用。分布式贝叶斯(D-Bay)算法利用贝叶斯优化来解决 C-DCOP 问题,而无需离散化。所有智能体都将其变量对全局效用的影响建模为高斯过程。效用函数的属性通过适当选择高斯过程的核来建模。这些模型用于权衡搜索空间的探索和利用,从而高效地解决 C-DCOP 问题。当效用函数的 Lipschitz 常量已知时,D-Bay 算法保证收敛到全局最优。
在本文中,除了基准问题,还给出了针对真实世界多智能体搜索问题的高保真模拟和实际实验结果。模拟了一次反水雷行动,其中 AUV 在搜索过程中根据声纳性能更新其搜索区域。声纳性能定义为侧扫声纳传感器的有效扫描范围。重新分配指定区域,以优化基于预期完成时间和区域内所有类雷物体被探测到的置信度等相关指标的全局目标。结果表明,对自动潜航器的搜索区域进行现场优化具有提高其效率的潜力。此外,还介绍了针对多无人系统(UAV)搜索问题的实际实验结果。无人系统配备了低带宽通信网格网络,以模拟水下航行器的通信能力。D-Bay 算法在现实世界自主系统上的成功应用表明,该算法与水下作业兼容。
海底危险物体的搜索应更加高效,以便及时发现和评估这些物体。通过提高自动潜航器的自主性,可在作业期间对其行动进行合作优化,从而提高搜索效率。本文的研究通过所开发的算法及其在实际问题中的适用性为这一战略做出了贡献。模拟问题表明,AUV 在反水雷行动中的搜索效率有所提高。此外,无人系统的实际实验表明,该算法适用于通信带宽较低的多智能体系统。