在过去几年中,无人机蜂群受到了广泛关注,但对对抗性无人机群(即竞争性无人机群对无人机群游戏)的研究则较少。本文研究了团队对团队无人机空战场景中的影响因素,阐明了交战空间中兵力集中和对手分散的影响。具体来说,本论文有以下贡献:
1.战术分析: 确定了在小到 2 vs.-2 和大到 10 vs.-10 的交战中,明确协调战术或分散、贪婪战术的优势条件,并研究了这些模式如何随着团队武器质量的变化而变化;
2.协调战术: 介绍并演示了一种深度强化学习框架,该框架使智能体学会利用自身和队友的情境来决定在什么情况下采用哪些预先设定的战术,以及在整个交战过程中与哪些队友(如果有的话)进行协调;在 N 对 N 的交战中,在 N 小到 2、大到 64 的情况下,使用在此框架内训练的神经网络的智能体在与采用基线战术的智能体团队的交战中的效能优于基线战术;
3.生物启发协调: 通过基于 Monte-Carlo 智能体的模拟发现,不仅要优先集中团队力量对付威胁最大的对手智能体,还要通过部署较小的防御力量和防御高优先级威胁之外的低处罚威胁来保留一些资源,从而最大限度地利用防御团队燃料库中的剩余燃料。
图 4.7:测试集模拟的注释剧照(蓝队获胜)。请注意,在有注释的智能体集群中,蓝队的智能体(左侧为 PSCE(4-vs.-4 训练有素的 GS))将目标分散到所有靠近的红队成员身上,而对手(右侧为 16 个 GS,红色)则瞄准了最前面的 PSCE 智能体。与 GS 相比,训练有素的 PSCE 智能体更善于将力量集中分散到对手的智能体中。