随着廉价、现成的自主平台可靠性的提高,多智能体系统对军事行动造成的风险也在增加。仅在当代俄乌战争背景下,我们就看到自主飞行器和水面舰艇被单独或成批部署,为双方带来关键影响。虽然有大量文献涉及战术层面的通信和智能体之间的互动,但对支撑未来自主多智能体军事行动的高层指挥与控制(C2)结构的探索却是一个探索较少的研究领域。我们提出了一个定量博弈论框架,用于研究合作和竞争性多智能体蜂群场景中的有效 C2 结构。为了测试我们的框架,我们构建了一个虚拟环境,在这个环境中,两个敌对蜂群展开竞争,以取得与真实世界场景相当的结果。我们在本文中提出的框架使我们能够快速测试和询问多智能体系统中的不同 C2 配置,以探索 C2 在处于兵力劣势时作为兵力倍增器的作用。
图 1:场景说明。实线表示 C2 的分级联系,虚线表示对抗性互动。
在 21 世纪的军事冲突中,越来越多地使用低成本的自主平台来提供显著的不对称效果[1-3]。在最近的俄乌冲突中,无人驾驶航空系统(UAS)的使用推动了自主能力的发展[1, 2]。虽然单个平台所能产生的影响显而易见,但表现出多智能体行为(如蜂群或成群)的平台有可能带来更大的军事成果。
对新一代平台至关重要的蜂群[6-9]和自同步[10-15]行为经常在许多不同的自然和网络物理系统中观察到。虽然对这类系统的研究在文献中已经有了一定的基础,但通常都是孤立地进行探讨。与通常的分离相反,可以说集体行为的发生离不开同步。也就是说,智能体(无论是异质的还是同质的)之间的交流与协调构成了驱动此类系统的基本动态的一个关键方面。
奥尔法提-萨伯的早期研究认为,外部空间状态与系统中智能体的内部同步动力学之间存在不耦合的相互作用。这一概念在 "swarmalator"[3, 4]中得到了进一步的探索,在 "swarmalator "中,系统中每个智能体的空间动态和同步动态都是耦合的。在这个模型中,智能体的内部决策状态会导致集体同步,而集体同步又会驱动智能体的空间动态。Swarmalators 是一个活跃的研究领域,除应用于其他网络物理系统外,还应用于蜂群机器人技术 [5, 6]。
随后,McLennan-Smith 等人[6]通过引入两个群体集来研究系统中新出现的对抗行为,将蜂群器的概念扩展到竞争模型中。两个智能体子群观察到的阶段转换被比作军事演习,并通过军事演习的视角进行分析。在扩展蜂群模型中观察到的对抗行为适合研究一个种群如何采用一种策略来超越其对手。
与以往的研究不同,我们引入了博弈论的视角来研究蜂群的对抗行为。此外,我们还采用了分层指挥和控制(C2)结构,以探索在异质(人类和机器)团队竞争的背景下,蜂群智能的出现。利用这一框架,我们探索了作为力量倍增器的 C2 以及每个群体为在其决策空间的限制内实现相互冲突的目标而采用的主导策略。
本文的贡献如下:
1.将蜂群动力学与博弈论驱动力分层,以展示增强的决策动力学
2.开发具有分层 C2 的异构多智能体蜂群环境。
本文的其余部分安排如下。第 2 节和第 0 节详细概述了 Swarmaltor 模型和我们的环境。随后在第 0 节讨论博弈论部分,最后得出结论。
图 3:C2 游戏开始时蓝方和红方总部的 C2 结构和初始 OODA 状态。
我们模型的决策部分利用仓本动力学[7]来表示蜂群和自主系统的同步行为[8, 9, 10]。虽然存在许多不同的决策框架 [18-20],但我们利用的是博伊德观察、定向、决策、行动(OODA)循环 [11] 的既定数学定义。也就是说,我们利用 OODA 循环将智能体的内部决策状态(阶段)投射到单元圆上,如图 2 所示。我们的模型将 OODA 与 Kuramoto 动力学相结合,以捕捉指挥与控制的决策要素,这已在军事背景下的人类决策中得到验证 [22-25]。
我们将两个参与者正式表示为一组决策智能体,分别标记为 "蓝方 "和 "红方"。这两组被进一步分割,以表示我们模型中的分层 C2 组件。因此,我们得到四组智能体,分别用𝐵1、𝐵2 和𝑅1、𝑅2 表示蓝方和红方玩家的总部和蜂群子集,如图 1 所示。
我们设𝐿 为系统中智能体的总数。在本文中,我们设定总部都包含 21 个智能体,蓝方和红方的蜂群分别包含 20 个和 25 个智能体,总计 𝐿 = 86 个智能体。因此,在没有优势决策的情况下,情景将有利于红方。图 3 展示了两个参与者的精确网络结构,其中包括两个分级总部,它们在分级结构的最低等级相互影响。在这些总部中,最低等级的智能体之一被指定为 "总部蜂群控制器",负责向其集体蜂群发送影响整体决策状态的指令。