针对无人机集群动态攻防问题, 提出了态势演化博弈模型。首先,从基地与守方无人机集群相互作用以及攻防双方动态斗争角度出发, 构建了攻方无人机与守方无人机的态势演化博弈模型。其次,设计了同态势演化博弈模型相对应的态势评估函数, 使每阶段个体的策略选择都为该阶段的最优解。然后,根据策略选择, 结合社会力模型, 驱动无人机向指定目标运动, 完成攻防双方无人机集群的动态对抗。实验结果表明, 无人机集群的动态运动符合空战情况, 验证了基地在具备功能时的优越性, 以及设计的态势演化博弈模型能够实现无人机集群对抗决策的自适应选择。
无人机在军事和民用领域都有广泛的应用[1-3], 在复杂条件下, 可以替代有人机执行“枯燥、恶劣、危险、纵深(dull, dirty, dangerous and deep, 4D)”任务[4]。随着人工智能(artificial intelligence, AI)技术的发展, 集群控制成为无人机应用的发展方向[5]。无人机集群作战[6-8]也成为无人机军事应用的研究热点。
现阶段无人机集群动态攻防的研究仍处于初步阶段, 实现的方法主要包括: 基于专家系统和基于博弈论。 基于专家系统[9]的规则制定, 就是通过总结以往空战经验, 设计态势评估函数, 针对障碍物或者敌我态势, 己方选择相应行为准则。文献[10]设计了一种自组织的攻防对抗决策(offense-defense confrontation decision-making, ODCDM)算法, 利用分布式决策, 通过与邻近友机的通信, 完成态势感知, 求解控制输入, 实现无人机集群的对抗。文献[11]提出了一种将模糊专家系统与差分进化算法相结合的逃逸机动决策算法, 通过以往战术知识的学习, 建立模糊专家系统, 根据模糊专家系统实现机动动作的选择, 而后经过差分算法寻优, 最后完成对机动动作的最优控制。Yang[12]等利用深度Q网络(deep Q network, DQN)搭建了无人机决策模型, 计算敌我双机对抗过程中的态势变化, 根据机动动作库中相应规则, 完成无人机决策。 虽然基于专家系统的无人机集群算法能够有效且稳定地解决无人机集群对抗问题, 但是其依赖于专家库的建立, 处于不确定环境或者集群规模过大时, 存在调试时间长, 策略选择不是最优等不足。
基于博弈论[13-16]的方法, 就是一类研究智能体之间策略交互的数学理论与方法[17]。相比专家系统, 该方法不需要先验知识, 可以通过自学习逐步获得最优策略。文献[18]提出了一种基于演化博弈框架下的多智能体策略竞争, 设立了合作、惩罚、投机以及孤立4种策略, 通过初始条件的变化, 验证了多智能体运动的演进方向。文献[19]基于捕食猎物粒子群优化(predator-prey particle swarm optimization, PP-PSO)的博弈论方法, 将攻防对抗中的复杂任务分配转化为每阶段的双方博弈, 然后利用PP-PSO求解与之对应的纳什均衡, 保证攻防双方在对抗过程中采取对己方最有利的策略。文献[20]基于竞争学习鸽群优化(competitive learning pigeon-inspired optimization, CLPIO)算法, 采用分布式群对抗方式, 分别设计了两种动态博弈模型: 仿鹰的攻击子群和仿鸽的对抗子群, 利用CLPIO算法寻找混合纳什均衡。文献[21]利用多人动态博弈分解解决多无人机追逃问题, 降低了时间复杂度, 提升了运行速度。但是,这些基于博弈论的无人机集群攻防对抗, 在涉及基地概念时, 多数将其作为目标点, 基地并不具备功能, 这与实际情况存在差异。
本文结合专家系统和演化博弈的优点, 提出了态势演化博弈模型。贴近实际作战场景, 赋予基地探测功能, 基地能够提高守方无人机的态势感知能力, 并且能够与守方无人机集群保持通信。在此基础上, 构造了基地-守方无人机集群-攻方无人机集群三者相互影响的攻防情形。首先, 分别设计了攻方无人机态势评估函数、守方无人机态势评估函数和基地态势评估函数, 切实体现对抗过程中攻防双方的态势变化情况。然后, 将各阶段态势变化, 代入演化博弈模型, 使每一阶段的演化博弈过程延伸到全阶段全员的博弈, 并使攻防双方在各阶段都处于演化稳定状态(evolutionary stable state, ESS), 实现攻防双方无人机集群对抗策略的自适应最优选择。