在视距(WVR)内进行空战需要执行复杂的空中机动和快速的顺序决策。如果加入额外的武器能力,这些决策的复杂性还会进一步增加。无人自主飞行器技术和武器能力的发展有助于克服人为限制带来的障碍。事实证明,自主无人作战飞行器(AUCAV)和定向能武器(DEWs)等先进武器能力在 WVR 空战中至关重要。这就引出了一个问题--AUCAV 能否拥有适当的人工智能和武器能力,以改进高质量的空战演习和战术?为了研究这个问题,本文提出并解决了广义空战机动问题(ACMP),在这个问题中,通过建模来控制一架防御型 AUCAV,该 AUCAV 正在寻求与攻击型敌机交战。该模型利用每架飞机的 5 自由度点质量来跟踪其状态转换,同时还跟踪内部携带的火炮和 DEW 能力。由于该问题的维度较高,提出了一种近似动态规划(ADP)方法,其中开发了一种近似策略迭代算法。这种 ADP 算法通过神经网络回归来实现高质量的战斗机战术和机动。计算实验结果表明,在 3 个问题实例中,有 2 个实例的 ADP 策略优于所有 3 个基准策略。ADP 策略学会了同时使用内部携带的火炮和 DEW,这促进了 ACMP 中任一武器平台的态势效益理念。在 WVR-ACMP 中加入 DEW 功能可以体现前所未有的空战战术。
本研究的其余部分安排如下。第 2 节概述了与空气动力学、定向能、1v1 ACMP、2v1 ACMP 和多智能体 RL 相关的现有研究。第 3 节阐述了 DEW MvN ACMP 的 MDP 模型,并介绍了我们确定高质量蓝色 AUCAV 机动策略的 ADP 求解方法。第 4 节介绍了对所产生的机动策略与基准策略进行比较的一系列定量分析。最后,第 5 节对本文进行了总结,并提出了未来研究的几个方向。