军事模拟既是培训工具,也是分析手段。在训练方面,模拟为领导者提供了一个机会,让他们做出名义上的重大决策,并演练这些决策的后果。另外,分析性模拟还提供了一种测试能力、部队设计和理论的反复且相对廉价的方法。鉴于所需的专业知识和数据,通过脚本或模仿学习的方式为大规模作战模拟实施人工智能(AI)似乎令人生畏;然而,最近业界在强化学习方面取得的成功,开发出了能玩商业电子游戏的人工智能,这提供了一条令人兴奋的前进道路。多模型方法与强化学习相结合,在行动空间和可扩展性方面相对简单,因此在军事模拟中具有巨大潜力。多模型方法不使用结构复杂的组合式行动空间进行强化学习,而是使用下级人工智能模型作为智能体的行动空间,有效地委托下级行动决策。本研究提供了强化学习(RL)多模型和分级多模型的概念验证,分级多模型是一种利用军事单位固有分级结构的多模型类型。此外,本文还展示了时间抽象和方向变换器的应用如何提高分层多模型的性能。