人工智能(AI)的进展,特别是深度强化学习(RL),已经产生了能够达到或超过专业人类水平的系统。这项研究探索了RL训练人工智能agent的能力,以实现小型战术交战中的最佳进攻行为。agent在一个简单的、总体级别的军事建设性模拟中接受了训练,其行为得到了规模和经济力量战术原则的验证。结果显示,所应用的战斗模型和RL算法对训练性能的影响最大。此外,特定的超参数训练也有助于行为的质量和类型。未来的工作将寻求在更大和更复杂的战斗场景中验证RL的性能。