出于多种目的,能够在无人干预的情况下先进无人战车正在快速发展。毫不奇怪,预计它们也将极大地改变军事作战的方式。要在物理和逻辑上都存在对抗性环境中发挥这种新技术的潜力,就必须对安全风险进行相应的评估和管理。有关这一主题的研究指出,自主网络防御是加速将这些战车用于军事目的所需的能力之一。
在这里,本文通过探索强化学习来训练一个智能体,使其能够在军事行动中自主应对对无人战车的网络攻击。首先开发了一个简单的模拟环境,用于快速制作和测试一些概念验证智能体,以进行初步评估。然后,将这种智能体应用到更逼真的模拟环境中,最后部署到实际的无人战车上,以达到更逼真的效果。该工作的一个主要贡献是证明了强化学习是一种可行的方法,即使在简单的模拟环境中进行训练,也能训练出一种可用于真实无人战车自主网络防御的智能体。