实时战略游戏已经成为开发和分析人工智能(AI)和基于深度机器学习的竞争、攻击者与防御者场景的算法的一个有吸引力的环境。基于计算机的实时战略游戏和用于军事训练的战争游戏的特征之间的相似性也提供了一种手段,可以将基于人工智能的实时战略游戏的结果和教训过渡到帮助和告知作战人员的决策能力。我们的论文研究了基于人工智能的实时战略游戏和军事决策中的战略规划之间的这种交集,这个领域被称为对抗性人工智能。我们描述了在实时战略游戏中开发有效的对抗性人工智能的问题和挑战,我们最近组织了一次对抗性人工智能竞赛,使用的是海洋环境中的模拟版夺旗游戏。我们讨论了比赛的条目、结果和从竞争者的反馈中获得的教训,并为基于人工智能的、复杂的、对立的实时战略游戏规定了未来的方向和公开的挑战。
近年来,人工智能(AI)已经成为用于军事和民用领域的自动化系统背后的主要使能技术。自动化系统必须不断与环境中的其他实体互动,包括人类、智能设备、计算机和其他人工智能。传统上,基于人工智能的系统在设计时假定与它们互动的其他实体是良性的。换句话说,互动的实体不会故意做出对抗性的行为来打败或颠覆人工智能。然而,在现实世界中,随着基于人工智能的系统变得更加普遍,敌对行为者不断想出新的方法来迷惑基于人工智能的系统,使其失败并以不正确、不安全甚至危险的方式运行。我们的论文描述了正在进行的应对这些挑战的努力,作为 "五眼"(FVEY)技术合作计划(TTCP)人工智能战略挑战(AISC)的一部分,在一个被称为对立人工智能(OAI)的技术领域。
OAI的目标是更好地理解来自不同利益相关者的基于人工智能的系统在以噪声和低质量数据为特征的环境中相互作用时出现的问题,这些利益相关者的心态和目标是不一致的,可能是相反的。OAI支柱的一个主要方向是将OAI问题建模为一个防御者与攻击者的游戏,并使用强化学习技术开发和分析不同的游戏策略。为了实现这一目标,我们正在使用一个名为Aquaticus夺旗(CTF)的多人游戏。游戏编程界面是用Python和OpenAI Gym编写的,以便与强化学习算法轻松灵活地整合,通过分析可能的攻击和防御策略空间,智能地学习游戏和赢得比赛。在本文中,我们描述了与开发有效的基于人工智能的技术有关的问题和挑战,这些技术可以使玩家在OAI场景中获得决定性的优势,以及我们在组织首届OAI Aquaticus CTF比赛中的经验。最后,我们讨论了从比赛中获得的一些经验,并确定了未来的方向,这些方向将使人工智能研究普遍化,并使其更适于过渡到战场上的对立场景中的有效决策。