兵棋推演是对冲突局势的模拟,其中参与者的决策会影响后续事件发展。虽然休闲式兵棋推演可用于娱乐或社交目的,但专业兵棋推演被专家用于探索决策的战略影响并进行体验式学习。本文持如下立场:人工智能系统(如语言模型)在战略规划方面正迅速接近人类专家水平——并终将超越之。军事组织已开始运用语言模型,在采用自然语言描述行动与结果的开放式兵棋推演中,为现实世界决策的后果提供见解。我们主张,人工智能系统影响大规模决策的能力,推动着对开放式兵棋推演中人工智能安全性、可解释性与可阐释性的进一步研究。为验证此观点,我们开展了范围性文献综述,精选100项关于兵棋推演中人工智能应用的非保密研究,并构建了一种新颖的“开放度”本体论——该体系基于推演参与者被赋予的创造性、裁决机制的自由度以及向观察者呈现的新颖性。基于此项研究,我们提炼出适用于各常见领域开放式兵棋推演中部署人工智能的一系列实用建议与关键安全考量。最后,我们向学界提出一组具有高度影响力的开放性研究挑战,以供未来工作探索。
本文通过全面的范围性文献综述,为人工智能在复杂兵棋推演场景中的部署建立了以讨论为导向的关键性需求框架。本文的核心贡献包括:
● 精心遴选的开放式兵棋推演人工智能研究目录
● 助力研究者识别兵棋推演关键特征的新颖分类体系
● 语言模型在兵棋推演中应用的领域特定需求规范
● 从业者降低风险、确保语言模型在兵棋推演应用中可靠性的最佳实践框架
● 对兵棋推演中使用语言模型的安全考量论证
● 一组开放性研究问题及清晰的未来工作方向