本文阐述了始于2023年3月的工作,该工作后续由英国国防与安全加速器(DASA)举办的“填充训练世界”竞赛推动加速,并由陆军创新部门资助。在此项工作中,Hadean超级计算有限公司(Hadean)开发了一套系统,旨在帮助交付一个可信、复杂且具代表性的人文地形——受众、行为体、对手与敌人(A3E)——以便在实况、虚拟与推演(LVC)环境中更有效地训练英国陆军人员。
特别是,Hadean创新性地利用了第三方人工智能技术和大型语言模型(LLM),开发出能够增强军事LVC环境内模拟A3E智能体的响应能力和行为的功能。这些功能处理训练环境中存在的自然语言和文本信息,以驱动所需的响应,从而丰富训练环境的真实性和价值。
这些新颖的所需响应包括:
• 来自实况受训人员的无线电内容为合成社交媒体内容提供信息。
• 实况受训人员与人文地形的互动影响推演环境。
• 推演环境影响受训人员,造成压力与摩擦。
• 信息战通过一个合成社交媒体中心进行模拟,由实况受训人员或演习控制人员触发,以模拟友好/敌对信息行动。
• 生成事后评估(AAR)及任务中事件摘要。
影响冲突区域中人类行为的复杂社会、文化及心理因素在作战中产生摩擦。受训人员必须学会如何有效处理这些摩擦。人类反应和互动不可预测性,通常由根深蒂固的文化规范和个人经历所塑造,难以在实况和虚拟演习中体现。对这些因素的表征若过于简单化,可能意味着无法捕捉人文地形的细微现实,从而限制训练的有效性。目标是展示能够动态适应各种人类行为的AI驱动模拟,以改进现有技术水平。
合成训练环境中现有的A3E(受众、行为体、对手、敌人)——或称人文地形——模拟通常缺乏深度[1]。模拟动态对手行为和环境交互是一项挑战,因为当今使用的A3E系统只能提供基本的脚本化响应,这限制了决策能力[1], [2]。它们未能展现出真实训练所需的细微差别和适应性。拥有诸如平民、对手和盟友等多样化的实体集合,不仅需要先进的建模方法,还需要一种近似人类行为的方法。
除了在A3E表征方面的局限性外,许多虚拟解决方案难以与实况演习无缝集成,限制了创建混合现实与虚拟组件的混合训练环境的能力。确保先进训练系统能够有效扩展并与现有能力互操作,对于训练效果至关重要。没有虚拟层的实况演习提供了出色的物理真实性,但它们往往缺乏现代作战所要求的交互深度和决策复杂性[3]。人文地形是从阈值下到大规模作战行动整个频谱中的关键要素[4],但在训练中有意义地体现这一点,往好了说成本高昂(利用演员),往坏了说则极不真实。
除训练演习本身外,演习后对受训人员表现的评估也可能主观且不一致,反馈常常延迟到演习结束很久之后。特别是事后评估,可能不一致、主观,并且需要时间整理,这意味着由于行动与反馈之间的延迟,反馈驱动的学习效果会打折扣。这在分析受训人员与A3E的互动时是如此,在审视已完成想定中的许多其他重要事件细节时也是如此。
在目前的工作中,展示了Hadean超级计算有限公司与英国国防科技实验室(Dstl)、国防与安全加速器(DASA)以及陆军创新部门合作,作为DASA“填充训练世界”竞赛一部分所做的工作。目标是增强混合实况、虚拟与推演(LVC)训练环境的真实性、情境响应能力和整体训练价值。试图通过利用大型语言模型(LLM)的最新进展来创建一个复杂的情境处理器以实现此目标。该处理器将模拟一套自由思维的A3E,跨人文、物理、环境和信息域传递线索、压力源和摩擦。这种真实模拟是创建有效沉浸式训练环境的关键组成部分。