在军事战术行动中,对基于机器的决策支持能力的需求日益增加,以支持人类决策者。人工智能(AI)和建模与仿真(M&S)是实现这些能力的关键技术,近年来取得了长足的进步。人工智能技术在认知任务(如情况评估、行动方案规划和与人类合作)方面的能力日益增强。仿真技术的进步在表征战场的物理和行为要素方面达到了更高的逼真度。此外,从生成建模和强化学习等技术的应用中可以看出,这些技术之间的协同作用日益增强。
本文将概述人工智能和仿真在增强军事决策支持能力方面所发挥的多方面和相互依存的作用。基于对决策支持的分析,评估了即将出现的人工智能技术及其潜在影响。随后,确定了利用这些技术的军事M&S平台的注意事项。
其目的是在该领域现有研发工作的基础上,就当前人工智能的进步对加强军事决策支持的影响以及相应的M&S技术需求提供深入见解。
图:C2 背景下的军事决策支持系统(DSS)视图
决策是军事战术行动中的一个关键过程。在这一过程中,要收集和分析信息、评估形势、考虑行动方案并制定作战计划,以实现特定的任务目标。由于战场日益由技术驱动,军事作战人员的决策角色也发生了变化。从分析师和指挥官到平台操作员和地面士兵,所有指挥级别和组织角色都可以看到这一点。更好地获取和使用数据与信息将提高决策的质量和敏捷性,从而增强行动期间的适应性,加快任务规划周期。同时,无人系统的集成将提高边缘自主感知和行动能力,但这需要人类的监督和协调。这些发展对操作员提出了不同的要求,包括在更严格的时间限制下进行更具战略性的思考,同时与智能系统合作实现更快的OODA循环。在这方面,为防止操作员信息和认知超载,使用智能决策支持系统(DSS)对于人类至关重要。
人工智能(AI)和建模与仿真(M&S)是实现基于机器的决策支持的关键技术,近年来都取得了长足的进步。人工智能技术在认知任务(如感官处理、情况评估、行动方案规划以及与人类协同工作)方面日益精通。人工智能对军事决策过程的潜在影响已得到定期评估。因此,仿真技术的进步在一定程度上也是由人工智能推动的,它在表征战场的物理和行为要素方面达到了更高的逼真度。合成环境可以更快地从现实世界的数据源中开发出来,以仿真具有代表性的任务环境,而用于填充这些环境的计算机生成部队(CGF)则配备了更逼真的行为模型,以仿真友军或敌军的行为。这种人工智能支持的仿真环境可用于决策支持,以理解复杂的现实任务环境,并以安全和具有成本效益的方式评估针对潜在对手的不同行动方案,不仅可用于任务规划和执行目的,还可用于实验和培训目的。
人工智能和M&S技术之间的协同作用也在不断增强,人工智能的进步加快了这一进程,并为决策支持提供了更多机会。例如,生成式人工智能在创建高度逼真的视觉或听觉内容方面取得了巨大进步,其底层算法被用于生成逼真的虚拟环境和人类行为;任务解决算法每年都在不断改进,可以在更复杂的环境中应对更复杂的任务,而训练时间却更短,通常可以缩短几个数量级;由于最近在大型语言模型(LLMs)方面取得的突破,这项技术正在迅速融入人机交互,其在军事决策支持方面的潜力已经在商业宣传视频中得到详细设想。在不断发展的形势下,人们对如何将其中一些技术定制和应用于军事决策的研发和实验中提出了持续的需求。然而,作为军事战术环境的可行场所,当前的军事M&S平台往往缺乏一些基本功能,从而阻碍了在更大范围内开展此类人工智能实验。
军事决策支持通常从(人工智能)技术如何在决策过程中为决策者提供支持的角度进行讨论,例如众所周知的OODA循环。在本节中,我们将提出一种类似的决策支持观点,但重点是战术C2。在C2范畴内,动态OODA循环(DOODA-loop)已被提出作为 C2 的通用模型,可用于战略、战役和战术层面,突出了任务执行的适应性。上图展示了与 DOODA-loop 相一致的决策支持基本视图。作为补充,该视图强调决策过程是操作员与(人工智能)系统之间的一个联合过程,需要参与者之间某种形式的团队合作。下面,我们将介绍这一过程中的不同功能以及人工智能在其中扮演的角色。
感知建构(Sensemaking):是将从环境中收集到的数据解释为可操作信息,并通过制定行动方案(COA)帮助确定必要行动的过程。就数据分析而言,它涵盖了分析的所有层面:描述性、诊断性、预测性和规范性。决策支持主要集中在这一过程中,我们将其区分为为建立(1)态势感知和(2)态势理解提供支持。态势感知是对正在发生的事情进行实时感知和解释,而态势理解则是通过全面掌握任务的整体背景、影响和潜在行动方案(COA),对事情发生的原因进行更深入的分析。
人工智能在决策支持方面的一个作用是利用分析方法,生成有洞察力的信息帮助操作人员快速理解和评估形势,从而降低信息处理的认知负担。这方面的例子数不胜数,包括地理空间分析,根据先验情报跟踪、汇总和注释敌方单元,预测敌方动向,或分析直升机着陆区等。向操作员提供分析结果通常是通过提供某种形式的战术共同作战图(COP)来实现的。
因此,人工智能可支持操作员开发、测试、评估和权衡不同的假设,以实现有效的COA。这些过程在军事规划方法中很常见,如军事决策过程(MDMP)。人工智能的两种常用范例是传统的计算实验和基于优化的现代方法,这两种方法都依赖于建模与仿真(M&S)技术。通过计算实验,可以运行假设场景来衡量和分析不同规划的预期效果。通过蒙特卡罗搜索法等技术,可以计算和分析大量场景,并将结果提供给操作员。另外,基于机器学习的方法(如强化学习,RL)也得到了广泛应用,这些方法以自学算法为基础,通过在交互式仿真环境中的试错来学习最优行为策略(此处指COA)。经过训练的模型可用于优化单个单元的战略或战术,或团队之间的协调行为。这些算法能以各种方式为决策者提供支持,如确定有效的友军行动方案或敌方最可能或最危险的行动方案、红方小组(Red Teaming)和战术开发,以找出盟军或敌方战术中的弱点。
规划(Planning):是将选定的行动方案(COA)转化为行动规划的过程,该行动规划可通过指示、命令或任务分配落实到军事活动中。它将需要做什么转化为如何做。在决策支持方面,用于制定行动方案的类似人工智能技术也可用于生成规划。不过,由于规划可被视为更低层次的决策问题,因此需要采用不同的技术。举例来说,空中任务中的行动方案可能反映的是对敌方高价值目标实施精确打击的行为,而相关规划可能涉及打击者的具体路线策略,以尽量减少敌方雷达的可见度。为了促进不同层次的人工智能优化,M&S环境可能还需要不同层次的抽象。军事仿真中常见的级别有工程、交战、任务和战役级别,其与不同级别的细节和汇总相关联。
军事活动和数据收集(Military activity and data collection):是指在环境中产生效果,并从环境中收集用于感知建构的数据。这些过程不属于 C2 决策过程的范围。不过,根据图4.1中假定系统的能力,它可以通过(无人)资产之间的通信和协调来下达指示,或与情报需求管理和收集管理(IRM&CM)流程进行调解,从而为这些流程提供支持。
人机协同(Human-machine teaming):指操作员与系统之间的协作互动,每个参与者都能贡献自己独特的优势和能力,以提高整体性能、决策和解决问题的能力。真正的协同决策要求参与的行动者相互可预测、可指导,并保持共同点。然而,这种要求的必要性取决于决策过程中人工智能的整合程度和作用。北约文献对人类与人工智能合作的不同层次进行了评估,其中纳入了人工智能的特质,如透明度、可解释性、主动性、适应性和心智理论。
值得注意的是,也有人对人工智能在C2决策中的能力持保留意见,认为人的判断仍然必不可少。有文献认为,由于军事决策环境是非线性、复杂和不确定的,战术指挥官的主动性、创造性和同理心等素质仍然至关重要,因此人工智能无法可靠地补充或取代人类在理解战略环境方面的作用。有文献进一步认识到,人工智能(在不久的将来)还不具备自动扮演 C2 系统中决策者角色的能力,无法在没有人类参与的情况下制定命令。
近年来,人工智能领域发展迅速。本节将介绍部分发展成果,并评估其对军事决策支持的影响。我们主要关注那些支持上一节所述的感知决策、规划和团队协作过程的技术。
大型语言模型(LLM)是在大量文本数据基础上训练的深度神经网络,用于理解和生成人类语言。GPT-3.5 等模型已成为具有重要意义的关键工具,并将继续影响各个领域。它们能够理解上下文,并以类似人类的水平执行与语言相关的任务,这使它们在推动社会进步方面具有极高的价值。这些模型展示了它们在简化流程、从海量数据中提取洞察力和提供智能解决方案方面的潜力。多模态 LLM(MLLM)领域的潜力更大。这些模型除了处理文本外,还处理其他模式,如视频中的图像或视觉和听觉内容,使模型能够掌握对世界更广泛的理解,而不仅仅是基于文本。
LLM为人机交互提供了一种自然的方法。此外,它们还具有团队合作的特点,可以通过有意识的机器互动与用户建立共同点。通过人工智能对齐技术,可以对 LLM进行训练,以确保其结果符合人类的偏好、价值观和意图。LLM 具备分析不同数据类型并用人类语言进行推理的能力,因此是协助军事指挥官进行感知建构的理想模型。它们可以通过制定更明智的战略、完善作战规划和评估潜在结果,帮助评估与不同作战行动相关的可行性和风险。此外,用户还可以与这些模型互动,以了解他们的推理过程并识别决策背后的论据。
要想在军事等专业和高风险领域接受 LLM,模型就必须稳健可靠。也就是说,要知道一个模型的输出是否与它所训练的任务相符,而不是产生幻觉(生成无意义或不真实的内容)。为此,我们投入了大量精力分析 LLM 的因果推理能力。在反事实推理和图发现等重要推理主题上,LLM的表现优于最先进的因果推理算法,犯的错误(尽管是重要错误)少得惊人,而且还在不断改进。
强化学习(RL)是一种机器学习范式,智能体通过与环境的交互来学习最优决策策略(如策略)。在过去十年中,RL 取得了长足的进步,这体现在游戏智能体的进化上,它们能够掌握复杂的战略游戏,如围棋或星际争霸 II。虽然最初硬件计算的进步对 RL 的发展起到了很大作用,但如今,许多创新都集中在通过改进学习策略来提高学习效率上。效率每年都在以几个数量级的速度提高,并在短期记忆和偶发记忆、探索策略和元学习等学习促进因素的基础上逐步提高。
由于具有战略和战术规划能力,RL 技术可为感知决策和规划过程提供支持。军事领域的相关研究已经证明了 RL 在战斗情况下对 COA 的优化作用。与真实世界战斗环境的复杂性和艰苦性相比,目前的演示是在艰苦环境中进行的。尽管学习效率有望得到上述改善,但预计将在越来越复杂的环境中进行演示,人工智能驱动的战略可用作实际军事交战的蓝图。
除了环境的复杂性,RL 算法通常也很难在奖励稀少的环境中找到策略。人类看似容易判断的解决方案(如通过常识或直觉),对机器来说却很难掌握。为了解决这个问题,有人类反馈的 RL(RLHF)最近被证明在改进 RL 系统方面非常有效。RLHF 利用由人类产生的反馈来学习人类的专业知识。这种方法已经在定义明确奖励功能具有挑战性的领域取得了成功,如语言生成、游戏和自动驾驶。从军事角度来看,这种方法通过利用专家决策者和主题专家的经验,有利于解决战略规划问题。
语义图是一种图形模型,它以类似图的结构捕捉概念之间的语义关系。知识图谱(KG)是一种用于知识表示的特定语义图谱。知识图谱适用于各种应用领域,如问题解答系统(QnA)、推荐系统、信息检索以及数据管理和分析,并被应用于医疗、网络安全、金融或新闻等领域。 KG能够将数据转化为信息和知识,并对其进行组织和结构化,因此非常适合为感知决策过程提供支持。在军事领域,KG可代表战场态势感知并支持C2。它们可协助进行多源情报分析,实现信息的有效可视化、搜索和查询。与此同时,操作员还能得出有意义的结论,并针对不断变化的情况做出更明智的决策。
最近,图神经网络(GNN)在深度学习领域大受欢迎,其主要应用领域是决策科学。图神经网络是一种深度学习模型,旨在处理类似KG的图结构数据。这些模型有助于预测缺失信息、对知识进行分类和聚类,并增强推理能力。此外,针对图的生成式人工智能模型近年来取得了重大进展,改变了网络分析和预测领域。这些生成模型通常依赖于 GNN,可以生成现实和多样化的图样本,以代表现实世界错综复杂的网络模式,并在捕捉社会网络和生物系统中的复杂关系和结构方面展现出潜力。此类模型可为军事操作人员提供强大的工具集,协助制定场景和合理的对抗策略,加强兵棋推演和仿真训练。 基础模型
基础模型的发展代表了人工智能的关键进步。基础模型是在大量数据集上预先训练好的大参数机器学习模型,可以成功完成一系列不同的任务。它们的适应性和泛化能力可以通过一种称为迁移学习的过程为特定任务进行定制。基础模型超越了传统的特定任务方法,可用作开发专业应用的通用起点。它们有可能在医疗保健、教育、法律、机器人和军事等不同行业和领域实现流程自动化并支持决策。 在军事行动中,基础模型大有可为,尤其是在应对有限和无标记数据的固有挑战时。数据的稀缺会阻碍依赖大量标签数据集的传统机器学习方法的有效性。基础模型为这一困境提供了创新的解决方案。利用其预先训练好的知识,它们可以从外部数据源中提取洞察力,并将其应用于学习新的、数据稀缺的任务,而只需最小限度的适应。这种能力使基础模型在军事决策支持任务中表现出色,即使在传统机器学习方法难以胜任的情况下,也能提供可行的见解和明智的建议。军事决策者可以利用这些模型,将其作为生成作战战略、预测结果和优化资源分配的有力工具,从而提高军事行动的质量和效率。不过,其中也存在风险。由于这些模型的突发性,人们对它们如何工作、能做什么以及何时失败缺乏了解。此外,这些模型中的偏差会传播到建立在其上的下游应用程序。