军事决策在不同的领域--陆地、海洋、空中、太空和网络--以及不同的组织层面--战略、作战、战术和技术上发挥着关键作用。建模和仿真被认为是支持军事决策的一个重要工具,例如,生成和评估潜在的行动方案。为了成功地应用和接受这些技术,人们需要考虑到整个决策 "系统",包括决策过程和做出决策的指挥官或操作员。
人工智能技术可以以各种方式改善这个决策系统。例如,人工智能技术被用来从(大)数据流中提取观察结果,自动建立(物理/人类/信息)地形模型,产生对未来事件和行动方案的预测,分析这些预测,向人类决策者解释结果,并建立人类决策者的用户模型。
对于所有这些应用,人工智能技术可以在不同的情况下被使用,并且已经开始被使用,因此有不同的要求。在本文中,我们概述了人工智能技术和模拟在决策"系统"中的不同作用,目的是在我们的社区中促进对人工智能的综合看法,并为用于军事决策的各种人工智能研发奠定基础。
军事决策有多种形式。它发生在不同的领域--陆地、海洋、空中、太空、网络--以及不同的组织层次[7]。例如,在战略层面上,决策是否以及何时在一个特定的作战区域内开始一项军事任务。在作战层面上,联合部队指挥官决定为某项行动分配哪些军事要素,并指定在具体行动中寻求的预期效果。在战术层面上,例如,海上任务组的反空战指挥官决定由哪艘护卫舰来应对来袭的威胁。最后,在技术层面上,要决定在什么范围内使用什么武器来消灭对手。
建模和仿真被认为是支持这些现场决策过程的一个重要工具(例如,见[3]的清单)。它提供了一种理解复杂环境和评估潜在行动方案有效性的手段,而不必使用现场测试。因此,借助于建模和模拟可以更安全、更便宜、更快速,而且可以更容易地测试不同的操作方式。此外,对于战场上的军事行动来说,广泛地试验军事行动应该如何进行,甚至可能在道德上不负责任。因为,在指挥官可以决定不继续按照同样的战术行动之前,就已经产生了意想不到的效果。
现代建模和仿真经常得到人工智能(AI)技术的支持。例如,用于仿真单个节点、组织和社会行为模型(见一些背景资料[13][4]),以获得对对手合理和可能行为的洞察力。在这种行为洞察力的基础上,可以为许多决策层面的军事行动设计提供智能分析和决策支持。此外,人工智能技术被用来构建这些模型,与这些模型互动,并迅速分析大量的模拟结果数据。这里的技术进步非常多,例如,使用机器学习来构建更真实的行为模型[11],改善人机协作[5],对大量的模拟数据进行理解[10]。然而,人工智能技术只有在对决策者有用的情况下才能也应该被用于军事决策。这意味着,只有在决策质量提高或决策过程变得更容易的情况下,才应将人工智能技术(在建模和仿真中)整合起来。
成功应用和接受用于决策支持的模拟仿真--可能建立在人工智能技术之上--取决于与主要军事决策过程的互动和不断学习([1])。决策者和分析员应该知道如何提出正确的输入问题,以便通过建模和仿真来回答。然后,这些问题应该通过建模和仿真研究转化为正确的输出答案。因此,在各种互补的人工智能技术的支持下,应该对军事决策过程和军事模拟之间的互动有一个广泛、全面的看法,并服从不同的功能要求。在本文中,我们概述了由人工智能技术支持的军事仿真在决策"系统"中的不同作用,目的是在我们的社区内促进对人工智能的综合看法,并为军事决策的各种人工智能研发奠定基础。
如引言所述,决策发生在不同的领域和不同的组织层面。在这里,我们提出了一个决策系统的示意图,以提供一个关于如何通过仿真来支持决策的一般见解。这一观点(图1)来自于对多个决策过程的分析,如联合定位[5]、作战计划[7]、海上反空战[1],并与著名的OODA环[8]相结合。该观点中的元素解释如下。
图1:由建模和仿真支持的军事决策周期的系统观点。
观察:OODA循环的第一步是观察,从广义上讲,就是观察现实世界中正在发展和出现的事件和情况。观察包括,例如,来自传感器的(原始)数据,包括我们自己的眼睛和耳朵,以及来自报告、报纸和社会媒体的符号数据。还收集了来自高层指挥和控制实体的指导意见。这些数据由分析员处理,对镜头中的个体进行命名,计算某些Twitter标签的出现次数,验证某个事件是否真的发生,等等。根据[9],这可以被称为情境意识的第一级:对当前情况下的元素的感知。
世界模型:在OODA环的观察步骤中,已经开始了构建世界模型的过程,无论是隐性的还是显性的。符合军事决策观点的世界模型的另一个名称是共同行动图。所有相关的概念都在世界模型中得到体现,包括不确定因素和假设。请注意,世界模型可以被仿真,即个体、平台、团体或社会的行为可以随着时间的推移而被预测,即使是在用户的头脑中隐含完成。
定位:在OODA循环的第二步,分析者使用他的专业知识,对观察结果进行推理,形成假设,例如对手的意图。通过这样做,实现了对真实世界的深入理解[12],这反映在世界模型中(仍然是显性或隐性的)。在态势感知方面,这被称为第2级(对当前形势的理解)和态势感知能力第3级(对未来状态的预测)。在任何时候,推理的结果可能是世界模型结构是不充分的,例如,现实世界的一个方面被认为是不相关的,但最后发现是相关的。因此,世界模型需要被更新。
决定:决策者,可能是与分析员相同的人,将根据对现实世界的理解,考虑如何采取行动的选项。世界模型的预测能力被用来演绎各种情景,让人了解什么是理想的行动方案,什么不是,或者让人了解空间和/或时间上的关键点,这样就可以对这些关键点给予额外考虑。当然,如果世界模型是隐含的,这都是决策者的精神努力。此外,对于感兴趣的现实世界系统的预测行为,可以得出的结论的精确性和/或确定性有很大不同:从精确的路线,到可能的战略和理论的广泛指示。
行动:在OODA-环的这一步,行动被执行。这些行动发生在真实世界中,然后一个新的OODA-环开始观察是否需要重新考虑已经做出的决定。另一个行动可以是向 "较低层次"的决策过程下达命令,例如,让下属单位计划和执行他们所得到的任务。这就是不同组织层次的决策过程的互动方式。还要注意的是,尽管每个组织层面的世界模型都与真实世界相联系,但这些世界模型的结构(即被认为是相关的)可能是不同的。
从概念上讲,在上述的决策过程中引入模拟(实际上首先是建模的巨大努力)是很直接的。在第一步和第二步中,建立了世界相关部分的模型,在以后的时间里,它被用来评估许多不同的情景,分析由此产生的结果,并根据其结论做出决定。正如后面将显示的那样,人工智能技术的作用与建模和模拟的使用有很大关系。
虽然从概念上来说,纳入仿真模拟和人工智能技术是很简单的,但为了给行动提供真正的附加值,它需要被嵌入到具体的决策过程中。而每个决策过程都是不同的,有不同的时间限制,不同的行动者,在不同的操作环境中。这将对开发使用的解决方案,包括人工智能技术,提出不同的功能要求。此外,根据具体的作战决策环境,应用人工智能技术的附加值(或缺乏附加值)将是不同的。在下一节中,我们将对一个具体的案例进行进一步的探索,尽管肯定不是详尽的努力,以允许对这种系统在这个过程中可能具有的不同角色进行更通用的识别。
本节提供了一个关于如何利用仿真和人工智能技术来支持作战层面上的(蓄意)联合目标定位决策的案例研究。对于每个想法,都有以下描述:被加强的行为者(决策者)和/或产品,人工智能如何提供支持,以及使用这种形式的支持的附加值是什么。请注意,这个案例研究的目的是为了更好地了解人工智能技术应用的广度,因此,目标不是完全涵盖所有的可能性,也不是过于详细。这种类型的案例研究已经确保了可以得出初步的功能要求,人工智能技术和智能建模与仿真应该应用于此。
图2显示了北约盟国联合出版物3.9中的联合瞄准决策周期,其中强调了五个想法。
图2--来自北约盟国联合出版物3.9的联合目标定位周期,JFC=联合部队指挥官,JTCB=联合瞄准协调委员会,JTL=联合瞄准清单,TNL=目标
想法1--基于AI的目标系统分析的所有来源分析。第一个想法是支持目标小组的成员在联合目标定位周期的第二阶段参与目标系统分析,进行目标开发。例如,假设从第一阶段开始,就打算通过瞄准对手的石油生产来扰乱其资金能力。在第二阶段,分析人员将研究石油生产的目标系统,以确定油井、炼油厂、管道、重要的道路,也许还有相关的关键人物,等等,基于他们拥有的所有来源(图像、信号情报、人类情报,等等)。
人工智能技术可以协助人类分析员建立 "目标系统模型",即通过采用模式识别算法来处理大量的所有来源的信息,通过使用推理算法将信息碎片组合成一个结构化和连贯的整体。分析传入信息的算法可能--经过增量的人工智能驱动的创新--也能够识别尚未反映在目标系统模型中的新概念,然后可以自动添加到模型中。另一种可能性是创建一个 "虚拟分析师"(见图3),通过不断挑战假设、假说和人类偏见来协助人类分析师,这需要额外的用户建模和可解释的AI技术。
图3:人类和虚拟分析员,一起解释数据,推理信息和知识,以建立一个目标系统模型。
这个想法的潜在附加值首先体现在完整性上,更多的目标可以呈现给人类分析员--它仍然可以为交叉检查的目的做最后一步的目标审查。因为所有来源的情报都被整合到目标识别决策中,所以可以得出更具体的目标信息。识别算法经过训练后,与基于人眼从数据中识别目标时相比,可以更快更及时地进行识别。最后,该算法可以明确地转向识别不同类型的目标,这些目标可能并不都在人类分析员的经验或观察能力范围内。
想法2--通过算法识别来自目标系统分析的优先目标。第二个想法是支持从一个给定的目标系统分析中识别优先目标。这有助于目标支持小组成员得出一个联合的优先目标清单,该清单是在联合目标定位周期的第二阶段,即目标开发阶段制定的。人工智能技术的支持始于将目标系统分析(如果还没有的话)转化为计算机可理解的形式,该形式由功能关系连接的实体组成,并由目标任务的目标支持。然后,在相关的时间范围内计算直接或间接瞄准不同实体所产生的效用(例如,效果和效果的持续时间)。
然后,最终结果可以由人类分析员检查,该分析员可能会重新引导算法的某些部分,以确保最终结果选择的优先目标尽可能地满足和平衡任务目标。另一种可能性是,分析表明,对目标系统的某些部分还没有足够的了解,无法做出某种决定,然后发出新的情报请求,以减少这种不确定性。
在这种情况下,使用人工智能技术的附加价值首先体现在通过完整地确定优先事项,包括最大限度地实现任务目标,同时最大限度地减少负面问题,从而更好更快地确定优先次序。这种全面的分析可能会导致原始的目标选择,在这种情况下,会发现反直觉但非常有效的目标。目标优先级的可追溯性增加了,因为目标选择问题的算法规范以及积极和消极的相关功能迫使决策者在激发他们的偏好时完全明确。
想法3--能力和优先目标的自动映射。与目标开发(第二阶段)密切相关的是第三阶段的能力分析。第三个想法是协助,仍然支持目标支持小组的成员,找到最适当的(致命和非致命)能力的最佳同步组合,可以应用于产生所需的物理和心理效果。使用模拟和人工智能技术来自动生成和播放高水平和低水平的行动方案,可以获得对计划的优势、机会、弱点和威胁的深刻理解。当然,只有在与人类分析员和决策者密切合作的情况下,建立这样的理解才是有用的,这就需要有人类意识的 "虚拟分析员 "技术。
想法4--计算机辅助的稳健和适应性部队规划和分配。在联合定位的第四阶段,能力分析的结果被整合到进一步的行动考虑中,推动联合部队指挥官对目标的最终批准。仿真和人工智能优化技术可用于寻找稀缺资源对目标或其他任务的最佳分配。什么被认为是 "最好的 "可以是不同的,例如,争取最大的效果、安全、稳健、灵活,或这些和更多因素的任何组合。这可能会提供原始的规划和分配方案,从人类分析者的角度来看,这些方案部分是反直觉的,但却富有成效。智能优化算法可以帮助确定时间和/或空间上值得监测的关键点。而且,如果可以实时跟踪进展,在事件或机会实际发生之前就可以立即生成重新分配方案,在时间紧迫的情况下减少决策时间。
想法5--自动评估军事行动绩效措施。在联合定位的最后阶段,收集和分析数据和信息,以确定计划的行动在多大程度上得到执行(绩效的衡量),以及达到预期的效果(效果的衡量)。因为这种类型的分析与其他阶段的分析基本相似(即需要观察和理解),所以在这里采用的模拟和人工智能技术可以被重复使用。例如,"目标系统模型"可以用来事先确定哪些措施或措施的组合最能说明性能和/或成功,也许还要考虑到其他因素,如效果的可测量性和延迟性。这些见解可用于指导例如战斗损失评估工作。算法可以自动产生多种假设,当数据/信息可用时,"虚拟分析师"可以协助对这些假设和信息进行推理,帮助人类分析师以结构化的方式更好地解释复杂的情况。
在本节中,我们将讨论人工智能技术在军事决策中可以发挥的作用,并将这些作用与前面介绍的军事决策系统联系起来。这些作用是由上面的案例研究综合而成的。不同的作用是沿着两个层次结构的,从上到下:在 "过程"层面,不同但连贯的步骤/阶段被执行;在 "个体"层面,人类(或团队)负责执行决策过程的特定步骤。
在整个决策过程的层面上,有多个步骤可以区分。在前面介绍的决策系统观点中,这些步骤是观察、定位、决定和行动。在联合定位案例研究中,这些对应于六个阶段,由不同的人在不同的时间执行。在这个层面上,我们为人工智能技术定义了四个功能角色,以支持决策过程。
感知:这个角色中的人工智能技术,主要以模式识别的形式,帮助处理大量的数据,如在图像中寻找人,检测数据流中的异常情况等。
态势理解:这个角色的功能是实现对当前或假设的作战环境的理解[12],从而描述所有相关实体、它们之间的关系以及不可观察的属性,如它们的野心和目标。例如,对关于最近敌对活动的现有信息进行推理,结合关于他们的理论的一般知识,可以用来产生关于他们最可能的意图的假设。
计划生成:在这个角色中,人工智能技术,例如搜索和优化,被用来生成旨在达到(或避免)某种目标情况的计划、策略和行动方案。处理元标准,如计划的稳健性或情况的实用性也是这个作用的一部分。显然,在许多情况下,不确定性是行动环境所固有的,因此不能被忽视。尽管如此,对当前形势的理解越好,预测能力就越强。
学习:扮演这一角色的人工智能技术被用来更新有关作战环境的知识。例如,在某个时间点,人们可能会发现一个被认为是正确的关于敌人理论的假设不再有效了。为了能够保持正确的理解,这种新知识应该反映在所有其他决策步骤中。
在单个节点层面上,决策过程的单一步骤被执行,通常由一个或一组人类分析员和/或决策者负责。无论这一步需要什么,人工智能技术都可以在不同的合作角色中被使用,以支持人类。
专家系统支持:在这个角色中,支持的形式就像一个经典的专家系统,以知识和优化结果的形式向人类决策者或分析员提供建议。重要的考虑因素是,例如,如何以人类能够接受的方式向其提供建议。对可解释人工智能的研究可能是一个方向。
虚拟团队成员:在这个角色中,人工智能技术被用来在人类和支持系统之间创造一种更平等的互动关系,积极为一个共同的目标工作。例如,虚拟团队成员可以通过提出问题使假设明确化或挑战偏见来帮助做出决定的(认知)过程。人类-人工智能的研究可能是一个追求的方向。
自主决策:决策过程中的其他步骤的互动,专家系统和虚拟团队成员支持的考虑同样有效。例如,在其他决策中的人类需要能够推断出一个自主系统。
图4显示了在军事决策系统视图中绘制的人工智能的七个角色。当使用模拟和人工智能来支持决策过程时,应该始终考虑这些不同的角色是如何互动的,无论是在过程层面还是在个人层面。例如,在联合目标定位的过程层面上,第二阶段包括定位(目标系统分析)和决定(为达到预期效果而瞄准什么)。第三阶段也包括定位(自身能力)和决定(如何实现预期效果)。这些阶段共享相同的世界模型,在这个过程中引入人工智能支持将推动这些步骤的合并,这不是不可想象的。在个体层面上,例如再次考虑第2阶段,分析员可以得到综合态势理解、规划生成和学习技术的支持,以及虚拟团队成员和专家系统支持技术的任何组合。
图4:由建模和仿真支持的军事决策周期的系统视图,其中人工智能技术的功能(黄色)和协作(绿色)作用被描绘出来。
在本文的第一部分,我们介绍了军事决策的系统观点,主要基于OODA循环,其中我们介绍了世界模型,作为向整个决策周期提供建模和仿真支持的核心手段。接下来,从我们的联合目标定位案例研究中,我们推断出人工智能可以为军事决策做出贡献的七个功能性和协作性角色。这些角色对应于决策步骤,或者对应于如何向负责该过程步骤的人提供支持。最后,我们将这些人工智能角色整合到决策系统视图中。
本文的目标是为我们社区内人工智能的综合观点做出贡献,并为军事决策的人工智能各种研发奠定基础。在开发支持军事决策的模拟和人工智能时,我们建议同时考虑过程层面和单个节点层面。在过程层面上,通过使用建模和仿真可以获得好处。在单个节点层面上,为人类分析员和决策者提供实际支持,人工智能技术可以通过不同的角色组合对此作出贡献。鉴于决策过程的各个步骤都是不同的,并且提出了不同的要求,履行这些不同角色的人工智能技术需要作为一个整体来开发。
我们相信,随着对这一主题的更多研究,军事决策的速度和质量都可以得到改善。然而,非常重要的是,要持续关注特定的未来人工智能应用的附加值,以及研究这些应用可能对,例如,负责该过程的人的所需技能,甚至该过程本身的影响。最后需要的是一个系统,它的存在是因为它可以建立,而不是有人帮助。对于这一点,应该更普遍地回答如何限定然后量化应用人工智能进行具体军事决策应用的附加价值的问题。这样的见解反过来又会成为关于人工智能用于军事决策的集体技术路线图的宝贵基础。
[1] Bloemen, A., Kerbusch, P., van der Wiel, W., Coalition Force Engagement Coordination, TNO Report TNO-2013-R12117, 2015.
[2] Connable B, Perry W, Doll A, et al. Modeling, Simulation, and Operations Analysis in Afghanistan and Iraq. Santa Monica, CA: RAND, 2014.
[3] Davis P., Kulick J., Egner M. Implications of Modern Decision Science for Military Decision-Support Systems. Santa Monica, CA: RAND, 2005.
[4] Kunc, M., Malpass, J., White, L.(2016). Behavioral Operational Research, Theory, Methodology and Practice. Palgrave Macmillan, London.
[5] Langley, P., Meadows, B., Sridharan, M., Choi, D. (2017). Explainable Agency for Intelligent Autonomous Systems. Proceedings of the Twenty-Ninth AAAI Conference on Innovative Applications (IAAI-17).
[6] NATO Allied Joint Doctrine For Joint Targeting AJP 3.9(B), 2015.
[7] NATO Allied Command Operations. Comprehensive Operations Planning Directive Interim V2.0.
[8] “OODA loop.” Wikipedia, The Free Encyclopedia. 10 Mar. 2018.https://en.wikipedia.org/wiki/OODA_loop
[9] “Situation Awareness.” Wikipedia, The Free Encyclopedia. 17 Mar. 2018. https://en.wikipedia.org/wiki/Situation_awareness
[10] Smit, S., Veldhuis, G., Ferdinandus,G., et al. KaV Advanced Visual Analytics, TNO Report DHWELSS-2015-0100292631, 2016.
[11] Toubman, A., Poppinga, G., Roessingh, J. (2015). Modeling CGF Behaviour with Machine Learning Techniques: Requirements and Future Directions. Proceedings of Interservice/Industry Training, Simulation, and Education Conference (I/ITSEC) 2015.
[12] “Understanding.” Wikipedia, The Free Encyclopedia. 18 Apr. 2018. https://en.wikipedia.org/wiki/Understanding
[13] Zacharias, G., MacMillan, J., van Hemel, S. (2008). Behavioral modeling and simulation: From individuals to societies. National Research Council, National Academies Press.