美国国防部作战测试与评估主任办公室的战略倡议、政策和新兴技术部(DOT&E SIPET)正在为未来多域作战的测试与评估(T&E)工作出谋划策。作战人员需要从海底到太空再到网络的综合视角来击败对手。由于环境、财政、安全、保密和道德方面的限制,不可能对这些能力进行现场测试,因此我们的评估将更加依赖建模与仿真(M&S)来测试系统的有效性和互操作性。特别是,未来能力的测试和评估将依赖于数据驱动的企业 M&S,这种 M&S 将作为一种服务提供给士兵、水手、飞行员、监护人和海军陆战队员。这种集成、扩展和数字化的 M&S 正处于新技术前沿的边缘,存在许多悬而未决的问题,例如:
我们如何设计 M&S 和实战测试,以形成 "预测、实战测试、改进 "的反馈回路,从而在系统的生命周期内提高 M&S 的准确性?- 我们如何将 M&S 作为一种服务投入实战,从而使操作 M&S 和理解其输出结果所需的技能组合与现实世界中作战人员所需的技能相一致?
如何确保所有作战领域和数字能力的集成?
如何为测试与评估和作战决策实施一个具有实时分析和准确结果的环境?
本文将探讨这些问题,并对情报界的 "综合威胁分析与仿真环境 "和 DARPA 的 "分布式实验环境 "进行演练应用,以期超越对手的能力。
千百年来,利用经验观测来推导和完善模型一直是科学、工程和技术的基石。例如,早在 15 世纪,第谷-布拉赫(Tycho Brahe)就进行了当时最精确的天文观测,随后开普勒利用这些观测结果推导出了行星运动定律,牛顿又利用这些观测结果推导出了三大运动定律和万有引力定律,等等。
时至今日,我们已经拥有了实时传感器和高吞吐量网络的优势,可以更紧密、更快速、更持续地将现实世界的观测结果(即数据)与我们建立的模型结合起来。对于武器系统的测试与评估来说,这就要求我们最大限度地利用所收集的数据,并尽量缩短分析数据和将数据转化为有价值的系统性能预测知识所需的时间。此外,一旦收集到足够数量的实时数据来验证或推导模型,我们就可以依靠该模型输出准确的预测结果,而无需收集更多的实时数据(就像我们不再需要复制第谷-布拉赫对夜空的观测结果来预测行星的运动一样)。另一方面,从系统运行中获得的任何相关附加数据都可用于在系统的整个生命周期内进一步完善其模型(正如持续的天文观测有助于反复提高我们行星运动预测的准确性,尽管开普勒定律总体上仍然成立)。
从作战角度看,军事行动与 M&S 环境的这种更紧密、更快速和持续的耦合提供了无与伦比的战场优势。这意味着在不久的将来,指挥官将有效地从其指挥的部队和整个战区获得实时反馈,他们可以利用这些反馈以前所未有的方式快速、明智地采取战术并为作战提供信息。
在考虑将 M&S 架构与现场测试活动和实际操作相结合,以形成 "预测、现场测试、改进 "的反馈回路,从而在系统的生命周期内提高 M&S 的准确性时,我们必须处理两类不同的模型:基于效应的模型和基于物理的模型。基于效应的模型是从现实世界的观测结果中根据经验推导出来的;它们是直接根据数据设计建立的,因此可以在获得新数据时直接对其进行更新。另一方面,基于物理的模型是根据科学定律的第一原理构建的,用方程式表示,然后转换成软件代码。
例如,开普勒的行星运动定律是根据第谷-布拉赫的观测直接推导出来的,是一个基于效应的模型,而牛顿定律也是根据经验从开普勒定律中推导出来的;尽管我们现在知道牛顿定律是第一原理,而且事实上可以从数学上推导出开普勒定律--这就是科学、技术和发现的强大反馈回路!
让我们回到作战人员和武器系统的测试与评估。以现实世界中小艇突袭对军舰造成的威胁为例。军舰可能会部署大型火炮来抵御小艇的袭击,而构建模型来预测军舰对这些威胁的防御能力可能会有所帮助。在这种情况下,建模者可以考虑两种方法来描述火炮和弹药摧毁小艇的能力:
构建基于效果的模型,使用实战测试推导出的统计分布(如火炮回转时间、瞄准时间和发射时间)。
构建基于物理学的模型,使用高保真软件编码的第一原理。
新的实弹测试数据可用于完善基于效果的模型,只需更新统计分布以纳入新的测试点即可;然而,更新基于物理的模型的正确方法却不那么明显,这就提出了一系列需要解决的问题:
对模型输入参数的单一调整能否捕捉到结果,特别是现场测试和运行中特有的随机变化?
如果可以,能否证明这种调整在一段时间内是稳定的(例如,只有在获得新的实时数据时才会稍有变化)?
如果是,模型的输入参数是否可直接追溯到实时数据?也就是说,模型的输入参数与实时测试中收集的不同数据元素之间是否存在明确的已知关系?
反过来,这些问题的答案都必须是肯定的,以证明基于物理的模型有能力根据现实世界的观察和变化进行后验、预测、易于理解和更新。然而,我们这样做似乎是绕了一个大圈,实际上是把最初基于物理学的模型转换成了基于 "数据驱动 "效应的模型,这也是本节的结论: 一个模型是否能够进行后验、预测,是否易于理解和更新,取决于它是否有能力捕捉实 时测试和运行所特有的结果和随机变化,其调整是否稳定,其输入参数是否可直接追溯到实 时数据。从这个意义上说,模型就是 "数据驱动 "的。这与模型是基于效应还是基于物理无关;从这个角度看,对测试与评估有用的基于效应的模型和基于物理的模型之间的区别,仅仅是使用了一套面向操作或面向物理的输入参数以及支持这些参数的相应实时数据。
充分发挥 M&S 在测试与评估和实际军事行动中的潜力,取决于 M&S 的可及性、易用性和可理解性。简而言之,要充分发挥 M&S 的潜力,就必须将该领域从目前的模型开发人员或其他训练有素的技术人员作为典型用户和解释者的状态,发展为直接向作为最终用户的作战人员提供可操作服务的状态。这意味着作战人员与 M&S 服务交互的方式必须与他们执行军事行动时使用的技能相同;M&S 服务应提供以下服务:
为步兵提供第一人称的数字界面,让他们在战术环境中与自己的小队协同作战,通过火力和机动来定位、接近和消灭敌人。
为舰长提供数字化界面,使其了解导航、舰船健康、潜在威胁接触的态势感知等作战环境,以及用于舰船自卫和攻击敌方资产的作战武器系统。
战区指挥官可以通过数字化界面了解战略环境,查看从海底到太空和网络等所有领域的部队状态和位置,以及敌方部队的状态和位置,从而有效指挥我方部队击败敌人。
上文讨论的 M&S 服务与当代电子游戏之间的相似性显而易见--无论是步兵的第一人称射击游戏《使命召唤》、舰长的《战舰世界》,还是战区指挥官的《钢铁之心》。事实上,美国陆军的电子游戏系列 "美国陆军 "主要是作为教育和征兵工具开发的,但后来以各种方式被用作训练美国陆军士兵的平台。此外,利用模拟器培训军事平台操作人员的做法当然也无处不在。
要充分发挥 M&S 在测试与评估和实际作战中的潜力,就必须将 M&S 能力从国防实验室转移到作战人员手中。在我们迈向未来的过程中,操作 M&S 和解释其输出结果的过程应从技术实践者转向作战人员。这就需要我们付出巨大的努力,将当前的 "后端 "M&S 功能集成到面向操作员的数字界面中。尽管如此,现代军事主题电子游戏展示了为玩家提供此类界面的成熟框架,值得我们效仿。
通过开发一种开放的高级互操作性架构,克服许多特定领域工具所面临的可用性和集成性挑战,可以生成一种集成所有作战领域和数字能力的 M&S 环境。也就是说,这种开放式架构将提供高层次、跨领域的互操作性层、应用编程接口以及与终端用户接口的连接,这些都是将国防部众多互不关联的 M&S 工具整合到一个统一框架中所必需的,同时允许模型构建者专注于其特定领域的独特属性和物理特性。
例如,技术和数字娱乐行业正在开发一系列相关解决方案,其中包括用于构建和运行可扩展虚拟三维世界的开放式可扩展框架。这些解决方案的核心是建立在强大、开放的数字数据交换层之上,并提供了大量功能,用于描述众多代理之间的交互,并将它们组合成更大的系统体系。此外,它们还支持协作,使许多用户可以同时进行操作。
国防部的许多 M&S 工具都涉及信号传播和网络;在这里,这些虚拟 3D 世界构建技术已被电信行业用于整合其无线电频率传播模型和网络模拟,以优化城市环境中 5G 基站的布局。
同样,国防部内部也在实现这种能力方面取得了长足进步,以下两个例子对此进行了讨论:
下图 1 着重介绍了情报界开发和使用的综合威胁分析与仿真环境 (ITASE)。经过验证的威胁模型和情景可集成到 ITASE 中,以实现从工程到杀伤网的多域任务级评估,包括陆地、空中、海上、太空、网络和电子攻击。
ITASE 提供开放、可互操作的接口,并已成功集成到分布式实时测试范围数据流以及美国能力的仿真环境中,如 One Semi-Automated Forces (oneSAF)、Next Generation Threat System (NGTS) 和 Advanced Framework for Simulation (AFSIM)。
ITASE 已成功用于任务规划,并与实际任务数据包集成,用于任务后分析。
图 1:综合威胁分析与模拟环境 (ITASE)
DARPA 开发了分布式实验环境 (DE2),以实现未来联合作战概念的快速、敏捷演进,如图 2 所示。在 DE2 中,可以通过实时、虚拟和建设性实验,根据实时数据对模型和仿真进行持续改进,从而形成 "实时测试、改进、预测 "的反馈回路。
DE2 提供的持续集成环境建立在可互操作的通用数据层之上,可将战术软件和硬件纳入环路。它也是分布式的,可集成到许多站点和平台,跨服务和跨领域,同时支持多级安全环境。
图 2:分布式实验环境
要生成一个能整合所有作战领域的 M&S 环境,就必须采用开放式架构的互操作层,将国防部众多互不关联的 M&S 工具整合到一个统一的框架中,同时允许模型构建者专注于其特定领域的独特属性和物理特性。商业行业正在迅速成熟与构建和运行虚拟三维世界密切相关的开放技术,我们应该复制或直接采用这些技术。这些开放技术进一步实现了与现实世界同步的数字孪生。它们还被用于优化 5G 基站布局等与军事相关的应用。目前,包括美国陆军第五特种部队(作战支持)、卡内基梅隆大学软件工程研究所(研发)和 DOT&E(测试与评估)在内的多个国防部组织正在对这些商用技术的军事应用进行研究。美国国防部内部也在向这种能力迈进,情报界的 ITASE、DARPA 的 DE2 以及它们各自提供的数据互操作层都证明了这一点。
必须在整个 T&E 企业部署大规模工业计算基础设施,以便在未来联合作战行动的复杂程度和快速时间尺度上做出可靠的数据驱动决策。换句话说,测试数据的收集、分析和高级汇总必须实现网络化、自动化,并与本文前面设想的统一 M&S 环境集成--从战术边缘到 C-suite 都是如此。图 3 提供了这一企业数据和分析环境的技术视图(青色)和概念性操作视图(橙色):
在边缘: 来自平台的原始流数据、机载数据缩减和分布式原始二进制数据存储。
整个企业: 将数据后处理为开放的机器可读格式(例如,国防部开发的云混合边缘到企业评估和测试分析套件(CHEETAS)提供的数据互操作层);集成到数据支持的 M&S;使用开放的通用自动数据分析环境(例如,国防部开发的 Automaton 数据分析平台)进行 "在线 "系统性能分析;以及由分析师执行的临时 "离线 "手动实验和开发。
在C-suite : Advana 使用由高级系统性能分析人工智能组成的数据集市进行大数据汇总高级分析。
图 3:未来通用 T&E 企业数据和分析环境的技术视图(青色)和概念性操作视图(橙色)。
上述自动化数据和分析基础设施背后的严密性不仅能加快分析速度,还能进行必要的复杂分层分析,以阐明高层次的协同任务效果: 在较简单场景中收集的实时数据将与 M&S 进行 "混音 "和融合,以创建 "数字舞台",利用包括人工智能和贝叶斯网络在内的各种先进分析技术,评估更复杂的作战场景及其相关的突发行为。
让我们回到小艇突袭防御的例子,并将其扩展到一个完整的咽喉要塞场景。现在假设对手部署了一系列武器和平台--如水雷、装备鱼雷的潜艇和导弹炮台--以阻止军舰通过,并进一步假设军舰现在由小艇射击战斗机和潜艇猎杀攻击潜艇护航。在我们的数据混音和数字竞技场概念中,各种武器和平台的实时测试数据和威胁模型在虚拟环境中融合在一起,从而能够对这种更复杂的作战场景进行综合分析。
目前正在实施多项计划,以建设和部署工业计算基础设施,为未来联合作战行动进行可靠的数据驱动测试与评估。本文前面设想的统一 M&S 环境将被集成到这一数据和分析环境中。当前的使能工具包括国防部开发的 CHEETAS 和通用 Automaton 数据分析平台,以及 Advana 高级分析平台。自动分析将在从战术边缘到 C-suite 的整个过程中投入使用。我们将阐明未来联合作战行动所特有的高层次协同任务效果,以及由此产生的新行为,具体方法是重新混合数据并将其与 M&S 相融合,以创建 "数字舞台"。这样,我们将利用包括人工智能和贝叶斯网络在内的一系列先进分析技术,对这些复杂的作战场景进行评估。
DOT&E 明白,作战人员需要一个从海底到太空,再到网络的综合视角,以击败我们的对手,保卫我们的国家。DOT&E 的 SIPET 部门--战略倡议、政策和新兴技术--正在塑造未来多域作战的测试与评估。这些未来能力的测试与评估将依赖于数据驱动的企业 M&S 环境,该环境被集成到实时测试和数据馈送中,并作为一种服务提供给我们的士兵、水手、飞行员、监护人和海军陆战队员。本文描述了 DOT&E 对这种环境的愿景,同时深入探讨了它所面临的许多挑战:
构建 M&S 和实战测试,形成 "预测、实战测试、改进 "的反馈回路,在系统生命周期内提高 M&S 的准确性
确保所有作战领域和数字能力的整合
将 M&S 作为一种服务投入实战,使操作 M&S 和理解其输出结果所需的技能组合与现实世界中作战人员所需的技能相一致。
为测试与评估和作战决策提供具有实时分析和准确结果的环境
对这些挑战的阐述并非学术性的;相反,讨论是务实的,围绕迅速成熟的技术、先进的方法以及与未来联合作战概念的测试与评估相关的现实世界用例展开。DOT&E 和我们的合作伙伴正在开展多个研发项目,这些项目正在推进我们的 T&E 能力,并为我们应对挑战做好准备--还有更多项目正在进行中。