基于人工智能 (AI) 实现的军事情报(MI)自动化,在许多方面拓宽了情报收集程序和分析功能范围。在当今的数字化世界中,每分钟都以指数方式产生数据。世界各地的情报机构正在体验新的信息维度,而这些信息在过去由于人类处理庞大数据集的能力有限而被忽视。人工智能/机器学习 (ML)的发展带来了一种革命性的方法,可以收集大量数据并使用 ML 算法进行分析,从而为非战时时期和战时战略、作战和战术指挥官生成各种情报信息摘要。为了应对传统和非传统威胁,基于机器学习的军事情报数据收集和分析,将通过有监督、无监督、强化和深度学习方法进行,其中自动化程度通过人在回路和人在回路之外的方法确定。这些 ML 工具将有助于开发系统框架,能够通过自适应学习技术感知和响应运行环境,从而从其经验中学习,根据以前的学习和经验适应不断变化的环境。结合智能安全传感器、监控无人机、地球观测卫星、电子和虚拟源监控系统,可以增强军事情报信息收集系统。数据分析和数据融合可以在信息源收集、存储与处理、融合与分析、数据共享4层框架内,通过回归、分类、时序分析、聚类分析、主题建模、协同过滤和关联规则等方式进行。军事云网络和物联网 (IoT)可以增强数据共享。与其他武装军种、相关部委、工程大学和商业利益相关者合作,将有助于制定未来的策略指南、研发、ML 算法开发计划以及为各种基于 ML 的 MI 平台和应用程序生产兼容的硬件。
军事情报 (MI) 是收集、解释和向军事指挥官传播信息以协助其决策的过程。它研究广泛的作战环境,分析各种参与者,同步相关信息并监控非战时、战时正在进行的事件。随着技术的进步,多源数据呈现多倍和多维度增加。这些数据来自战略、作战和战术层面,包括政治、军事、经济、社会、商业、媒体和多背景职业人员。情报分析人员经常面临从大量信息中得出适当结论的复杂任务。从可用数据中得出的假设不能被认为是结论性的,因为它无法通过最大程度收集的信息源进行验证。由于生成的信息在时间和空间上是动态的,随着形势变化而快速演变;从一组信息中得出的结论通常需要验证,由于处理如此大量的数据和信息的限制,有时甚至在给定的上下文中排除了验证。此外,需要通过与其他来源的各种相关性分析,定期检查来源的真实性,这对从这些信息中得出的假设有明显的影响。
不可否认,由于各种来源的数据生成激增,在信息的收集、分析和相关性评估方面将有很大的改进空间。在收集和分析过程中使用人工智能 (AI) 和机器学习 (ML) 可能是未来最有效的方法。许多技术先进的国家正在用AI/ML改造他们的智能系统。因此,需要评估机器学习是否可用于情报信息的收集和后续分析,处理非战时、战时的海量数据流,以获得战场环境和当代全球形势最准确的结论性图景。
军事情报是一个动态过程,这是由于各种参与者无处不在的活动,他们产生了连续的数据流。对数据进行评估和分析,将数据分发给利益相关者,采取适当的行动并监测相应的影响,这些都是不可分割的过程,可以通过机器学习系统驱动的自动化进行。此外,通过 ML 系统可以提高和更有效地运行指挥、控制、通信、计算机、情报、监视和侦察 (C4ISR) 系统的功能,其中集成系统可以从环境中学习,并根据迭代学习过程提出评估方法。因此,可以将军事情报、侦察和监视集成在一个综合指挥系统下,通过机器学习可以拓宽军事视野。
Shu-Hsien 等人(2003 年)强调了基于知识的未来军事情报规划系统架构。已经讨论了许多应用 ML的系统架构和系统配置,其中介绍了自动和半自动分析方法的过渡。此外,还讨论了一个具有假设系统实施策略的典型模型。
Prelipcien 等人 (2010) 强调了可用于分析和决策行为模型的各种 AI 算法。简要介绍了神经网络的应用、泛型算法、模糊逻辑和专家系统。一些模型描述了神经网络可用于模式识别但在决策应用方面存在不足。泛型算法具有对环境动态适应的自学习原理,可广泛用于开发多种决策方案。模糊逻辑被推荐用于基于输入和期望输出之间关系的决策规则。它有助于机动计划和兵力分配,但缺乏具体的判断决定。专家系统是基于知识规则进行识别和确定特定情况下的行动时间。并重点讨论了各种算法模型设计的 ML 应用。
Dijk (2019) 在他之前关于国防应用中的 AI 和 ML 的会议上,为军事情报分析方法编译了许多 ML 模型。与实现研究目标相关的方法是无人传感器和系统、使用 ML 方法对无人机进行声学检测、通过无人机系统进行态势感知、可见光和热光谱范围内的视频监控、用于视觉识别的神经网络、用于行为识别的深度学习,提出了用于危险分类、信息提取和语义世界建模的深度神经网络模型,和基于对象的深度学习多光谱图像融合方法,应用于军事情报分析。
Ahmed (2019) 强调了人工智能在孟加拉国 (BD) 武装部队监视领域应用的重要性。详细阐述了 AI 实施路线图架构,可用作探索预期目标的初始参考方案。调查已用于基于ML进行军事情报分析框架的意见和指南。
Mitchell 等人(2019 年)讨论了情报周期元素之间的相互联系,并列举了如何将 ML应用于情报周期的各个阶段。通过人工智能实现自动化,所有情报机构都可以利用潜在的工作时间,这为情报机构在量化价值方面的效率加速程度提供了深入的见解。这为情报主体在情报过程中应用数学模型时的效率提供了定量比较。
中国(2017)强调了潜在的通用技术、支撑平台和未来人工智能产业,以开发智能计算技术,用于未来人工智能驱动的重大科技项目。重要的是要发现知识计算技术是建立在自适应机器学习和分析推理技术之上的。其中,关键群体智能技术、跨媒体分析推理技术、知识计算与服务技术、混合增强智能架构、智能自主无人系统、智能虚拟现实技术、智能计算芯片与系统、自然语言处理技术,已成为探索未来军事情报分析的重要创新。大数据智能理论、跨媒体感知理论、混合与增强智能理论、群体智能理论、自主协调与控制、优化决策理论、高级机器学习理论、类脑智能计算等学术研究发展规划理论、群体智能理论和量子智能计算理论已被预测为 ML 应用于情报分析的指导学术话语。这些将通过机器学习为未来的军事情报分析构建基于知识的架构。这些是基本的学术指导方针,持续发展将为 ML 用于军事情报分析创建研发计划。结合这一理论框架,Haridas(2015)提出了用于国家和军事情报收集的大数据分析,基于大数据分析的情报可以为决策提供必要的支持。ML 被用作情报大数据分析工具,通过该工具可以实现威胁警报、社交媒体监控、信息挖掘、文档分析和网络安全监控。讨论了基于大数据应用的情报收集系统的概念布局,其中可以对来自多个收集源的各种信息数据进行实时高级分析,以提供态势感知、决策制定和战斗评估。这些都为今后的研究和开发提供了较为详细的理论概念。
Michael O'Hanlon (2019) 预测未来 20 年军事技术将发生显著变化,他专注于军事技术的未来趋势。在四类技术突破中,第一类是收集与军事行动相关数据的传感器,第二类是处理和分发这些数据的计算机和通信系统。预测了 2020-2040 年关键可部署技术的预计进展,其中显示了传感器和其他通信系统的部署概率。它对情报采集源、通信和信息处理技术的未来发展做出了清晰的预测。 Connable (2012) 强调了各种形式和格式的情报数据融合过程,并介绍了融合过程对于相关国家和国际参与者分析未来复杂环境的重要性。一个包含政治、经济、军事、社会和信息基础设施的系统分析图,解释了信息流如何影响战略和作战重心,这验证了未来情报数据收集和处理热潮的颠覆性转变。它描绘了融合的情报图片如何更好地反映地面图片,从而帮助情报人员了解复杂的社会-政治-军事环境,并与大局建立联系。因此,在未来复杂的作战和战略场景中,将在情报数据融合分析方面寻求范式转变。
为了对来自不同来源的数据进行融合,Cruickshank (2019) 提出通过应用数据科学来开发军事情报架构,为了从原始数据中提取知识的能力。建议使用 ML 和其他 AI 技术,数据科学将成为分析来自各种收集源结构化和非结构化数据的首选学科。在这方面,Kendrick (2019) 展示了一个在所有陆军梯队采用以数据为中心的框架。这允许在陆军决策和执行的每一层面将数据科学有效地整合到陆军情报中。数据科学工具可以自动化情报过程的复杂步骤,最终开发军事情报数据库。这些概念可以提供为军事情报过程开发合适的 ML 模型。
Dopico 等人(2009 年)在他们的《人工智能百科全书》中汇编了大量关于当前人工智能技术发展的研究文章。在这些文章中,各种最新的智能系统建模、自适应技术、人工神经网络、用于信息检索的人工智能、认知建模、基于行为的神经网络聚类、智能代理中的决策、面部表情识别程序、分层强化学习、自然语言处理程序、模糊逻辑系统的监督学习和群体智能方法模型,可以提供一个启动框架,可用于说明 ML 如何用于解释情报数据并将其转换为可用信息。有了 ML 程序开发指南,对用于军事情报分析的 ML 系统的研究和开发可能非常重要。
机器学习是人工智能的一个子集,已被发达国家和发展中国家的军队广泛用于其各种军事应用和作战平台。 ML算法用于分析和学习数据(Bhatnagar,2018)。 ML 旨在通过分析示例和信息中有意义的关系和数据模式,来学习和调整其思维模式,这些示例和信息旨在以类似于人类认知逻辑的性质工作(Janiesch & Heinrich,2021)。在 2018 年美国国防战略(Defense, 2018)中宣布,将人工智能作为未来打赢战争的关键技术,这已被美国(US)列为未来战略。俄罗斯在 2017 年重申追求人工智能技术,因为俄罗斯总统公开宣布了其对未来军事前景的立场(Simonite,2017)。中国在 2017 年发布了一项战略,详细说明了到 2030 年通过人工智能引领军事技术的路线图(Council,2017 年)。 Maven 项目是正在进行的领先的军事 AI 实施项目之一,在伊拉克和叙利亚打击 ISIS 的行动中,五角大楼通过算法战跨职能团队将无人机视频转换为可操作的情报,从而开始对 ML 进行军事应用(WEISGERBER,2017 年)。
军事情报(MI)流程集成了情报、监视和侦察 (ISR),ISR开发了情报发送 (IC) 流程。通常,它结合了空间数据库、属性数据库、案例库、规则库和知识库,MI 过程通过这些知识库进行工作。军事侦察是获取有关敌对部队和自身作战利益地形信息的过程。军事监视是根据侦察数据对活动进行监测,以便保持有关的最新情况 。MI 结合了分析侦察和监视数据,并将原始信息转换为对当前和未来行动具有军事利益的有用情报的过程(Liao 等人,2003 年)。军事 ISR 的框架如图 1 所示。
图1:军事ISR框架(Liao等,2003)
从图 1 可以明显看出,MI 的相互交织的过程列举了每个过程都与其他过程相辅相成,并且任何过程中缺乏活动都会导致整个 IC 过程出现故障。可以通过自动化以最小的错误概率加速持续的协调、修订、更新和执行。因此,最新的人工智能强化学习方法通过人机协作将整个过程纳入情报分析框架。
MI过程是通过使用管理信息系统(MIS)进行的,通过该系统处理显性知识。但在当今世界,有大量的数据产生,包括物理数据和虚拟数据,有属性数据库、空间数据库、案例库和知识库等多种数据库。地理信息系统(GIS)和基于知识的决策支持系统(KBDSS)被用于整合决策支持和知识管理功能,以增强显性和隐性知识库。在这方面,提出了结合情报战支持系统(IOSS)结构,通过混合推理策略完成丰富的知识表示,证明了其在生产决策系统中的适用性(Xia & Rao,1999)。该系统的运行基于从书面知识中学习、从问题解决中学习、从问题解决失败中学习和从遗忘中学习。这称为自适应和强化学习,它是 ML 的主要属性和 AI 的核心功能。由于情报收集、积累、分析和传播功能的动态特性,基于强化学习的 ML 功能正变得越来越流行,并且依赖于 MI 过程。
MI 流程的层次结构和配置大致分为三个层次(Liao 等,2003)。第一层由作战和战术情报收集组织和单位组成,其通过侦察和监视手段收集数据、图片、信号和网络信息。这些手段大致可细分为人类智能、信号智能、图像智能和通信智能。第二层次对提供的数据和信息进行不同的情报分析。在此层面上,分别根据日常和紧急需求提供常规和特殊情报报告。常规情报的存档是这一层面的重要组成部分之一,它会定期更新并根据需要进行检索。第三层是经常提出智能化要求的用户组织、上级指挥部和高层领导。他们还定期更新态势感知以及具有作战和战术价值的特殊情况。
MI的作战流程分为常规任务和特殊任务。在常规任务中,作战注意力集中在基于常规和标准操作程序的基本情报收集上。有时限的特殊任务侧重于从特定事件、情况和人员中获取特定情报。因此,这两个作战过程都阐释了如图 2 所示的 IC。
图2:军事情报作战流程(Liao等,2003)
广义情报作战流程建立在对第一层情报采集组织和单位采集的原始数据处理之上。将原始数据转换为信息的过程是由隐性和显性知识库完成的。这两种类型的知识库之间存在核心差异。隐性知识是任何智力主体的经验、逻辑思维和胆识的积累,本质上更多的是个人属性(Oliver, et al., 1997)。它因人而异,并且根据此类知识库做出的决定通常是出乎意料的,可能不是基于逻辑推理(Hedlund,1994)。尽管在某些情况下,隐性知识被证明是根据情报预测任何结果的合理正确方法。但另一方面,显性知识基于教义基础的规则、方法和技术,本质上更精确、清晰和结构化(Zhang & Griffith,1997)。此外,程序性知识是由显性知识支持的标准操作程序(Anderson,1985)。
在当今的数字化世界中,人类处于大量数据中,这些数据正以指数方式增长。数据的多样性、数量、速度、矢量和无处不在不仅扰乱了当今的作战前景,而且忽视了对通过它所承载的信息解释,从而危及国家安全。在“信息就是力量”的格言下,作战部队必须具备解读这种不断增加的结构化和非结构化数据的能力,并找到有助于促进非战时、战时情报数据库发展的模式。世界各地的情报机构正在重新定位和重组其传统的情报作战方法,以适应动态数据流并准备分析大型数据集。很明显,在未来的技术时代,情报前景必须拓宽,并依赖于收集和组织大部分自己感兴趣的数据来可视化未来态势。
一般情报作战由五个相互关联、相互依赖的循环组成。分别是计划、收集、处理、分析和传播 (PCPAD)。收集、处理和分析 (CPA) 阶段至关重要,需要从技术方面加以重视,因为操纵和处理的数量已经超过了人类的能力。数据收集来源包括传感器、航空系统、卫星、无线电信号、开源互联网、社交网络、不同的组织、代理、对手等等。这些数据在不同的时间和空间以不同的格式在不同的介质中以二进制数据的数字格式或书面和口头数据的形式出现。因此,它需要一个通用的解释系统,可以处理、存储、解释所有类型的数据格式,并可以制作通用的情报图。
根据 Desjardins(Desjardins,2019 年)的说法,世界正在产生大量数据,如图 3 所示。
图3:2019年中一天的数据(Desjardins, 2019)
Bulao (Bulao, 2020) 总结了以下关于互联网世界中通过信息高速公路产生了多少数据的细节。
表 1:通过信息高速公路生成数据(Bulao,2020)
这些是在非战时时期准备情报数据库时需要分析的数据量和数据类型,以便在需要的时候帮助提取必要的信息。此外,在过去十年中,非传统安全 (NTS) 威胁仍然很高,并且已经成为新的安全问题。因此,需要每天开发、更新和监控针对 NTS 威胁的情报,以便及时了解由于参与者的不可预测行为而导致的任何即将发生的情况。在战时,在活跃的战场情景下,持续的侦察和监视是任何作战活动必不可少的组成部分。在战场环境中,这些来自各种来源的数据被添加到以前的数据库中,从而产生海量的数据流,这是人类操作员使用传统的收集、存储和分析方法无法处理和组织的。在正在进行的 AI 技术时代,有监督和无监督 ML 被广泛用于收集大量数据。使用 ML 的优点是它可以自主或半自主地训练自己来整理 MI 所需的数据,这使它能够用可用的模式标记数据。因此,机器学习系统可以轻松筛选数十亿字节的数据并捕获所需的数据类型,为机器学习创建有意义的信息。虽然机器学习应用于数据收集,但系统通过数据挖掘(Chan,2020)通过正确识别、定位、分析、集成、清理和存储来准备数据。
在讨论了 MI 流程和系统架构的广泛结构之后,不同国家的军队一直在通过监督学习和强化学习关注隐性知识和显性知识来开发和重新定位其 MI 流程。随后,对各种正在进行的MI流程系统进行了彻底的重组,这些系统将在可预见的未来主导MI流程的制定。简要讨论了一些最近开发的用于收集和分析 MI 流程的自动化系统。
• 多域指挥和控制系统(MDC2)是集中式平台之一,收集和分析通过传感器从陆地、空中、海洋和网络空间收集的原始数据。这些数据与中央系统的融合是为了创建一个单一的信息库,从而为决策者创建一个通用的作战图(CLARK,2017)。
• 边境监视系统(BSS),对边境沿线的物体和人员进行自动监视。它由传感器、网络资源和数据库组成,其中开发了算法来计算指标,从而为威胁提供预测值。它不仅可以估计威胁程度,还可以评估一系列事件的不确定性程度。贝叶斯推理、背书理论、模糊推理和 Dempster Shafer 理论与编程算法一起用于 BSS 的设计(Albertus C. van den Broek,2019)。
• 声学探测器,是一种通过机器学习方法运行的主动探测系统,可以跟踪和探测空中和地面中的小型微型物体。 ML 方法用于使用来自各种传感器和雷达的实时数据来检测和评估多种算法的性能。这可以将各种音频特征与可听和不可听频谱区分开来。基于 ML 的检测算法可以剔除噪声并通过作战环境产生可用的情报(Alexander Borghgraef,2019 年)
• 通过增强技术在可见光和热光谱范围内进行视频监控,采用深度神经网络记录和检测纹理和热图像。卷积神经网络是在自适应学习算法下设计的,通过从各种来源获取传感器数据并做出决策。它在长波红外和可见光谱范围内的大规模多光谱热世界数据集中特别有用(Vanessa Buhrmester,2019)。
• 基于深度学习的行为识别已经应用于监控系统中的传感器数据分析。该系统致力于识别人的异常行为并跟踪具有特定行为模式的人员(Maria Andersson,2019)。该系统通过预设的人与人、人与物、人在特定环境的行为模式来分析不同的行为特征。这是在监督学习模型上设计的,其中具备不同的行为类别和模式,通过这些模型分析和检查受试者的行为特征,以筛选和检测所需的感兴趣的人。
• 通过结合和分析不同的情报输入,开发了基于语义世界模型的信息提取技术。这些情报输入的形式有人力情报(HUMINT)、图像情报(IMINT)、开源情报(OMINT)、虚拟源情报(VIRINT)等。通过使用数据驱动的机器学习机制和语义世界建模,将信息整合、处理、融合产生一个通用的情报。这些是基于深度学习方法面向结构化和非结构化数据开发的(Almuth Hoffmann,2019)。
ML 在国防、经济、医疗保健、交通、航空、空间技术、商业等领域的应用领域已经具有较大发展。有趣的是,这些领域的应用成果可以加速国防应用的发展。对于 MI,这些 ML 算法可以用于探索未来的应用,这些应用已经在理论研究中或已经在实际工业应用中。在此基础上,讨论了算法模型及其在模型分析中的应用范围:
• 从互联网资源和通信媒体中检索多媒体信息会在高维空间中产生大量数据。主动学习支持向量机 (ALVSM) 一直在开发以处理此类高维系统,因此可以作为 MI 数据收集和分析的基本系统 (Jiang & Horace, 2009)。
• 基于智能体的智能系统建模被开发用于感知和响应作战环境,作为一个自适应系统来获取和存储信息,从其经验中学习,通过自动化或半自动化控制,调整方向,适应变化的环境。通过自适应学习不断修改规则,使系统在不断变化和演变的环境中做出必要的决策输出。智能体的工作原理是通过基于代理的建模 (ABM) 结合人类和基于机器的数据进行监控、倾听和响应 (Tang, et al., 2009)。
• 环境智能 (AmI) 通过物联网 (IoT) 无缝集成智能设备和基础设施。它通过语音识别和图像转换集成了所有的采集和监视传感器、智能系统、人、计算机和社会交互。该系统通过认知推理的直观界面工作,并向智能体提供合适的策略选择(Sadri & Stathis,2009)。
• 面部表情识别系统 (FERS) 用于识别人类情绪并捕捉大量图像序列中的面部表情。人机交互解释面部运动并分析情绪状态(Dornaika & Raducanu,2009)。
• 数据挖掘和数据仓库被广泛用于管理和分析大型数据集(基于模式识别技术)。数据仓库可用于存储可在需要时检索的数据。数据挖掘用于压缩庞大的信息存储库。它是一个涵盖大数据集、模式识别、机器学习、信息与控制理论、信息检索、并行与分布式计算和数据可视化的多学科领域(Zhou,2003)。与 MI 分析最相关的数据挖掘活动可能是关联、序列、分类、聚类和通过神经网络、决策树、回归分析和基于记忆的推理进行的预测(Wang 等人,2009 年)。
• 带有传感器、AI 和 ML 的地理信息系统 (GIS) 生成数字地图,其中输入来自地面传感器、空中平台和卫星。它生成定制的便携式地图,其中包含实时和空间放置的更新对象以及用于检测和跟踪系统的准确地理坐标。图像和对象处理是通过自适应和监督机器学习的深度挖掘建模完成的(Matheson,2020)。
• 基于传感器的认知平台通过广泛的神经网络系统中的各种数据和图像收集传感器工作。该平台通过模糊逻辑和遗传算法进行操作,形成专家和学习系统(Hamblem,2017)。
要在大局下开发完整的情报概要,显然需要关联和融合来自多个收集源的所有情报数据。基于机器学习方法的工具可以分为三类,例如监督学习、无监督学习、强化学习和深度学习。 Alkire (Alkire, et al., 2016) 将分析工具分类为启用分析、执行分析和支持分析。启用监督学习方法下的分析工具可帮助智能体快速、准确、完整地执行特定的分析任务。这种半自动化工具通过人机交互和人在环结构中执行分析任务。执行分析是替代智能体的全自动工具;从而在具有人外循环结构的无监督学习方法下运行。执行分析工具可以通过基于任务和基于周期的方式进行操作。基于任务的工具从情报代理中卸载指定的任务并自主完成任务。基于循环的工具完全无需人工干预即可执行智能循环的所有步骤。强化学习和深度学习下的分析工具通过自适应学习运行,它通过知识管理数据库、建模、模拟环境、人际协作、纵向和横向协作来支持智能体。
数据合成是情报数据分析的重要步骤。其目的是将来自各种收集源的所有不同元素组合在一起,以开发单个事件和情况的情报摘要。这种合成一般分三个层次进行。初级阶段是基础分析和开发,其中汇总来自单一来源的数据以制作情报产品。这是关键基础,因为到下一层次的合成链取决于此数据组合阶段。高级分析和开发层次目的在于解释多源数据,由于来自多个来源的数据量和类型,分析和开发变得更加复杂。与此层次并行,可以创建多源分析和多情报融合,以发现情报产品之间的关系,这可以被认为是更深层次的阶段。这样做主要是为了找出数据模式,以便可以预测任何情报事件的概率。最后一个层次是所有源分析,其中所有可用数据被融合和合成在一起,并在时间、地点和行为方面对目标进行更准确的预测。这种类型的分析需要一种整体方法来组合所有类型的数据格式,这可以通过监督学习 ML 方法较好地完成。
人机界面和人机协作是将机器学习纳入 MI 的重要阶段。在 MI 流程的自主化方面,人在环系统一直是首选。可以通过多个层次开发将 ML 纳入 MI 流程。这些层级是相互关联的,可以从总部放置到外勤单位,以促进各种来源的信息流动。
第 1 层将主要包括人力、机械和电子来源。可以放置传感器、无人机、卫星和雷达,以全天候收集来自全国各地和感兴趣区域的图像源,以用于作战目的。传感器是静态设备,低成本设备,可以很容易地放置在感兴趣的地方。传感器之间可以建立局部连接,其中图像数据可以收集在全国分布式服务器的数据库中。此数据存储功能将在第 2 层(存储和处理)中进行协调,其中可以在中央数据库中收集、分类和筛选来自传感器的所有图像数据。无人机和卫星分别是可以探测、跟踪和定位静止和移动物体的战术和战略设施。无人机可以将图像数据发送到本地和中央数据库,而卫星数据可以发送到中央数据库。由于卫星范围超出国家边界,它可能用一个单独的数据库用于外部图像存储。雷达是静态检测系统,可以检测飞行物体、移动物体。这些图像数据可以通过光纤网络直接存储到中央数据库。
图4:第1层(数据来源)
智能安全传感器、无人驾驶航空器(UAV)、地球观测卫星(EOS)以及电子和虚拟源的功能
非战时监视是 MI 部门的主要职能之一。为此,除了人工收集信息外,传感器、无人机和地球观测卫星(EOS)也可以在收集大量数据和信息方面发挥重要作用。
• 智能安全传感器
智能安全传感器是构建 MI 采集系统的关键元素。静态的、通过物联网(IoT)互联的传感器,可以在国家边境形成一个大型监控网络系统。它们可以执行各种功能,包括环境监测、武器控制、通信和信号拦截、监测军事行动、犯罪检测、入侵检测、NBC 检测等。有多种类型的传感器可用 MI 目的。有源传感器通过自己的辐射源发挥作用,该辐射源在电磁频谱的微波和无线电波长区域工作。它支持包括运动检测和入侵检测在内的各种 ML 算法。这些都是通过ML算法下的自动提取过程,从复杂的噪声频谱中处理无线电信号。智能传感器通过强化学习机制发挥作用,这是一种多功能、自我诊断和自我补偿的装置。这些是由具有更高处理芯片的高分辨率图像传感处理器构建的,可以将数据从远程站快速传输和共享到中央数据库或本地数据库。短波图像辐射机制已证明它是用于 MI 目的的精密和可靠传感器之一。微机电系统 (MEMS) 传感器通过机电传感器发挥作用,小型化机电传感器尺寸,因其在短时间内快速部署而广受欢迎。这些是在崎岖不平地形和环境中长时间工作的理想传感器。视觉解释数据生成过程使其成为值得信赖的军事检测传感器之一。纳米传感器被认为是用于 MI 的最先进技术。它们耐用、坚固、重量轻,并通过自适应学习算法工作。这些新兴技术通过创建本地虚拟云网络来共享数据。这些在难以接近的地形配置中提供了更好的连接性,该配置通过认知学习方法和通过增强现实 (AR) 界面进行工作(Electronicsforu,2018 年)。
• 监视无人机(UAV)
监视无人机(UAV) 是收集难以接近和易受攻击的地形图像和视频数据的基本系统之一。由高分辨率计算机视觉和图像处理技术建模的移动对象检测和跟踪 (MODAT) 框架,用于创建地理空间地图和其他图像文档。对地形物体的监测、对运动物体的跟踪和实时位置数据的更新,有助于对感兴趣区域进行24小时监控。它们独立运行,集群工作,分散方式通信,以确保最佳的安全性和应用灵活性。自动化 MODAT 框架在图像对齐、运动检测和对象跟踪等三个模块下运行。图像数据的大量计算是基于强化学习的各种图像处理算法进行的(Ibrahim等人,2010)。
• 地球观测卫星
地球观测卫星(EOS) 是一个覆盖广泛地形的宝贵情报收集系统,因此可以作为任何军队的战略资产设施。 EOS可以从不同高度观察获取地形卫星图像并将其发送回中央控制站。经过适当处理后,这些图像可以通过机器学习研究地形配置模式的变化,并为潜在的越境入侵提供警报。对卫星图像进行采集、存储、处理和解释的整个过程都是由各个ML算法模型自主完成的。
• 电子和虚拟来源
除了其他传统和现有的情报来源之外,电子和虚拟来源对 MI 至关重要。数字签名和潜在信息出现在各种电子媒体和虚拟信息高速公路(互联网、社交媒体网络和其他媒体资源)中,可以对任何即将发生的情况建立 360 度的视角和评估。通过有监督的算法建模框架来强化人工智能学习,可以从这些媒介中提取所需的信息。这需要人工的持续监督,可以通过监督学习程序来实现。互联网上的电子资源是 ML 在检测和提取所需信息方面发挥重要作用的主要信息来源之一。它可以通过自动化过程对所需信息进行分类和收集,由于数据量大,情报人员经常忽视这一过程。潜在情报来源包括互联网网站、社交媒体平台(Facebook、Twitter、Instagram 等)、视频共享平台(YouTube、Vimeo、TikTok 等)、新闻门户(国内和国际)、媒体频道(国内和国际)。这些来源的数据通常以非结构化的图像和语音数据格式出现。外交机构是提供该国家最近在政治、经济和军事方面发展情况的真实来源之一,这些发展通常以结构化的形式出现。全球军备合同和交易细节可以提供潜在对手的最新军备能力。这些主要是结构化数据,收集来源通常需要在第 2 层进行验证。除此之外,各种军事技术开发计划可能是了解未来军事发展趋势的最重要来源。这些数据采用结构化格式,通常需要在第 2 层进行验证。
• 人力情报
人力资源仍将是最重要的信息来源,正如孟加拉国陆军所流行的那样。人力情报(HUMINT)可以通过各种人力和其他来源收集。这些可以分为常规、非常规、专业、按需和共享 HUMINT。常规 HUMINT 是从一般收集来源收集的,这些来源经过培训并符合常规就业原则。从需要定期验证的来源收集非常规的 HUMINT。这些来源必须符合个性配置文件下第 3 层中设置的验证参数。专业的 HUMINT 是从高度机密的来源收集的,这些来源通常在感兴趣的地方处于休眠状态,基于自驱动机制收集信息。专业的来源通常在放置之前进行验证,但需要与在第 3 层中执行的活动模式相匹配。 按需HUMINT 是常规 HUMINT 的扩展,其中来源通常在特定情况下放置在特定的时间范围内。共享 HUMINT 是经常从其他组织按需或出于共同目的收到的共同情报。 HUMINT 的模式有书面、口头和编码格式的数据。这种结构化、半结构化甚至非结构化数据可以通过数据挖掘、NLP 和文本分析方法进行分析。非结构化信息管理架构 (UIMA) 可用于第 2 层,以处理半结构化和非结构化数据并创建通用结构化数据库。
在第 2 层中,将协同进行数据存储、数据处理、数据流、数据处理硬件。来自各种来源的数据可以存储在分散的服务器中,该服务器可以将数据传输到中央数据库。按需数据也可以通过军用云网络进行提取。数据处理可以通过 ML 算法进行。对于结构化数据,监督学习系统可以在有限的自主性下使用。对于图像和语音数据,可以使用强化学习,使其可以从环境中学习,并可以继承具有情境经验的自适应配置。 NLP 可以应用于各种语音识别、语音解释和语音定向。数据存储可以通过大数据框架内的神经网络来实现。数据流可以通过安全的光纤网络进行。此外,机械采集源可以通过物联网互连,从而可以即时和集中地执行数据流和设备控制。
图5:第2层(存储和处理)
基于机器学习的情报数据处理
通过各种收集源获得的数据将形成大数据。不断变化的数据结构需要基于ML的数据处理算法,这是一个不断发展的研究领域。 ML算法对数据的处理是通过数据选择(结构化、半结构化和非结构化)、数据处理、数据转换、数据输出和最终数据存储来进行的。在不断发展的数据科学领域,有多种 ML 算法方法。其中,回归、分类、时间序列分析、主题建模、聚类分析、协同过滤、关联规则和降维很流行,并在军事和商业中得到广泛应用(Bhatnagar,2018)。在使用 ML 算法进行数据处理时,可以采用三种学习类型的 ML 技术。被广泛使用的 ML 的三个子领域是监督学习、强化学习和自动/无监督学习。在 ML 的这些子领域中,监督学习(神经网络、贝叶斯网络、朴素贝叶斯、支持向量机和马尔可夫模型算法)用于对数据处理任务进行分类和估计。强化学习(Q-Learning、R-learning、TD 学习和 Sarsa 学习算法)用于从情报数据集中开发决策任务。无监督学习(k 均值、高斯模型、X 均值和 Dirichlet 过程模型算法)的主要功能是通过对形势趋势分析来产生数据聚类,以做出未来的预测事件(Bhatnagar,2018)。处理和分析各种来源生成的情报数据需要使用大数据框架。在众多大数据处理框架中,Hadoop 框架最适合 MI 分析(Chowdhury,n.d.)。
第 3 层通过融合各种数据集发挥作用,从而可以开发人格剖析模型、决策模型、动态情境模型和综合预警 (EW) 系统。结合HUMINT,收集、协作和融合个人在社交网络(OSN)和其他网站中的互动,创建军事和非军事感兴趣者的内部动态人格档案。这类人员的选择范围可能包括敌人的军事和非军事领导层以及非传统威胁集团的嫌疑行为者。根据 (Souri, et al., 2018),艾森克三因素模型(精神病、外向、神经质 (PEN) 模型)、大五模型和另类五模型被广泛用于描述人格概况。为此,可使用朴素贝叶斯、决策树、神经网络和支持向量机等 ML 算法来分析在线数据集。
基于强化学习,可以实现定期更新和重构的人格轮廓。根据一个人在不同情况下的各种行为反应所形成的一系列人格特征,编制了人格模型。这种个性模型将被广泛用于开发大量决策模型,这些模型将成为战略和作战领导力的重要成分。类似地,基于某种情况下的各种活动,可以将活动元素的组合以随机方式融合在一起,以预测即将到来的情况。因此,情景元素的融合将利用机器学习的自适应学习方法构建动态情景模型。所有这些模型将有助于创建关于相关人员和任何情况的综合电子战,特别是高级领导和一般部队。
图6:第3层(融合和分析)
MI 数据融合的特点
• 数据融合是机器学习将所有类型的数据处理成可用的格式,并为当前和未来情况准备统一图景的方法。 ML一般通过数据的不不完整、数据的关联、数据的不一致性和数据的分散性来进行这种数据融合。数据融合是处理多源数据和信息的集自动检测、因果、关联、估计和组合的多层次、多方面的过程(F.E.White,1991)。它是信息从不同来源和不同时空点转换的过程。该过程提高了检测能力和可靠性,减少了数据模糊性,并扩展了从国家边界到兴趣点区域的空间和时间覆盖范围。JDL模型是军事领域中最常见、最流行的融合模型之一,它基于输入的结构数据,通过对象、影响、情境和过程细化四个不断增加的抽象层次产生输出。 JDL 模型主要侧重于输入输出数据,而不是处理。相反,Dasarthy 的框架允许输入/输出数据流和功能处理(Dasarthy,1994)。基于全球、区域和国家层面事件的不确定性,MI 通常需要适应随机数据集。根据这些随机数据集构建大量决策模型将很有用。在这方面,Goodman (Goodman, 1997) 随机集就是一个非常有用的过程,它具有结合决策不确定性以及呈现不确定性选项的一般模式能力。
• 用于 MI 数据转换的数据融合技术必须经过鲁棒的自适应编程框架,以解决数据类型的不完善、数据类型的多样性、传感器技术的多样性以及操作环境的性质和类型。
• 数据融合算法需要能够承受智能体和传感器从现场收集的不完美、不精确的数据类型。它还应该能够导出冗余数据,从而减少测量中的噪声。
• 数据融合系统应该能够避免反直觉的结果,并且能够以适当的注意力处理高度冲突的数据,从而消除决策错误的增加。
• 数据融合方案应该能够同时处理同质和异构数据,如音频、视频、无线电信号和其他形式的信号源。
• 数据融合系统需要通过传感器注册来克服由单个传感器模式引起的校准误差。该处理可以集中式和分布式两种方式完成。分布式融合过程在必须建立无线传感器网络的偏远地区非常有用。
• 数据融合方法应针对多个时间尺度,以处理传感器接收和发送数据的多个时间尺度变化。由于数据流通过的路由是可变的,因此可能存在数据乱序到达的可能性。为了解决这种性能变化的潜在缺陷,融合中心应该具有分布式融合设置。
• 融合过程必须通过强化学习方法进行操作,以便能够快速适应变化并相应更新。
数据融合方法
实时数据融合系统将面临许多挑战,因为该方法仍在探索中。主要挑战来自非结构化、不完整和不精确的数据。很明显,MI 数据永远不会具有完整的结构化格式,因为预测的来源包括人类传感器、无人机、卫星和其他虚拟和在线平台。 Khaleghi (Khaleghi, et al., 2011) 描述了数据融合系统中的几个与数据相关的挑战。数据融合方法的分类如图 7 所示
图7:数据融合方法的分类(Khaleghi等,2011)
无论数据结构如何,ML都可以使用数据融合算法,在多个数据模型中创建数据结构,以满足MI的各种需求。其中,数据不完备性是数据融合系统面临的最基本的挑战,主要表现为不确定性、模糊性、不完全性和粒度性。有许多建议的不完善的数据融合框架来解决这些限制。流行的数据融合框架是概率、证据、模糊推理、可能性、粗糙集理论、混合和随机集理论融合。该框架具有处理数据不确定性、模糊数据融合、模糊数据处理、不完整数据处理和不完整数据融合的能力。
第 4 层是数据共享平台,将与内部和外部利益相关者共享完整的态势模型和集成电子战信息。这个集中的数据共享平台将连接到所有编队指挥部,使态势感知可以即时到达。这些可以通过具有单独通信集线器的光纤网络连接到其他组织和利益相关者。
图8: 第4层(数据共享)
军事云计算在MI融合中的应用
军事云计算(MCC)可以为通用情报数据和资源提供方便的按需共享网络访问。 MCC 至关重要的可访问性功能使其可靠、耐用且安全,具有军事级别的网络攻击保护。它将为所有情报大数据和其他资源提供一个动态的资源池和存储设施,以便任何情报人员可以在世界任何地方随时访问它,同时可以在任何地方、时间上传各种数据。这样,MI 资源可以 24 小时共享和访问。 MCC 可以在 4 层单独的分散功能中构建。 Cheng & Liao (Cheng & Liao, 2011) 将它们命名为资源层、面向服务的架构层、面向服务的工具层和云计算应用层。资源层将保存所有的物理资源和逻辑资源。物理资源包括存储配件、网络设备、物理数据库配件、服务器等。逻辑资源包括应用软件和其他相关软件。面向服务的架构层执行情报服务、通用服务和专业服务的资源共享。面向服务的工具层提供用户接口和访问接口,进行仿真建模和调试加密数据。
用于情报数据传输的军事物联网
军事物联网 (MIoT) 将是一个新兴且必不可少的系统,用于连接同一军用级网络下的所有设备、传感器、无人机、卫星和其他采集设备。它将人和机器互连在一起,促进人机协作。 MIoT将由除了采集设备之外的所有军事平台组成,因此也可以传递执行部署指令。这不仅允许信息不断地流入中央数据库,而且还将流出的信息传播给最终用户。
基于上述关于将机器学习纳入 MI 过程的各种因素讨论,提出以下建议:
• 除了传统的 MI 收集源之外,还可以在感兴趣的领域中加入基于机器学习的收集源。
• 可引入数据融合中心,对各类数据进行组合融合,形成统一的情报图。
• 可以与工程机构、政府机构和相关行业合作启动研发,以帮助推动机器学习算法和配套硬件的自主创新和开发。
• 可规划ML算法开发时间线及相关MI应用平台,将MI过程向人机协作转变。
• 可以在 MI 框架内引入情报层级框架,以便协同实现自动化。
• 必须通过充分更新的防火墙系统确保每一层来源的信息安全。
• 在 MI 流程的每一层都需要确保备份数据存储。
机器学习是人工智能的一个子集,已被发达国家和发展中国家的军队广泛用于各种军事应用和作战平台。为支持这一趋势,发达国家通过机器学习重新定位其情报收集和分析过程,以更深入地了解情况并从各个角度进行分析。军事ISR的框架包括空间数据库、属性数据库、案例库、规则库和知识库,这些过程相互交织。在机器学习应用的情报分析框架中,可以通过自动化以最小的错误概率要求人机协作,来加速持续的协调、修订、更新和执行。地理信息系统(GIS)和基于知识的决策支持系统(KBDSS)被用于整合决策支持和知识管理,以增强显性和隐性知识库这两种形式的情报知识方法。结合智能作战支持系统(IOSS)结构,通过混合推理策略完成丰富的知识表示,证明了其在决策系统中的适用性。 MI的层次结构和配置大致分为三个层次;第一级由作战和战术情报收集组织和单位组成,第二级对收集组织和单位提供的数据和信息进行不同的情报分析,第三级是用户组织,上级总部和高层领导经常对情报提出要求。第一级和第二级的数据收集和分析步骤可以通过结合基于人工智能的功能系统来实现自动化。
ML 在 MI 中的全球军事应用的最新发展范围,包括多域指挥和控制系统 (MDC2)、边境监视系统 (BSS)、声学探测器、视频监视、基于深度学习的行为识别,及通过语义世界建模进行信息提取。这些系统或技术通过使用监督、强化和深度学习方法,来分析来自人力情报 (HUMINT)、图像情报 (IMINT)、开源情报 (OMINT)、虚拟源情报 (VIRINT) 和许多其他来源的信息。用于 MI 分析的 ML 算法模型已经开发出来,该领域的一些重要成就是主动学习支持向量机 (ALVSM)、基于智能体的智能系统建模、环境智能 (AmI)、面部表情识别系统 (FERS)、数据挖掘和数据仓库、带有传感器的地理信息系统 (GIS) 和基于传感器的认知平台。
MI 的收集、处理和分析 (CPA) 阶段至关重要,需要从技术方面予以重视,因为操纵和处理庞大的数据量已经超过了人类的能力。数据来源的类型包括传感器、航空系统、卫星、无线电信号、开源互联网、社交网络、不同的组织、代理、对手等等。在非战时时期,非传统安全 (NTS) 威胁在过去十年中一直居高不下,并已成为新的安全问题。在战时,在活跃的战场情景下,持续的侦察和监视是任何作战活动必不可少的组成部分。在战场环境中,这些来自各种来源的数据被添加到以前的数字数据库中,从而产生大量数据流。 ML 系统可以轻松筛选数十亿字节的数据,并捕获所需的数据类型,为 MI 创建有意义的信息。当机器学习应用于数据收集时,系统通过正确识别、定位、分析、清理和存储来准备数据。有各种 ML 方法利用复杂算法和预测建模来进行数据分析以预测未来的结果。监督学习适用于训练和测试数据集,其中训练数据集可用于 MI 智能体训练 ML 系统。无监督学习用于查找数据集中的数据结构模式。强化学习使用复杂的算法从其经验中学习并重新设计其程序以分析预测情况。深度学习通过人工神经网络发挥作用,其中数据保存在多个层级中,以便通过可变数据接口层使用。在 MI 的自动化中,发现 AI的应用在 MI 过程的处理和分析阶段带来了最大影响。因此,机器学习的内在价值将为 MI 组织促进和利用“自动化红利”,以便人类可以将节省的时间用于其他高优先级任务。
非战时监视是 MI 部门的主要职能之一。除了手动和人工收集信息外,传感器、无人机和 EOS 还可以在收集大量数据和信息方面发挥重要作用。智能安防传感器可以通过物联网互联,可以形成跨越国界的大型监控网络系统。监视无人机 (UAV) 是通过移动目标检测和跟踪 (MODAT) 框架收集无法访问和易受攻击的地形图像和视频数据的基本系统之一。地球观测卫星 (EOS) 是一种覆盖广泛地形的宝贵情报收集系统,因此可以作为任何军队的战略资产设施。通过监督算法建模框架来强化人工智能学习,可以从电子和虚拟资源中提取所需信息。 ML算法对数据的处理是通过数据选择(结构化、半结构化和非结构化)、数据处理、数据转换、数据输出和最终数据存储来进行的。用于情报数据处理的 Hadoop 框架作为大数据框架执行,用于处理和分析从各种来源生成的情报数据。数据融合是 ML 将所有类型的数据处理成可用的格式并准备好当前和未来情况的统一图景的方法。 ML一般通过数据的不完善、数据的关联、数据的不一致性和数据的分散性来进行数据融合。在各种融合系统中,Joint Director of Laboratories (JDL) 模型、Dasarthy 框架和 Goodman 随机集执行各种数据融合、特征融合、决策融合和信息融合。流行的数据融合方法涵盖了概率、证据、模糊推理、可能性、粗糙集理论、混合和随机集等多种理论。数据合成是情报数据分析的一个重要步骤,它可以将来自各种收集源的所有不同元素组合在一起,以开发单个事件和情况的情报摘要。军事云计算(MCC)的动态资源池和所有情报大数据及其他资源的存储设施,可以为通用情报数据和资源提供便捷的按需共享网络访问,让任何情报人员可以在世界任何地方的任何时间访问它,同时可以在任何时间上传各种数据。
数据收集、数据存储和处理、数据融合和分析以及最后的数据共享四个层次的功能,可以通过监督和强化学习方法开发。这将允许全方位扩展 MI 的范围,并且可以监视感兴趣的物理和虚拟区域。因此,ML 的应用将促进 MI 收集和分析过程的自动化,以便可以查看自己兴趣点的所有情况,并且战略、作战和战术领导者清楚接下来会发生什么。
Nizam Uddin Ahmed 中校, 在孟加拉国国防学院担任高级研究员。他对国防技术发展有着广泛的兴趣。他在 Springers、Mirpur Papers 和 NDC 期刊上发表了多篇论文。目前,他正在研究将人工智能纳入武装部队的可行性,并开发各种深度学习模型。