毋庸置疑,人工智能(AI)在军事情报方面的潜在优势是巨大的。然而,人工智能如何才能准确地加强对军事数据的分析,这一点仍不确定。本研究旨在解决这一问题。为此,与新创公司 Aleph Alpha 合作开发了人工智能演示器 deepCOM。
人工智能功能包括文本搜索、自动文本摘要和命名实体识别(NER)。对这些功能在军事分析中的附加值进行了评估。结果表明,在时间压力下,使用人工智能功能的评估结果明显优于对照组。然而,尽管实验组的分析结果明显优于对照组,但他们对自己分析结果准确性的信心却没有增加。最后,本文指出了在军事情报中使用人工智能的局限性,尤其是在分析模棱两可和相互矛盾的信息时。
图 3:上图: NER 可自动从文本中提取时间、地点、组织和人名。中图: 文本中识别实体的颜色编码。下图: 在地图上显示识别出的地点。
当今可观察到的数据量之大,使军事情报显然需要使用人工智能(AI)[10]。然而,使用人工智能的好处以及在军事分析过程中的哪个环节使用人工智能仍是一个悬而未决的问题[26]。军事情报的主要作用是收集和分析信息,为军事领导人做出明智决策提供支持。从学术角度看,军事情报是一个跨学科的研究领域,涉及政治学、经济学、社会学和心理学等多个学科[1]。
因此,军事情报涉及信息的收集和分析,以提供对局势的全面了解。这可能需要收集有关武装部队的数据,研究其他国家的计划和行动,以及收集有关影响国家安全的事态发展的信息[25]。
可以肯定的是,在分析国外与军事相关的事态发展时,必须确保使用创新的方式方法,如人工智能(AI)。人工智能的新发展及其与分析和研究软件的整合为提高分析人员的判断能力提供了广泛的支持选项[5]。
预计人工智能技术的使用将减轻分析人员的负担,使他们能够专注于分析、评估和展示军事情报形势的核心内容[12]。
需要强调的是,分析人员不应被人工智能系统取代,而应得到辅助。特别是,必须确保分析人员始终能够理解他们进行评估所依据的信息[2]。
作为这项研究的一部分,初创公司 Aleph Alpha 开发了一款专有的人工智能演示程序。这个名为 deepCOM 的程序的功能基于大型语言模型 (LLM)。需要强调的是,deepCOM 并不是一个工作产品,而是一个演示程序。deepCOM 的核心功能是语义搜索。用户可以直接提问,系统会给出答案,并标明使用的资料来源。此外,deepCOM 还能自动总结数据库中的每份报告,使分析人员能够从几句话的总结中识别相关来源。
系统中还采用了命名实体识别(NER)技术,对所有报告进行全自动标注:如果文本中出现时间、地点、组织和人物,则会从提及的时间、地点、组织和人物中提取标签,用户在识别相关来源和阅读时都会突出显示这些标签[8]。
本研究的目标是展示在军事分析过程中使用人工智能的附加值。以往的研究主要关注人工智能在数据收集中的应用[13],而本研究则侧重于人工智能为人类分析和评估提供的支持。如果新技术不能为分析人员及其分析绩效带来直接的附加值,那么为使用新技术而使用新技术是不可取的。
仅从概念上考虑不足以评估价值。为了能够做出经验验证,本研究进行了一次实验。据我们所知,这是第一项对人工智能在智能方面的附加值进行实证分析的研究。
本研究将采用以下方法来解决这一问题。第 2 节概述了基于情报周期的军事分析流程。然后,第 3 节介绍了所研究的人工智能功能及其如何为军事分析人员提供支持。第 4 节解释了实验设计,第 5 节介绍了实验结果。第 6 节讨论了实验结果。最后,第 7 节是结束语。
deepCOM 演示程序是一款集成了人工智能功能的分析工具,旨在为军事分析人员的工作提供支持。下文介绍了实验分析的人工智能功能。在 deepCOM 中测试的三项人工智能功能中,有两项是基于大型语言模型(LLM)的,即人工智能搜索和自动摘要。测试的第三个人工智能功能是命名实体识别。尽管由于北约、联合国和欧盟等国际结构的原因,德国的情报界使用英语工作,但其自身的产品却是用德语创建的。因此,deepCOM 的用户界面和输出均为德语。