摘要

当今日益不稳定的地缘政治环境为暴力组织的发展提供了机会--无论是恐怖分子、犯罪分子、叛乱分子还是好战分子。因此，对北约及其国家来说，监测和了解潜在的威胁性组织是非常重要的，因为它们在不断发展。同时，数字化导致了开源信息量的爆炸性增长，带来了分析机会，但也带来了信息过载的挑战，而人工智能（AI）的发展为应对这一挑战提供了新的技术。在本文中，我们以组织理论和人工智能的知识为基础，提出了一个从大量开放源中自动提取威胁性组织信息的方法的第一步。具体来说，我们使用一个现有的暴力组织数据库作为起点，并结合三种不同的人工智能方法来提取几个特定的组织特征。(1) 监督机器学习（ML）用于提取活动类型和目标类型；(2) 无监督ML用于提取意识形态；以及(3) 自然语言处理（NLP）用于提取组织规模、领导人数量以及攻击中的死伤人数。我们评估了这些方法的性能，并对它们的普遍性进行了思考。通过这样做，我们向自动监测威胁性组织及其演变过程中的定义特征的工具迈出了一步。我们讨论了未来的步骤，例如实施模型来"填补"缺失或不完整的信息，以及在新的威胁性组织出现时自动检测它们。

引言

今天的威胁环境是由一系列复杂和不断演变的暴力组织组成的--无论是恐怖分子、犯罪分子、叛乱分子还是好战分子。北约及其国家需要监测和了解这些组织，以确保其社会的安全和保障。有几个因素使这些努力变得复杂。首先，冲突的混合性质越来越强，这意味着经常作为国家行为者代理人的组织不断出现、演变和消失，有时速度很快（Treverton, 2014）。这些组织在公开军事对抗的门槛下运作，往往是隐蔽的，跨越地理边界或在网络空间，这使得将活动归于这些组织成为一种挑战（Cullen，2018；NATO，2019）。复苏的大国竞争促成了不稳定的地缘政治环境，而COVID-19大流行病等全球危机和气候变化带来的日益明显的压力只会使这种环境更加复杂（Bekkers, Meessen & Lassche, 2018）。同时，数字化产生了超负荷的潜在相关信息，以了解暴力组织。因此，北约及其国家为了解不断变化的威胁所做的努力面临着足够的挑战。

需要创新的方法来克服这些挑战，并提高我们了解暴力组织的能力，因为它们在不断发展。任何建议的方法都需要能够处理可以从公开来源收集到的见解，并处理相关的信息过载问题。传统的情报方法是人力密集型的，而且不适合复杂和不断变化的行动环境和其中的对手（Eisler，2012）。为了支持分析员改善指挥官的情报状况，我们探索自动方法来提取、更新和构建传入的开放源信息。

任何新的方法都应该认识到，关于暴力组织的大量（历史）知识已经存在，包括在公开的知识库中（例如，NCTV, 2021; Stanford CISAC, 2021）。这些资源的价值不仅在于其信息价值，而且还在于信息的结构是有意义的，是基于为其做出贡献的分析人员的定性专业知识。例如，这些知识库的结构与暴力组织的重要特征相对应，如其运作方式、规模、意识形态、结构等。(van der Vecht & Keijser, 2018)。这种现有的结构化知识在指导分析和监测大量传入的非结构化且通常不完整的信息方面可能非常有用。方法上的挑战在于将这种现有的结构化知识与传入的信息相结合。换句话说：将分析师驱动的见解与数据驱动的见解相融合，以提高对暴力组织的情况了解。

在本文中，我们旨在解决这一挑战，同时借鉴现有的工作，将数据驱动（数据科学和人工智能）和分析师驱动（定性、理论驱动）的见解结合起来（Pherson & Pherson, 2020；Westerveld, Powell & Eles, 2020）。其结果是图示的方法，它使用了人工智能（AI）技术的组合，从公开来源中提取关于暴力组织在一段时间内的定义性特征的信息。通过这样做，我们希望支持分析师处理信息过载的问题，并向为国防从业人员提供决策支持工具迈出一步，以了解不断变化的威胁。具体来说，我们以组织理论、情报分析和人工智能方面的文献为基础并加以扩展，以解决以下研究问题：