单兵装备人机工效知识图谱构建技术

为改善单兵装备人机工效领域知识共享困难、利用效率低的现状，提出基于“一致性检验”与“语料评价”的骨架法应用策略。构建单兵装备人机工效领域知识本体，对本体网络进行质量评估与优化；搭建基于“半指针-半标注”抽取思路的联合抽取模型，进行领域知识文本中重叠三元组的自动化信息抽取，F1-score 达到0.82；基于Neo4j 构建单兵装备人机工效知识图谱，对图谱的应用方式进行讨论。结果表明：以主客观评价结合的骨架法应用策略能够提高知识本体构建效率，达到较好的语料数据覆盖效果；单兵装备人机工效知识图谱能为领域知识的共享与重用提供数据支撑与技术手段。

为应对复杂多变的战场环境，满足信息化战场的作战需求，以士兵为平台的“单兵系统”包含了多种武器装备，单兵系统总体及单体装备的人机工效越来越为人们重视。国内外学者对单兵装备人机性开展了大量研究，领域知识涉及装备学、军需技术、工程设计、人机工程学、服装工程学、医学及数值仿真分析等多个学科。由于单兵装备种类众多，其人机工效概念类型繁多，且联接关系复杂；目前还未形成完整的知识体系，知识散落于国军标、学术论文、研究报告以及著作中，导致领域知识共享困难，资源利用效率较低。为增强单兵装备人机工效领域内知识的共享能力，提高知识资源的利用效率，有必要对单兵装备人机工效领域内的知识共享方式与需求进行分析，建立单兵装备人机工效设计知识本体，采用深度学习方法对领域知识来源进行联合信息抽取，构建单兵装备人机工效知识图谱。为在数据层面解决知识共享困难的问题，2012 年谷歌提出了一种用于提高信息检索效率的形式化语义知识描述框架，即知识图谱[1]。知识图谱是事物关系的可计算模型，能从数据中识别、发现和推断事物与概念之间的复杂关系。其相关技术主要包含知识图谱构建与图谱应用 2 大方面，其中前者的主要研究内容包括本体构建与知识抽取 2 方面。目前知识本体构建方法按数据流向主要分为自顶而下、自底而上以及综合法(自顶向下与自底向上相结合)等 3 类。早期本体构建的方法以人工方式的 “自顶而下”方式为主[1]，其中七步法由于通用性强、技术成熟等优点，在领域知识建模中得到了广泛应用[2]。随着机器学习技术的发展，出现了基于统计或基于语义 2 种手段的自动化本体构建方法，即通过基于统计或基于语义 2 种手段，实现了基于数据集“自底而上”地自动化本体构建，但目前自动化本体构建仍面临更新困难、关系消歧和本体消歧等技术难题[3]，难以在工程实际中应用。知识抽取是构建大规模知识图谱的重要环节。三元组抽取模型最初采用 pipeline 式抽取方法[4-8]，其串联式的子任务分配导致抽取模型存在误差累计传播的缺陷。因此有学者提出“实体-关系联合学习” 的抽取概念，包括基于特征(规则)的抽取模型[9-12] 以及基于神经网络的模型[13-17]。但上述模型难以胜任存在三元组重合现象等语义复杂度较高的抽取任务。Zeng 等[16]提出了“三元组”数据的 3 种重叠模式，并将其引入含有复制机制的 seq2seq 模型中； Fu 等[17]提出了一种基于图卷积网络的解决方法。但这 2 种方法仍将实体关系作为离散标签进行处理，忽略了三元组内部的依赖关系，导致模型学习困难。因此，将三元组作为整体进行建模[15]成为解决复杂语义关系抽取中模型设计的可行思路，如 Wei 等[18] 提出了一种针对复杂语义的抽取方法。笔者引入基于语料数据的本体质量评价及迭代优化框架，采用骨架法应用策略建立本体网络，结合领域语料数据，构建了单兵装备人机工效领域本体，在保证本体任务明确的前提下实现了本体对语料数据较高的数据覆盖率；针对单兵装备人机工效知识片段存在的三元组重合现象，搭建了基于“半指针-半标注”抽取思路的联合抽取模型，实现了领域知识文本中重叠三元组的自动化信息抽取。为单兵装备人机工效领域知识的共享与重用提供了理论与数据基础，有助于单兵装备人机工效设计与评估工作的有效开展。