为改善单兵装备人机工效领域知识共享困难、利用效率低的现状,提出基于“一致性检验”与“语料评 价”的骨架法应用策略。构建单兵装备人机工效领域知识本体,对本体网络进行质量评估与优化;搭建基于“半指 针-半标注”抽取思路的联合抽取模型,进行领域知识文本中重叠三元组的自动化信息抽取,F1-score 达到0.82;基 于Neo4j 构建单兵装备人机工效知识图谱,对图谱的应用方式进行讨论。结果表明:以主客观评价结合的骨架法应 用策略能够提高知识本体构建效率,达到较好的语料数据覆盖效果;单兵装备人机工效知识图谱能为领域知识的共 享与重用提供数据支撑与技术手段。
为应对复杂多变的战场环境,满足信息化战场 的作战需求,以士兵为平台的“单兵系统”包含了 多种武器装备,单兵系统总体及单体装备的人机工 效越来越为人们重视。国内外学者对单兵装备人机 性开展了大量研究,领域知识涉及装备学、军需技 术、工程设计、人机工程学、服装工程学、医学及 数值仿真分析等多个学科。由于单兵装备种类众 多,其人机工效概念类型繁多,且联接关系复杂; 目前还未形成完整的知识体系,知识散落于国军 标、学术论文、研究报告以及著作中,导致领域知 识共享困难,资源利用效率较低。为增强单兵装备 人机工效领域内知识的共享能力,提高知识资源的 利用效率,有必要对单兵装备人机工效领域内的知 识共享方式与需求进行分析,建立单兵装备人机工 效设计知识本体,采用深度学习方法对领域知识来 源进行联合信息抽取,构建单兵装备人机工效知识 图谱。 为在数据层面解决知识共享困难的问题,2012 年谷歌提出了一种用于提高信息检索效率的形式化 语义知识描述框架,即知识图谱[1]。知识图谱是事 物关系的可计算模型,能从数据中识别、发现和推 断事物与概念之间的复杂关系。其相关技术主要包 含知识图谱构建与图谱应用 2 大方面,其中前者的 主要研究内容包括本体构建与知识抽取 2 方面。 目前知识本体构建方法按数据流向主要分为自 顶而下、自底而上以及综合法(自顶向下与自底向上 相结合)等 3 类。早期本体构建的方法以人工方式的 “自顶而下”方式为主[1],其中七步法由于通用性强、技术成熟等优点,在领域知识建模中得到了广 泛应用[2]。随着机器学习技术的发展,出现了基于 统计或基于语义 2 种手段的自动化本体构建方法, 即通过基于统计或基于语义 2 种手段,实现了基于 数据集“自底而上”地自动化本体构建,但目前自 动化本体构建仍面临更新困难、关系消歧和本体消 歧等技术难题[3],难以在工程实际中应用。 知识抽取是构建大规模知识图谱的重要环节。 三元组抽取模型最初采用 pipeline 式抽取方法[4-8], 其串联式的子任务分配导致抽取模型存在误差累计 传播的缺陷。因此有学者提出“实体-关系联合学习” 的抽取概念,包括基于特征(规则)的抽取模型[9-12] 以及基于神经网络的模型[13-17]。但上述模型难以胜 任存在三元组重合现象等语义复杂度较高的抽取任 务。Zeng 等[16]提出了“三元组”数据的 3 种重叠模 式,并将其引入含有复制机制的 seq2seq 模型中; Fu 等[17]提出了一种基于图卷积网络的解决方法。但 这 2 种方法仍将实体关系作为离散标签进行处理, 忽略了三元组内部的依赖关系,导致模型学习困难。 因此,将三元组作为整体进行建模[15]成为解决复杂 语义关系抽取中模型设计的可行思路,如 Wei 等[18] 提出了一种针对复杂语义的抽取方法。 笔者引入基于语料数据的本体质量评价及迭代 优化框架,采用骨架法应用策略建立本体网络,结 合领域语料数据,构建了单兵装备人机工效领域本 体,在保证本体任务明确的前提下实现了本体对语 料数据较高的数据覆盖率;针对单兵装备人机工效 知识片段存在的三元组重合现象,搭建了基于“半 指针-半标注”抽取思路的联合抽取模型,实现了领 域知识文本中重叠三元组的自动化信息抽取。为单 兵装备人机工效领域知识的共享与重用提供了理论 与数据基础,有助于单兵装备人机工效设计与评估 工作的有效开展。