今日荐文
今日荐文的作者为中国电子科学研究院,综合电子信息系统研究所专家周丽娜,马志强。本篇节选自论文《基于知识图谱的网络信息体系智能参考架构设计》,发表于《中国电子科学研究院学报》第13卷第4期。
摘 要:为支撑未来战争的智能化作战能力,网络信息体系需要在人工智能领域进行深入的研究和探索。鉴于知识图谱在知识组织和高效利用的优势,本文以知识图谱为切入点,研究网络信息体系知识本体的构建方法,以知识的运用为核心设计网络信息体系的数据、业务、系统、技术架构等4个核心参考架构,并对知识图谱在军事中的应用进行初步的分析和探讨。
一、发展背景
云计算、大数据技术以及移动网络的快速发展开启了一个大规模生产、分析和应用数据的时代。数据源中的数据之所以有用,是因为它们建立了现实世界及其主题的部分模型。随着数据量的暴涨,利用大数据量来智能决策只是应用的一个方面,知识图谱和机器学习等技术正全面推进人工智能技术的快速发展。
自达特茅斯AI夏季研讨会开始,人工智能研究经历了3次技术浪潮。第一次浪潮专注于人类知识,始于上世纪80年代,专注于知识库和专家库系统的构建。1977年,美国斯坦福大学计算机科学家费根鲍姆(E.A.Feigenballm)在第五届国际人工智能联合会议上提出知识工程的概念,认为“知识工程是人工智能的原理和方法,对哪些需要专家知识才能决绝的应用难题提供求解的手段恰当运用专家知识的获取、表达和推理过程的构成与解释,是设计基于知识的系统的重要技术问题”。在知识工程推动下,涌现出了一批成功的专家系统,如医药专家系统MYCIN,探矿专家系统PROSPECTOR等。我国分别在1977年、1985年建立了中医肝病诊治和砂姜黑小麦施肥专家咨询等实用的专家系统。
2000年以后,随着机器学习的兴起,利用数学模型和大数据量的训练求解非确定的解的问题开启了第二次人工智能的浪潮。例如IBM的深蓝系统、谷歌的ALPHAGO系统等。这种人工智能只能解决可建模、可学习的问题,在有限的目标中求解,得到的是可接受的解但不保证是最优解。
利用云计算、大数据等数据处理技术海量数据信息中知识的提取和建模,推动了通用智能的进步,迎来人工智能“第三次浪潮”。谷歌最早提出了知识图谱的项目建立语义搜索来提高搜索的精度并提供更智能化的知识浏览。国内的百度、搜狗等搜索类互联网公司也在开展知识图谱方面的研究。近年来,知识图谱又被应用于聊天机器人和问答系统中,用于辅助深度理解人类的语言和支持推理,并提升人机问答的用户体验等,如IBM的Watson,苹果的Siri,Google Allo,Amazon Echo,百度度秘,公子小白等。同时,知识图谱在金融、农业、电商、医疗健康、环境保护等大量的垂直领域得到广泛的应用。例如,很多金融领域公司构建了金融知识库结合金融专家辅助进行风险控制管理、欺诈识别等;生物医疗专家通过集成和分析大规模的生物医学知识图谱,辅助其进行药物发现、潜在靶点识别等多方面任务。
网络信息体系是我军新时期面向未来的作战体系,其设计思想已从基于威胁向基于能力转变,在军事上如何借助技术的发展在人工智能发展的浪潮中,立于不败之地,如何建立以知识为核心的网络信息体系形成智能化作战能力,需要深入的研究和探讨。
本文首先讨论了知识图谱与人工智能的关系,给出军事知识图谱的分类和构建方法,然后围绕知识的运用构建网络信息体系的参考架构,最后对知识图谱在军事中的应用进行了初步的探讨和展望。
二、知识图谱与人工智能
人工智能是什么,为避免以人类为中心的偏见,麻省理工学院物理学家麦克斯•泰格马克在《生命3.0,人工智能时代的人类》中,定义智能为完成复杂目标的能力。
人工智能的发展可以划分为三个阶段,弱人工智能阶段、强人工智能阶段、超人工智能阶段。弱人工智能是指实现一组有限的目标的能力,例如具有规则限定的棋类游戏以及汽车驾驶;强人工智能又称通用智能,是指有能力达成几乎任何目标,包括学习;超人工智能是指远超人类水平的通用智能。当前发展最为迅速的是以机器学习为典型代表的弱人工智能。
弱人工智能仅能解决可建立有边界的数学模型并接受非最优解的有限状态空间问题,通常具有弱对抗、回合制、信息完全、边界确定的特点。然而在军事领域中,需要面对的问题往往是强对抗、快实时、信息不完全、边界不确定的无限状态空间的战略决策和规划,需要对行为表示、事件推演、案例规划进行深入研究,对行为、事件、案例以及其内部关系建立利于分析的统一的表示和存储,知识图谱作为对事物和关系的最有效表达应运而生。
图是对关系的最好表达,基于图的知识表示和存储能够更有序、有机的组织知识,在解决知识查询的精度以及可扩展性方面展现出了巨大的优势,利用概念、实体的匹配度,结合用户的使用情境,以一种智能、高效的方式不仅限于返回关键字的匹配结果,而是与用户与搜索相关的更全面的知识体系,从而为用户提供快速、准确的知识信息。从规模和范围来说,网络信息体系知识图谱是面向全部军事相关的人员、事物、活动的所有机构知识库的知识集合,包含历史发现和当前创造的所有知识。这种大型的知识图谱的创建、维护和使用是一个庞大的工程,本文仅从知识图谱的构建方式和使用的统一架构进行探讨,以期对我军知识的表示和使用及其领域的智能化发展提供参考和支撑。
三、知识图谱构建
知识图谱(Knowledge Graph/Vault)本质上是语义网络,是一种基于图的、由节点(Point)和边(Edge)组成的数据结构,即知识图谱是以符号形式描述物理世界中的概念及其相互关系的结构化的语义知识库。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱提供了从“关系”的角度去分析问题的能力。实体可以由若干个属性表示,通过实体的属性可以将不同的实体建立关联关系。
网络信息体系知识图谱的主要目的是支撑各类智能业务,需要覆盖各类军事活动、人员和作战任务。考虑到当前情报、人员、装备等业务数据库均已与按照业务系统要求设计,无法轻易改变,因此网络信息体系的知识图谱立足当前业务数据库构建,通过本体映射,利用机器学习的方法从已有的结构化、半结构化、非结构化数据库中抽取本体以及本体之间的关系,并进一步通过对本体知识库的元数据抽取形成本体元模型,如图1所示。业务数据、本体知识、本体元模型按抽象层级依次提升。在业务数据库,数据多为实体关系型,如情报人员张三,年龄23岁,军种为陆军。本体映射后,本体知识为情报人员本体,含年龄、军种等属性。元数据抽取后,本体元模型为人员本体,包含年龄、组织等属性,人员可以分为情报人员、指挥人员、保障人员等。
图1 网络信息体系知识图谱构建关系
图2 知识图谱构成图
网络信息体系的知识图谱的分类如图2所示。其中:本体元模型是哲学意义上的本体,是对世界上客观存在物的系统的描述。主要包括人员本体元模型、活动本体元模型、资源本体元模型、能力本体元模型等,以及这些本体元模型之间的关系。本体包含5个基本的建模元语:概念(concepts)、关系(relations)、函数(functions)、公理(axioms)和实例(instances)。
本体元模型反映了现实世界中相对稳定的概念及其关系和规则,结合爱丁堡大学开发的骨架法(Skeletal Methodology),网络信息体系的本体元模型构建过程如图3所示,根据本体元模型的规划,从本体知识库中进行概念及属性描述提取、概念间关系的确立以及相应的公理规则描述,并与本体知识库建立实例映射,保证本体元模型与本体知识的一致性。
图3 本体元模型库构建过程
本体知识库:本体知识库中的本体是共享概念模型的明确的形式化规范说明[6],是现实中的实体的抽象,为特定领域中的信息之间的关联性提供了一定程度的逻辑描述,使得特定领域中的信息资源能够在本体描述的框架上组织成一个有机的整体。网络信息体系本体知识库主要包括作战资源本体库、作战人员本体库、作战活动本体库、作战能力本体库。
本体知识库的构建是一个不断改进,不断完善的动态过程,可以通过结构化或半结构化的业务数据库进行抽取建立部分本体,通常来说,本体的构建包括实体映射、概念抽象、属性定义、实体关联、本体关系确立、本体校验、版本记录7个过程,如图2所示。
图4 本体知识库构建过程
业务数据库:业务数据库是现实中与业务活动切实相关的实体关系模型库,描述了现实中的实体与其他实体的关联和活动关系。在网络信息体系中,业务数据库包括资产数据库、人员数据库、装备数据库、战场环境数据库、力量编成数据库、后勤物资数据库、国防科技数据库、战略规划数据库、情报数据库、军事训练数据库、政治工作数据库等实体关系库。
从本质上来说,本体数据根据语义网的规范存储于知识库中,基于业务数据库中的实体和关系、本体知识库中的本体知识和关联关系以及知识元模型库中的现实世界抽象关系和规则,根据业务需要,抽取实体(本体)和关系,形成所需的知识图谱。
四、架构设计
围绕知识图谱的构建和知识的运用,以形成智能化的作战能力为目标,以“数据泛在、知识中心、内生智能”为特征,从数据架构、业务架构、系统架构、技术架构等4个核心视角开展网络信息体系架构设计。
(1)数据架构设计
按照本体元模型、本体知识和业务数据三层分类,构建网络信息体系数据架构。本体内部以及本体之间可能存在属性、组成、实例、类属、因果、对等、背景、层次等多类基本关系。本体知识库的概念与实体之间可能存在指挥控制、毁伤、编配、行动关联、评判等关系。如图5所示,按照知识图谱是设计规则,本体/实体与关系同时存储在数据库中,供各类服务调用和推理分析。
图5 知识图谱构成图
(2)业务架构
基于知识图谱的网络信息体系业务模型如图6所示,是以解决用户需求为目标,基于业务数据库、本体知识库、本体元模型库等,通过进行语义分析与知识情境的提取,获得用户的角色、目标、任务、知识需求等多方面语境信息,调用知识图谱生成服务,形成业务需求组织相关的业务实体、本体及其关系构建知识图谱,基于图谱进行知识检索、推理和业务规划,推送用户需求的结果。同时,对于频繁调用的实体关系进行抽象和评价,根据评价结果对知识本体库进行关系增加、修改或删除,实现对知识本体的更新。
图6 知识互联业务模型
知识情境是区分、识别不同知识活动,生成知识需求,决定与当前业务活动相关联的知识类别、范围和实例的重要因素。在复杂用户活动过程中,知识的应用和产生是在一定的业务过程发生的,知识的意义和价值只有在对应的情境下才能体现出来。
(3)系统架构
由基础资源层、先进计算与知识推理平台、知识开发与应用三层构成系统架构,如图7所示。基础资源层包括通信、计算存储资源、数据知识资源以及相关的安全、管理资源。先进计算与知识推理平台已知识图谱运行环境为中心,通过服务注册、资源管理、资源监控等服务,结合知识集成、知识图例、知识表示等知识服务为上层应用和开发提供支撑。
图7 系统架构
通过知识的共享和交换,可以提高工作协调性、缩短决策时间、增强部队适应能力、改进态势感知能力并提高任务规划和执行准确性,同时提高预见事情发生和资源需求的能力。
(4)技术架构
遵循“资源-服务-应用”的总体思路,基于知识图谱的网络信息体系下的技术参考模型包括知识图谱构建技术、知识服务技术、知识应用技术,在统一的体系架构标准、资源描述标准、服务协议规范、知识采集分类处理规范、交互和互操作接口标准下,构成完整的总体框架。
知识图谱构建技术知识提取、知识表示、知识存储等三类。知识提取包括实体映射、概念抽取、属性定义、实体关联等相关技术,支撑本体的构建;RDF/RDFS、OWL、XML、属性图等表示方法制成知识的建模和表达;知识图谱主要以图的形式存储于数据库中,典型的数据库包括Google的Freebase、微软的Satori、OrientDB以及PostgreSQL等。知识服务技术包括自然语言处理、机器学习等通用服务以及对启发式搜索、复杂管理查询、推理等知识专用服务。面向最终用户的知识应用包括知识查询、知识推理和规划验证三类。知识查询类应用以人物(Who)、时间(When)、地点(Where)、哪一个(Which)为主,知识推理类应用利用知识图谱中的关系解决如何(How)和为什么(Why)的问题,规划验证类应用以活动为中心,根据活动知识图谱,对任务进行分解规划制定包含时间、地点、人物、活动、目标的具体方案。
图8 技术架构
五、应用展望
美军早在第一次伊拉克战争时期就享受到人工智能对后勤保障方面的影响,据统计,他们在后勤保障方面省下的钱远超出了其前期投入。2015年10月,DARPA举行“未来技术论坛”对未来30年技术发展进行预测,对人工智能技术给予厚望。以实施“第三次抵消战略”为契机,美军启动“深绿(Deep Green)”计划以及Insight、XDATA、Big Mechanism、Deep Learning、DEFT、PPAML等基础智能技术研究项目,探索发展从文本、图像、声音、视频、传感器等不同类型多源数据中自主获取、处理信息、提取关键特征、挖掘关联关系的相关技术,加速人工智能技术在军事领域应用。
习近平总书记在十九大报告中指出,“要加快军事智能化发展,提供基于网络信息体系的联合作战能力、全域作战能力”。网络信息体系领域中,可以借助情报领域知识图谱,提高情报融合的准确性,结合历史情况,对形势和发展走向进行预测和判断;通过情报目标知识图谱,对比新目标,更快地确定目标的属性和关系进行目标识别,并给出最佳跟踪、对抗方式;利用筹划决策知识图谱分析解决战场空间规划的规模化计算问题,支撑快速、高效和精准的任务规划;以战场和保障知识图谱为主,辅以实时监测战场装备和力量变化,通过关联比对和分析,为行动控制和支援保障提供合适的解决方案。知识图谱作为后台智能服务的基础,在促进指挥员对战场态势的认知速度大幅度提高的同时,亦会催生更多的智能化武器和自主化无人平台,降低大型平台的操作复杂度,进一步提升武器装备的作战效果。
六、总结
智能作为未来作战的必备能力,网络信息体系需要在强人工智能领域进行深入的研究和探索,以便为各类作战应用提供基础理论和支撑。在知识的表达和利用方面,鉴于知识图谱在知识组织和利用的高效性,本文给出了网络信息体系知识图谱的分类和知识本体的构建方法,以知识的运用为核心设计网络信息体系的数据、业务、系统、技术架构等4个核心架构,并对知识图谱在军事中的应用进行初步的分析。然而在知识图谱的构建和使用过程中,本体的自动构建和更新等方面还存在大量的技术难题未完全解决,当前知识图谱远未达到覆盖各类军事活动的规模,知识图谱的智能化之路还很长,需要更多的研究力量共同努力。
工业互联网
产业智能官 AI-CPS
加入知识星球“产业智能研究院”:先进产业OT(工艺+自动化+机器人+新能源+精益)技术和新一代信息IT技术(云计算+大数据+物联网+区块链+人工智能)深度融合,在场景中构建状态感知-实时分析-自主决策-精准执行-学习提升的机器智能认知计算系统;实现产业转型升级、DT驱动业务、价值创新创造的产业互联生态链。
版权声明:产业智能官(ID:AI-CPS)推荐的文章,除非确实无法确认,我们都会注明作者和来源,涉权烦请联系协商解决,联系、投稿邮箱:erp_vip@hotmail.com。