【知识图谱】基于知识图谱的安保机器人、知识图谱为电商而生如何感应用户需求、知识图谱在运维中的应用

2018 年 10 月 13 日 产业智能官

本文转载自公众号：警察技术杂志。

郝久月樊志英汪宁王欣

摘要：构建大数据支撑下的智能应用是公安信息化发展的趋势，警用安保机器人大数据分析平台的核心功能包括机器人智能人机交互和前后端融合的大数据情报分析研判。阐述了知识图谱技术在警用安保机器人人机交互和情报分析领域应用的突出优势，并从知识构建、推理挖掘、决策服务等方面提出了警用安保机器人大数据分析系统建设的总体方案。

关键词：知识图谱机器人大数据综合研判

引言

警用安保机器人综合运用物联网、人工智能、云计算、大数据等技术，具备自主感知、自主行走、自主保护、互动交流、便民服务、警用巡逻等能力，可辅助警察完成基础性、重复性、危险性的工作，持续推动警务服务升级。随着人工智能的不断发展，警用安保机器人更加关注机器人智能化能力，以及机器人与现有公安信息化流程无缝对接的大数据智能分析平台的建设能力。智能化已经成为衡量机器人性能的首要标准。

本文总结知识图谱技术在警用安保机器人大数据分析领域应用的技术优势，并围绕警用安保机器人后台智能人机交互和前后端融合的大数据情报分析研判两大核心功能提出系统建设的总体方案。

一、知识图谱技术

目前，人工智能的进展突出体现在以深度学习为代表的机器学习以及以知识图谱为代表的知识工程两大领域。脑科学领域的一些最新研究进展为机器人的研发带来了新的启示。相关研究显示，人脑在进行阅读、问答、计算等非反射性活动时，通常会调动大脑中的多个功能区域，同时进行协作决策。如图1所示，人脑的网络化协作过程主要是为了充分使用不同区域所获得和存储的信息，从而做出综合性的决策研判。由此可以看出，网络是一种建模多源信息和多种要素的有效方法。

知识图谱（Knowledge Graph）是一种语义网络，包含大量实体和概念及其之间的语义关系，知识图谱中所富含的实体、概念、属性、关系等信息，提供了从“关系”角度去分析问题的能力。因此，为了充分组织和管理人机交互过程中和机器人自感知过程中获取的海量数据，知识图谱技术的第一阶段，应从多源异构数据中识别出目标、行为、时空关系等构建系统的本体模型，进而，将要素通过相互作用的方式系统整合，形成目标关系的知识关联网络。因此，知识图谱在警用安保机器人智能化领域的应用具有巨大潜能。

二、警用知识库构建技术

机器人的人机语音交互功能是决定机器人友好性和智能性的关键因素，智能问答是未来智能化发展中人机交互的主要方式。智能问答的核心在于聊天语料和知识推理两部分。当前，互联网和专有网络上，研究人员已建立了通用问询知识库包含衣食住行等多个方面的常用知识。然而，针对警用安保机器人面向公安业务的知识库目前仍处于研究阶段。

从技术层面，问答系统按照知识来源可以分为检索式问答（Retrieval-based Question Answering， RQA）和基于知识库的问答（Knowledge Base Question Answering，KBQA）。RQA的知识来源为非结构化的文档，针对用户的问句对一个文档集合进行排序，并返回排序结果，或者将单个文档中与问题最相关的特定语句返回。KBQA的知识来源为结构化的知识库，针对用户的问句，利用知识库进行查询和推理，得出最终答案。区别于聊天机器人，KBQA更关注事实性问题；区别于RQA，KBQA返回的不是文档排序结果或相关的句子，而是直接给出答案。针对公安行业，警务安保机器人更应以正规、明确的方式对群众提问进行准确回答。因此采用KBQA的方式，构建警用安保机器人知识库，问答系统需要通过自然语言处理技术，将用户问句中的主题实体识别出来，并链接到知识库中对应的实体，通过关系路径推断推理出主题实体到答案节点的路径，从而得到最终的问题答案。

三、警用机器人后台情报分析技术

警用安保机器人具有全面的数据感知功能，将机器人前端感知数据与已建的公安大数据分析系统深度融合，将警用安保机器人巡逻工作纳入公安情报分析、处置流程中，使其成为情报分析系统的重要数据来源，后端的情报研判结果可以直接指挥机器人的下一步行动，形成公安大数据情报分析闭环。因此，公安情报分析能力是警用安保机器人大脑的重要组成部分。

在情报分析领域，传统的情报研判模型通常是由专家系统和逻辑推理计算完成，其存在两个方面的缺陷。首先，专家知识的获取严重依赖领域专家的知识总结能力，但在实际工作当中，专家知识的总结往往存在着挂一漏万的情况，大量细节性、隐含但非常关键的判定知识难以被引入到专家系统中，这就导致专家系统在实际应用场景中效果往往不够理想。另一方面，传统的推理系统往往将各个知识和要素当作孤立的个体对待，对于知识与知识、要素与要素、知识与要素之间的关联关系没有非常好的建模。这就导致对于决策信息的研判与分析十分片面和孤立，单纯依赖传统专家与推理系统分析研判模型难以满足公安等复杂场景下的实际业务需求。

基于知识图谱的情报分析模型采用网络组织的方式对数据对象进行组织，其固有优势明显，适合应用在机器人后台中提供分析决策能力。首先，在知识图谱中，要素对象和对象间关系是能够独立进行管理的，模型可以动态调整知识图谱中节点和边之间的关系，将目标的识别过程和知识的组织过程有效结合起来。其次，知识图谱本身和推理系统之间并不是耦合的，用户可以根据需要定义不同的推理规则，从而挖掘知识图谱当中的相关关系。这种知识与模型分离的数据管理方式，保障系统能够支持不同类型的推理决策模型，同时能够和后续的预测预警模块无缝对接，系统的灵活性大大提高。在系统进行知识升级时，如果是目标识别模块有所改进，可以通过更新知识图谱中的对象与关联关系网络进行知识模型升级；如果是后续的预测预警模块进行了升级，则可以脱离知识图谱，独立进行模型升级。

目前，基于知识图谱的情报分析技术已应用于各国的警务情报项目中。其中美国Palantir公司的Gotham平台构建出一套语义知识搜索挖掘平台，总结提炼八个信息实体：人、车、位置、罪案、逮捕、文件、备注与其他，并构建不同个体间的知识关联，极大提高了破案准确率和效率。在国内，知识图谱技术应用于辅助公安刑侦、经侦等警种的案件侦破工作。针对特定案件，按照人、事、地、物、组织构建社会关系网，结合专家研判经验规则和知识，迅速调用PB及以上量级数据之间的关系，分析推演出案件的研判结果。

四、警用安保机器人后端系统总体架构

警用安保机器人后端系统总体架构的核心功能包括：机器人人机交互平台和机器人大数据平台，如图2所示。

（一）机器人人机交互平台

包含了知识库的构建、知识存储、知识应用。前端机器人本体将采集到的语音输入至语音识别模块，经过自然语言处理，将结构化的实体输入知识问答系统，获取答案，并通过语音合成模块进行输出播放。

1. 知识库构建

如图3所示，进一步描述了知识库的构建过程。知识获取的主要目的是融合通用知识基础库与领域专业基础库，抽取其中的概念、实例、属性和关系。通用基础库是指从常识知识中选取和领域相关知识构成的知识库。领域基础库是用来描述领域相关的其他基本知识，如便民服务更关注的证件办理、安保巡逻更关注的安全常识，其来源于专业领域字典、核心词汇表等。其次，为了获取当前最新最实时的领域知识，建立领域更新库，不断更新和完善知识库内容。

2. 知识计算

包括属性计算、关系计算和实例计算。

3. 知识存储

经验证的海量知识存储于图数据和关系数据库中。

4. 知识应用

通过建立知识图谱，可开展语义检索、个性化推荐、知识问答。其中警用机器人直接调用知识问答应用。

（二）机器人大数据平台

包含了知识库构建、推理挖掘和决策支持。将机器人感知数据与公安大数据进行深度融合，形成公安情报分析知识库，利用关联分析等算法，实现可视化分析、关系人挖掘等上层应用，并将分析结果反馈到机器人本体，指导本体下一步工作。

1. 知识库构建

提取的人、事、地、物、组织等要素对象，将其作为知识图谱当中的实体进行建模。其次，基于实体—链接二维理论，将实体之间的关系（例如：社交关系、家庭、户籍、资金往来、住宿出行等关系）抽象为链接表示为连线，存储在图数据库中，形成不同主题的知识图谱。

2. 推理挖掘

能够从已有知识中发现隐含知识。在知识图谱之上，通过开发各类数据研判模型，如对象关系的异常检测、与特定事件关联关系的查询等，就可以有效支撑情报分析中的各项数据研判任务。

3. 决策支持

分析研判结果结合全息图像可视化、时空可视化、图可视化分析等可视化分析技术，将数据中多维度知识以易于人类理解的方式尽可能多地提供给决策专家。专家通过系统一键下发功能，可快速向前端警用安保机器人下发巡逻指令，到达指定地点，开展数据搜集或巡逻工作。

五、成果试用

在公安工作的众多场景，特别是安保工作中，有很多涉及到基于公安行业安保知识图谱的人机交互场景需求。例如：安保工作中的安保机器人自动区域巡逻、基于动态人脸识别与分析的重点人员现场识别与核验系统、基于安保人员人脸识别与证件识别双因子身份认证系统等场景中，通过安保机器人的引入，能大大提高安保工作的效率、水平和安全能力。同时通过将前端安保机器人与后台大数据分析平台建立高速、高效、安全的连接与互动通道，能够切实将后端的行业知识处理分析能力和行业知识图谱直接服务于一线工作，从而使前端感知机器人变成能够交互、学习、思考的智能交互机器人。这点在重要场所的安保机器人实验工作中已经得到检验，对系统架构、技术平台、安全互联、知识图谱的场景化应用进行了实地验证。下一步将继续扩大实验场景和范围，力争在完善功能、技术架构、知识图谱的基础上，将安保机器人的应用场景推向更大范围。

六、结语

随着大数据、云计算和人工智能等技术的快速发展，以智能化为核心的警用安保机器人大数据平台已初步应用于公安实战。利用知识图谱理论将公安多源、异构大数据进行有效组织，构建以“知识”为核心的知识库、关联网络和推理模型，可为警用安保机器人的应用提供重要的技术支撑。

参考文献：

[1] 陈甜甜.警用巡逻机器人发展研究[J]. 安全技术参考, 2017(4):3-11.

[2] 仇韫琦. 智能时代人机交互的新方式——KBQA的前世今生. http://mp.weixin.qq.com/s/LkRrPXEjGRugw9LMSS9uJg[EB/OL].2018.

[3] 张华平.从Palantir看公安大数据应用[EB/OL].http://mt.sohu.com /20160523/n450910580.

[4] 明略数据. 明略数据实现人机同行[J]. 网络安全和信息化, 2017(9):19.

[5] 王元卓, 贾岩涛, 赵泽亚. OpenKN网络大数据时代的知识计算引擎[J]. CCF 通讯, 2014, 10(11): 30-35.

为电商而生的知识图谱，如何感应用户需求？

本文转载自公众号：阿里技术(ali_tech)。

阿里妹导读：本文从需求分析和体系化构建的角度出发，阐述在电商这一特殊领域的知识图谱构建过程中，形成的一整套概念体系，还有在此过程中，通过算法、工程、产品、运营和外包团队投入大量精力，通过不断磨合逐渐完善的平台架构和审核流程。

作者：玉昆、喜阕、远尚、弘朗、子尹、久越

1、背景

电商认知图谱从17年6月启动以来，通过不断从实践到体系化的摸索，逐渐形成了一套较为完善的电商数据认知体系。

在当前集团不断拓展业务边界的背景下，数据互联的需求越来越强烈，因为这是跨领域的搜索发现、导购和交互的基础，也是真正能让用户“逛起来”要具备的基础条件。但在此之前，我们需要对当前的问题做一个分析。

1.1 问题

更复杂的数据应用场景不仅是传统的电商，现在我们面临的是新零售、多语言、线上线下结合的复杂购物场景，所用到的数据也往往超出了以往的文本范围，这些数据往往都具有一些特点：

非结构化互联网的大量数据都是分散在各个来源而且基本是非结构化文本方式来表示，目前的类目体系从商品管理角度出发，做了长期而大量的工作，仍然只是覆盖了大量数据的冰山一角，这对于认知真正的用户需求当然是远远不够的。

充满噪声：不同于传统的文本分析，目前集团内的数据大部分是query、title、评论、攻略等，这些数据由于用户习惯和商家诉求，会存在非常不同于普通文本的语法结构，也会由于利益原因存在大量噪声和脏数据，这也为真正发现用户需求并结构化带来了极大的困难。

多模态、多源：随着集团的业务扩展，目前的搜索推荐不仅容纳了商品中的文本信息、大量视频、图片也作为内容被使用、如何融合各个来源的数据、如何在关联多模态数据也是数据建设的一个难点。

数据分散，无法互联：从目前的商品体系建设来说，各个部门由于业务快速发展，往往需要维护自己的一套cpv体系，这也是后期做商品管理和搜索的非常关键的一环，但是由于应用场景的行业属性不一样，比如闲鱼的"包配饰"由于业务场景高频会是一个需要再细分的类目，但在淘系由于交易搜索低频，"鞋包配饰"仅仅是二手闲置下的一个小类目，这造成各个部门需要费力地维护在自己的cpv体系上的查询和搜索，每次都要重建自己的类目体系，重新支持存储查询，重新关联商品，重新做类目预测等。如何建设一个比较通用的面向应用的概念体系，支持根据业务需求提供查询服务，已经迫在眉睫。

缺少数据的深度认知：数据的深度认知不是认知商品，而是认知用户需求之间的关联，如何能在用户搜索"叶酸”的时候认知到她有备孕需求，如何能在用户大量点击烧烤调料和工具的时候认知到他需要进行野外烧烤，是目前全集团都缺少的。

1.2 需求分析

通过如下的背景介绍，我们可以明确到，为了构建一个全局统一的知识表示和查询框架，我们需要如下的关键工作。

复杂场景的数据结构化：在复杂的场景下，我们首先要做的是数据清洗，通过频次过滤、规则和统计分析把脏数据去掉，然后通过短语挖掘，信息抽取等方法把高可用的数据抓取出来，进行数据的结构化和层次划分。

分散数据的统一表示框架：对于管理分散数据，我们首先是需要定义一个全局的schema表示和存储方法，然后基于schema进行概念数据的融合，属性的挖掘和发现，在数据关联上有可能要通过各种表示学习的方法来完成。

数据深度认知：深度认知包含两个方面，一个是数据本身的认知，一个是数据关联的认知，通过行为和商品本身的信息我们可以认知到用户购买商品的意图，通过外部数据的输入和摘要我们会得到常识类和商品体系之外的用户需求的关联。

1.3 电商认知图谱

为了解决上面的问题，我们提出了电商认知图谱(E-commerce ConceptNet)，目标是建立电商领域的知识体系，通过深度认知用户需求，实现电商场景下关联人-货-场的联动，赋能业务方和行业。

1.3.1 模块划分

从整体划分上来说，认知图谱分为四块比较重要的工作，通过将不同类型的concept(user,scene,virtual category和item)构建为一个异构图，来实现用户-场景-商品的关联：

用户图谱构建用户图谱除了通用的用户画像信息(年龄、性别、购买力)，也会有“老人”，“小孩”等人群数据，和用户的品类属性偏好数据。

1.3.2 场景图谱构建

场景可以看做是对用户需求的概念化，从现有的query和title中识别出用户需求，泛化为一个通用的场景(scene concept)，并建立诸如"户外烧烤"，"度假穿搭"之类的概念是场景图谱的主要工作。通过不断细化的场景需求，我们将跨类目和品类，代表了一类用户需求的概念抽象为购物场景(sc)。

挖掘了概念相当于我们得到了图上的节点，在概念挖掘之上，我们又着手建立概念与类目和品类，概念和概念之间的关系，相当于建立了图上的有向边，并计算边的强度，具体流程如下：

截止目前，我们已经产出10w+概念和10倍的品类类目关联。

1.3.3 品类细化

品类细化的来源是由于目前的类目体系会过粗或者过细，从构建上包括两个层面：

品类聚合：比如"连衣裙“从认知层面上来说都是一个品类，但是由于分行业管理的原因会同时存在"女装”，"男装"和"童装"等不同类目中,这时候就会存在于两个一级类目下，所以就需要有一个偏常识的体系来维护对真正"连衣裙"的认知。

品类拆分：品类细化是源于我们发现现有的类目体系不足以聚合一类用户需求，比如有一个“西藏旅游”的场景，在“纱巾”类目下我们需要更多的细节，这时候就需要一个叫做“防风纱巾"的虚拟类目。这个过程同样是存在entity/concept extraction和relation classification的，当前我们主要针对类目和品类品类上下位建立关系。

截止目前，我们已经有融合了cpv类目树，品类类目关联，和外网数据的 pair对68.9w+对。

1.3.4 商品图谱构建

短语挖掘：商品图谱端我们需要的是做更多的商品属性认知，我们知道，完善的cpv体系的前提是phrase的认知，针对此我们建立了一个bootstrap框架下的cpv挖掘闭环，目标是能够长期有效积累cpv数据，扩大query和商品的认知(这也是商品打标的数据来源之一)。

举例来说：

截止至目前，我们已经完成了pv top70的类目审核，增加了12W+的cpv对，term能够全量被识别的query占比已经从30%提升到60%（由于目前采用中粒度分词进行挖掘，前期分析70%已经是极限，后续会在增加phrase mining流程后持续扩大挖掘覆盖)，目前数据已经作为类目预测，智能交互的基础数据每日产出。

商品打标：商品打标是我们得以将知识和商品建立关联的关键技术，上述三点产生的数据最后都会通过打标建立与item的联系，在商品打标完成后我们就可以实现从query到商品的整个语义认知闭环。

预计到三月底我们可以实现第一版的商品打标。

2、知识体系

在知识构建的过程中，我们渐渐发现需要一套全局统一的schema表示体系，于是我们调研了wordnet和conceptnet的体系构建历程，逐渐形成了自己的一套概念表示体系，也就是现有的认知图谱的核心(E-commerce ConceptNet)，它的目标是从语义层面去理解电商领域的用户需求并将其概念化(conceptulization)，映射到一个语义本体(ontology)，通过词汇层面的关系逐渐把本体之间的关系形式化(specific)，通过本体之间的层级去表示概念之间的层级，通过概念之间的关系去抽象实体类别和关系。

从数据层面上来看，我们要描述一个事物(entity)，首先需要把它定义为一种类别(instance-of-class)的实例，这种类别通常又可以通过一个概念(concept)来表示，不同的概念会有自己不同的属性(proeprty)，一类概念的具有的属性集合可以称为概念的schema，有同一类schema的概念一般会属于不同的领域(domain)，领域内有自己的语义本体(ontoloty)，通过本体的层次(比如“英国"-is-part-of-”英国")，我们可以形式化概念的层级和表示。那么由细到粗的，我们定义了一套电商概念体系的表示方法，通过不断细化ontology和concept，以及他们之间的关系，来关联起用户和商品，甚至外部的实体。

3、技术框架

3.1 平台模块

总体来说，我们是以一个数据服务中台支撑起上面的图引擎，再通过阡陌数据管理平台，和图灵业务对接平台来实现知识的生产和使用的。

3.2 模块细节

阡陌：数据标注和展示

阡陌作为电商知识图谱的基本平台，目前集成了所有知识标注和审核流程，并且提供了数据查询和可视化，后期算法的概念挖掘服务和商品打标服务也会通过阡陌对外提供。

数据审核在不断试错过程中我们已经建立了一套比较完善的从初审到终审的流程，具体见阡陌审核工具。

可视化：除了审核平台，阡陌还提供了更加具体的数据可视化形式，通过良好的交互方便查询知识阡陌可视化

3.3 图灵：业务全选和投放

由于目前我们的知识大部分以卡片形式提供，图灵提供了一整套经由云主题透出的业务服务工具：

概念选择：

用户可以通过全选自己的主题进行分渠道投放

3.4 图引擎：数据存储和查询

从存储介质来说，我们使用mysql进行灵活标注，图数据库进行全量查询，odps做持久化数据版本管理。

在数据录入到igraph和biggraph之前会被拆分为点表和边表导入，在线通过gremlin进行查询。

在图数据库上层我们封装了一个图引擎模块，提供不同trigger的场景和商品多路多跳召回功能。目前提供user，item_list和query召回，已经在喵小秘使用，并且和搜索发现进行联调中，可以使用查询接口进行查询和测试。

3.5 技术落地

云主题(认知图谱) 目前在云主题已经通过知识卡片的形式上线近1w个场景，比较首猜商品来说，点击和发散性较商品均有大幅提升，现在正在做数据发散性的探索。

锦囊（全量)/底纹(bts)

搜索

穹顶

四、后期规划

目前认知图谱刚刚发展近一年，还有很多工作需要细化，后续的工作重点会放在：

关系挖掘和本体构建
通过文本增强图谱和外部数据的关联
常识类推理规则的挖掘
图推理的符号逻辑表示

阿里巴巴搜索事业部NLP&知识图谱团队欢迎自然语言处理、数据挖掘、知识图谱方向的优秀人才加入，共建阿里电商生态，有兴趣的同学可发简历至xique.llx@alibaba-inc.com。

知识图谱在运维中的应用

本文转载自公众号：InfoQ。

随着业务监控建设不断完善，海量业务故障时产生成百上千条告警，如何智能定位故障根源、实时统计业务影响是现阶段运营面临的一个难题。Google 利用知识图谱优化了其搜索服务以来，知识图谱得到了迅速发展。无论是工业界还是学术界，都出现了各种各样的知识库。能否将知识图谱应用在故障定位领域？领域性知识图谱和通用性知识图谱有什么区别？构建领域性知识图谱是否有可供参考的经验分享？又有哪些前景和挑战？

为此，InfoQ 采访到了腾讯互娱技术运营部高级工程师刘伟，请他来谈谈知识图谱如何助力游戏故障定位。

InfoQ：介绍下您目前所做的研究？在故障定位方面，是什么机缘让您选择了知识图谱？

刘伟：我们现在所做的研究主要侧重于游戏故障定位相关的技术，涵盖以下三个方面：KPI 曲线异常检测、实时舆情故障分析及运维领域知识图谱构建。前面两方面的研究，是我们构建这个运维领域知识图谱的基础，有了前期游戏故障相关的数据，后续我们才能将知识抽象出来。

选择知识图谱用于故障定位，源于我们在游戏故障定位时，遇到的一些问题及用户需求的推动。首先故障定位是一个复杂的问题，需要综合多方面数据进行关联分析，并且需要融入运维专家的经验，而知识图谱在处理关系复杂性，对知识的可解释性方面具有优势。比方说，在发生一个游戏故障时，由于构建了游戏业务的图谱，各个模块之间存在关系，通过节点推导，很容易就找到真正发生问题的模块。

InfoQ：故障定位的知识图谱在腾讯怎么用？有什么收益？

刘伟：知识图谱是一个很火的概念，但我们构建的知识图谱并非通用性图谱，而是领域性图谱，专注于运维领域。故障定位是这个故障图谱具体的应用场景，将故障领域内的知识通过 CMDB 技术和一些机器学习的技术抽象化，构建成图谱。由于是知识的存储，因此构建完成的运维知识图谱，在数据赋能的情况下，可以解决游戏中复杂查询、风险预测、智能问答等很多场景需求。现阶段收益主要丰富用户查询结果，提高故障定位准确率。

InfoQ：谈谈您对知识图谱的理解？在应用知识图谱前，需要掌握哪些技术？

刘伟：知识图谱在学术界主要被定义为大规模语义网络，但在工业界，实际上可以理解为大数据环境下的知识工程，用于描述真实世界中的各种实体和概念，提供实体间的结构化关联关系。

知识图谱主要包括知识表示，知识获取和知识应用这三个部分。在应用图谱之前，对于知识表示技术和知识获取技术的掌握至关重要。知识表示技术主要是数据处理的粒度和层次，由于不同人对不同层次概念具有不同的认知，因而如何确认合理的数据层次和颗粒度面临着挑战。完全人工构建的层次概念到一定层次就会难以深入，具备一定的自动化表示能力才能继续推进。

现有自动化技术包括结合深度学习做信息抽取等。而知识获取技术主要是利用技术完成高质量的数据获取，也就是语料和知识的获取。尤其在领域性知识图谱中，知识质量的好坏决定着整个图谱的好坏。高质量的知识获取一般需要一定的人工干预，如何利用好人力资源并合理控制数据质量是其中的关键问题，结合众包技术做知识验证是目前较为常用的手段。

当然，知识图谱的建设永远不可能是完备的，后续在应用上可以根据实际的应用场景，不断优化和推理。

InfoQ：如何构建故障领域的知识图谱？有什么难点需要解决？

刘伟：我们构建的知识图谱是领域性知识图谱，领域性的知识图谱和通用性的知识图谱在构建上存在一些差别，通用性的知识图谱是高度自动化的，而领域性知识图谱更需要结合一定的专家概念。在构建领域性知识图谱时，我们结合运营环境中的一些基础建设来确定知识的层次和颗粒度，比如 CMDB、应用配置管理系统等，这些系统内具备友好的结构化数据。同时，利用机器学习的方法来自动化地改进层次关系。然后，我们结合运维专家的经验，对于运维数据不断进行筛选和知识验证，修正和优化需要存储的知识。例如，单业务掉线且目标机房有网络波动，从设备信息上有关联，但从专家知识可以得知，网络波动一般会影响多个业务，如果只有这个业务掉线，则单地区的网络问题不是该业务掉线的原因，不存在关联。结合物理设备信息和专家逻辑信息，我们最终构建了某业务为核心的故障知识图谱。部分图谱的内容如下图所示。

目前存在的难点依然是很难获取到高质量的运维数据和相关语料，并且高度依赖专家知识的领域性知识图谱虽然质量较好，但后续的大规模扩展上也较为困难。

InfoQ：构建故障领域知识图谱过程中，踩过坑吗？有哪些经验可以分享？

刘伟：在构建这个领域性知识图谱中，我们实际上也遇到了不少困难。在最开始构建中，我们期望能像构建一个通用性知识图谱一样，利用各种技术基本上自动化地从大规模数据中抽取实体和关系。但很快发现我们实际上并没有这样的大规模运维语料。因此我们渐渐考虑从具体场景入手逐步扩展：我们先从之前做故障定位的效果中看看哪些场景做的不好并且可以通过知识图谱来实现。然后结合目前运维现有结构化数据，我们不断细化数据的层次关系，这里我们也遇到了一个非常实际的问题，如多少程度的细化才能使整个图谱变得完备，这里的解决方案我们依然是依据场景，得出能解决问题的最粗粒度，然后根据不同的场景再不断深入，花费了很多力气来设计整个领域图谱的模式，这对后续专家知识的融合和整个图谱构建来说，是具有好处的。

InfoQ：据了解知识图谱在搜索领域应用的很广泛，那么，知识图谱在故障领域都有哪些应用？和搜索领域有什么区别？

刘伟：知识图谱在搜索领域主要为丰富查询结果，展现给用户真正想要的东西。把网页搜索升级为语义搜索。现阶段我们构建的图谱聚焦故障定位场景，主要利用知识图谱辅助决策并使故障定位结果的具备可解释性。区别主要在于搜索领域主要是通用性知识图谱，而我们故障领域主要侧重于领域性知识图谱。相较而言，范围较窄、程度较深、依赖专家知识更多。

InfoQ：知识图谱是实现 AIOps 的必经之路吗？

刘伟：这个问题挺难回答，谈下个人的一点看法。对 AIOps（智能运维）我们先设想下对它的预期，理想化是它可以做运维所有的事情，例如发布变更、业务巡检、故障处理、对外沟通等。做这些事情的前提，需要 AI 具备运维的背景知识，让 AI 像人一样思考并具备推理能力。因此知识图谱的引入正是把 AIOps 变成一个具有运维知识的 AI，知识图谱结合大数据下的机器学习，不断完善知识图谱，最终成为运维大脑。套用业界的一个观点，机器学习让 AI 更聪明，而知识图谱让 AI 更有学识。无疑运维人员是聪明的，而且各方面技术均涉及，是博学多才的杂家，利用领域性知识图谱，对于专家知识进行沉淀和存储，长远来看十分具有价值，可以说知识图谱是实现 AIOps 的关键技术之一。

InfoQ：知识图谱在故障定位方面的前景和挑战？

刘伟：利用大数据 + 算法可以让 AI 具备感知的能力，在处理图像、语音、文字方面有非常好的效果，但对于复杂场景下的故障定位，则需要 AI 具备先验知识，有一定认知能力，所以我认为知识图谱的空间很大。知识图谱技术方兴未艾，在运维领域尚没有很好的参考案例，也没有很好的语料知识，因此有很长的路要走，希望更多的人加入，大家结伴而行。

作者简介：

刘伟，10 年运维领域工作经验。2011 年加入腾讯，高级工程师，主要负责腾讯自研游戏运维及系统平台建设，主导开发腾讯游戏故障智能定位平台、实时游戏舆情监控系统，目前专注于 AIOps、运维大数据分析等智能运维领域工作。即将在 2018 CNUTCon 全球运维技术大会上分享《智能运维助力游戏故障定位》。

工业互联网

产业智能官 AI-CPS

加入知识星球“产业智能研究院”：先进产业OT（工艺+自动化+机器人+新能源+精益）技术和新一代信息IT技术（云计算+大数据+物联网+区块链+人工智能）深度融合，在场景中构建状态感知-实时分析-自主决策-精准执行-学习提升的机器智能认知计算系统；实现产业转型升级、DT驱动业务、价值创新创造的产业互联生态链。