本文作者为东南大学漆桂林老师,首发于知乎专栏知识图谱和智能问答
前面一篇文章“知识图谱之语义网络篇”已经提到了知识图谱的发展历史,回顾一下有以下几点:
1. 知识图谱是一种语义网络,即一个具有图结构的知识库,这里图的节点可以是概念(比如说大学),可以是实例(比如说东南大学),可以是一个literal(比如说一个数字,一个日期,一个字符串),而图的边就是一个关系(比如说漆桂林 就职于 东南大学,这里“就职于”就是一个关系)。
2. 语义网络的表达能力还是很强的,即一阶谓词逻辑可以表达的知识都可以用语义网络来表达。
3. 语义网络可以有逻辑推理能力,而推理可以通过规则来实现,也可以通过父子节点的继承实现。
那么,知识图谱到底有些什么用呢?知识图谱比较适合需要建立数据关联和需要从非结构化数据中转化出结构化数据的场景。下面是几个应用场景(还会持续更新,也欢迎提意见)。
知识图谱这个概念是谷歌提出的,谷歌做知识图谱自然是跟搜索引擎相关,即提供语义搜索。这里语义搜索跟传统搜索引擎的区别在于搜索的结果不是展示网页,而是展示结构化知识,如下图(图1)所示:
图1 语义搜索示例
在图1中,当用户输入“jackie chan",搜索引擎可以识别出jackie chan其实就是成龙,而且,会给出成龙的各种属性信息,比如说出生日期、国籍、配偶等。这些都是以前基于关键词的检索做不到的,有了知识图谱以后,就可以即问即答了。点击成龙的配偶“林凤娇”,可以直接进入她的知识卡片,见图2:
图2 语义导航示例
然后还可以继续点击房祖名看他的信息。这里我们可以把成龙、林凤娇、房祖名看出图的节点,成龙跟林凤娇之间有一个关系,即夫妻关系,林凤娇跟房祖名之间有一个关系,即母子关系,这就是成龙家庭的一个小的关系图谱。
通过知识图谱相关技术从招股书、年报、公司公告、券商研究报告、新闻等半结构化表格和非结构化文本数据中批量自动抽取公司的股东、子公司、供应商、客户、合作伙伴、竞争对手等信息,构建出公司的知识图谱。在某个宏观经济事件或者企业相关事件发生的时候,券商分析师、交易员、基金公司基金经理等投资研究人员可以通过此图谱做更深层次的分析和更好的投资决策,比如在美国限制向中兴通讯出口的消息发布之后,如果我们有中兴通讯的客户供应商、合作伙伴以及竞争对手的关系图谱,就能在中兴通讯停牌的情况下快速地筛选出受影响的国际国内上市公司从而挖掘投资机会或者进行投资组合风险控制(图3)。
图3 股票投研情报分析
通过融合企业和个人银行资金交易明细、通话、出行、住宿、工商、税务等信息构建初步的“资金账户-人-公司”关联知识图谱。同时从案件描述、笔录等非结构化文本中抽取人(受害人、嫌疑人、报案人)、事、物、组织、卡号、时间、地点等信息,链接并补充到原有的知识图谱中形成一个完整的证据链。辅助公安刑侦、经侦、银行进行案件线索侦查和挖掘同伙。比如银行和公安经侦监控资金账户,当有一段时间内有大量资金流动并集中到某个账户的时候很可能是非法集资,系统触发预警(图4)。
转自:开放知识图谱
完整内容请点击“阅读原文”