OpenKG地址:http://openkg.cn/dataset/ftho
开放许可协议:GPL 3.0
贡献者:武汉科技大学(高峰、郑丽丽、顾进广)
摘要
在此开放资源中,面对金融领域多元关系表示的困境和时序事件表示需求,我们以OWL语义为基础,结合金融领域专业知识,融合超图概念和事件5W(When,where,Why,What,WHo)定义构建了可通用化的金融时序超图本体模型(Finanical Temporal Hypergraph Ontology,FTHO)。
知识图谱以<s,p,o>三元组的形势存储数据,使用Ontology对知识框架进行描述,因为知识图谱灵活的图结构,近年来,基于其在金融领域智能问答、语义搜索、辅助决策、智能分析等应用得到了关注。
但在传统的图结构中,两点之间的连接只能表示一对节点之间的二元实体关联,这种结构对现实金融领域中复杂多元关系表示能力较弱,例如,金融领域的(债券)共同担保关系,若以普通图表示这种关系,则多个担保者之间的“共同”性被削弱。
同时,现有知识图谱以静态的实体为核心,世间万物瞬息变化,现实世界中不断在发生着各类事件,动态的事件为社会实践提供参考并承载更深层次的信息。例如,投资者要参考公司以往发生的事件来评估公司的投资风险;股价的多次涨跌可能有相同规律性。因此,对时序事件的通用化表示也是金融领域的重要需求。
基于现有问题,本文提出了金融时序超图表示模型,主要分为两点:一是将现实世界复杂多元关系抽象为拓扑结构,根据超图理论,结合OWL语义建立金融超图表示模型;二是结合事件五元组5W(When,where,Why,What,Who)定义,提出一种通用化时序事件表示模型。接下来,将依次对这两方面的相关工作进行介绍。
2. 资源构建及概况
金融时序超图FTHO表示模型分为超边模型、普通图拓扑表示模型和事件时序表示三个部分,将现实世界
中的复杂多元关系抽象为拓扑结构,不仅兼容金融领域多元关系,同时以超图模式建立索引,提高检索效率。
超图中的超边是属于该边的普通任意数目节点的聚合,借鉴与RDF中容器的表示方法,根据超边内节点特性,将超边分为无序超边、有序超边和选择超边三类,分别基于rdf中的相应容器进行定义,如图1。
图1 金融时序超图中的超边定义
构成超图的普通边是具有传递性的边和具有共指性的边所形成的边的集合(子图),我们称这些普通边为“超边成份边”。超边成份边的传递性基于OWL提供的边的传递性(owl:TranstiveProperty)提供,共指性通过多边指向同一节点或来自同一节点得出。传递性边可形成链状子图或环状子图(图2a、2b),共指性边可形成星型内向子图或星型外向子图(图2c、2d)。同时,由于传递性边具有方向,其形成的链状或环状子图可能形成有序或无序超边(图3a、3b)。最后,根据传递性或共指性边是否可以存在于多个子图中,我们将构成超边的成份边分为融合成份边和共享成份边两类,其中融合成份边指其形成的链、环、星状子图中的任意一条成份边与其形成的超边之间不存在多对一关系(图4a);而共享成份边指其子图中的成份边与其形成的超边之间存在多对一关系,即成份边可为多个子图共享,如图4b中V2指向V7的成份边可为E1、E2、E3超边共享。
图2 普通图特殊拓扑结构
图4 融合超边和共享超边
根据构成超边拓扑结构的普通边特性,金融时序超图的超边成份边定义如图5所示
图5 金融时序超图的普通边定义
本文依据事件5W(When,Where,Why,Who,What)概念,将事件知识概括为事件元数据(包含时间信息在内)和事件内容两部分,其中事件元数据(包含事件概念本身)利用现有本体模型进行描述,包括使用GeoSparql来表示空间信息,使用OWL-Time来表示时间信息;而通过hasEventPayload用于描述事件内容,事件内容同样表示为一个无序集合(rdf:Bag),其中包含一系列的rdf:Statement用于表述事件知识,每个rdf:Statement使用三元组形式存储不可再分的事件原子内容。这样,事件的内容可以是任何三元组知识。金融时序超图事件时序表示模型如图6所示。
图6 金融时序超图事件时序表示模型
为验证FTHO模型的通用性和灵活性,我们记录了三个现实场景通过普通边方式和超边方式SPARQL检索所需要的时间,时间对比如图7所示。
图7 普通边与超边检索时间对比
对于构建后的资源,我们可以从以下几个方面进行利用:
(1)用于结合领域知识,标识金融领域中可以形成多元关系的各种二元关系;
(2)利用推理机,对标注为超边成分边的二元、时序关系进行推理,构建多元时序关系;
(3)结合金融领域风控等应用,实现基于多元时序金融知识的应用落地。
在本开放资源中,从金融领域实际应用场景出发,扩展现有知识图谱表示机制,构建了金融时序超图(FTHO)。将现实场景中复杂的多实体关联关系抽象为拓扑结构,并根据其结构特性,建立拓扑子图的二元构成边节点映射超边的规则集,其次,本文结合事件5W概念建立了通用化的金融时序事件表示模型。为金融领域多元、时序事件表示困境提供了解决方案,促进金融领域人工智能系统的进步。
OpenKG
OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。
点击阅读原文,进入 OpenKG 网站。