领域应用 | 从数据到智慧,知识图谱如何推动金融更智能?

2019 年 1 月 7 日 开放知识图谱

本文转载在公众号:恒生技术之眼


在《人工智能+知识图谱:如何规整海量金融大数据?》一文中,笔者曾提到,面向人工智能的大数据治理,势必能有效支撑智能金融从感知智能向认知智能变革。这是因为目前在资本市场中,大数据的治理存在一些问题,比如非结构化数据的处理与使用、实时敏捷的数据处理与使用以及多源异构的数据孤岛等。

 

而知识图谱在智能金融中扮演的正是数据加工、处理的角色,能够为数据服务提供相应的支持。比如对于多源异构的数据,知识图谱能做到比较好的集成,通过统一的数据表示与建模、统一数据处理与存储来降低数据的使用难度。

 

正所谓“玉不琢不成器”,数据是金融的生命线,经过知识图谱的“琢磨”,大数据治理会有更多成果呈现出来,从而更好地赋能智能金融,助力金融机构实现数据驱动下的业务运营和创新。那么想要达到这样的目的,资本市场的知识图谱应该如何构建呢?


资本市场知识图谱构建的核心目标

 

有目标,才有方向。在资本市场中,人们都在关注资产的价格、走势以及相关的分析,这是一个永恒的话题。所以资本市场知识图谱的建立应该有两个核心目标:

 

核心目标1:企业画像&企业分析

 

以前,我们为企业做信息规整的时候,以集合企业的360度属性信息为目标。而通过知识图谱技术,我们可以改变这种思路,以企业为中心,把围绕企业的实体关系建立起来,比如企业与企业的关系、企业与人的关系、企业与行业的关系、企业与舆情事件的关系、企业与宏观要素的关系等等。当我们将企业放在关系网络里,把种种关系都建立起来的时候,我们会发现,企业的画像也就完成了。

 

企业分析也是从关系分析开始的。在关系网络具备的情况下,我们可以以关系分析为起点进行企业的分析,一步步达到我们最终所需的分析目标和结果。

 

核心目标2:舆情事件基于知识图谱的传播

 

为企业做画像,是相对静态的一个结果,因为汇集的很多都是关于企业的静态信息。而舆情事件在每天的新闻、公告、研报里都会发生,是相对动态的。那么舆情事件有没有传递效应?有什么样的传递效应?这也是我们在资本市场中构筑知识图谱时需要考虑的。

 

资本市场知识图谱构建的关键点

 

有了这两个核心目标,资本市场的知识图谱应该怎么构建呢?对于资本市场来说,知识图谱的构建也需要知识建模、知识获取、知识融合、知识存储、知识展示、知识计算、知识应用等环节,这与传统行业是一样的。不一样的地方在于以下几个关键点:

 

场景驱动按需迭代

 

在金融行业,新的数据源源不断地产生、汇集,那么我们在构建知识图谱之时,需要以场景驱动来解决这个问题,在数据建模上不断地更新,先建立Schema再去寻找相应的数据,集合起来之后对特定的应用场景提供相应的数据服务。随着Schema 1.0、2.0、3.0不断演化,一个企业级的知识图谱可能就建立起来了。

 

充分利用第三方数据

 

起点不一样,是资本市场知识图谱与其他领域知识图谱的一个不同点。在资本市场中,有很多第三方数据公司为证券公司、基金公司等金融机构提供数据服务,充分利用第三方数据对于知识图谱的构建非常重要。这个起点有什么影响呢?一方面,第三方数据公司会通过自然语言处理等技术做一些数据的梳理工作,其数据结构质量会比较高,基于高质量数据来构建的知识图谱,质量也会比较好,如果我们放弃这种方式,从大规模自动建立开始做,很难达到同等的效果;另一方面,第三方数据也是在不断更新的,因此在知识获取和知识融合方面,第三方数据可以帮我们解决冷启动的问题。

 

事件与时序的支持

 

事件是相对动态的,动态的新闻、资讯对资产价格有非常大的影响,所以我们在资本市场的知识图谱构建中,包括建模、分析、展示、存储等各个环节,都要充分考虑到对事件和时序支持。

 

灵活的图展示方式

 

资本市场的知识图谱对于展示有一些不一样的需求,比如可不可以按照产业链的方式把某一行业的上下游全部展示出来,能不能按照股权结构把实际受益人的图谱关系展示出来等等,这些都是金融领域的图展示需要做到的。

资本市场知识图谱的应用场景

 

从数据的关系网络支撑这个角度来看,知识图谱作为数据治理的工具、手段,可以助力原有的传统金融业务实现智能化的升级。另外,知识图谱与机器学习等技术的结合,也会帮助原有的模型实现升级。那么具体来看,知识图谱能够对现在的金融业务产生哪些方面的赋能呢?

基础赋能


▲基础数据服务:把知识图谱当做数据库、知识库,用KBQA(Knowledge Base Question Answering)的方式,为金融问答系统、智能客服系统以及金融智能搜索等业务提供相应的支持。

 

▲关系穿透/挖掘服务:知识图谱对于关系穿透、挖掘的能力,使其非常适合找到一致行动人、实际控制人以及资本系挖掘,从而有助于关联交易关联账号识别、信息批露等风控控制,并且能够对风控风险的传播和原因做深入分析,这在合规风控领域的应用有非常大的空间。

 

▲建模/推理服务:知识图谱把一些关系的数据梳理得比较清楚,这对于营销服务领域来说是一次革新的机会。无论从数据的提供层面,还是从模型的建立层面,知识图谱在KYC/KYP(Know Your Customer / Know Your Product)、产品服务推荐、智能投顾等领域都会带来非常大的价值。


进阶赋能


▲基于知识图谱事件传播影响的智能资讯服务

 

这是静态与动态知识图谱能够结合并产生金融服务的一个场景。目前对于头部金融机构的终端服务来说,智能资讯已经是一种标配,可以把相应的资讯推送给相应的标的持有人,进行风险警示或投资机会提示。

 

在知识图谱技术的加持下,智能资讯服务能够做进一步的延伸,因为企业是处在关系网络之中的,任何一个事件的传递都会沿着关系网络传播。比如“行业的原材料价格上涨”这样一件事,会在企业的关系网络里沿着企业的上下游来进行传递,据此我们可以把涉及到的相关企业从知识图谱中找出来,命中事件传播波动相关性标的、事件要素投研逻辑相关性标的等,从而对相应投资人进行相应标的的智能资讯服务,例如持仓/自选股预警、投顾等辅助服务。

 

▲基于知识图谱的智能投研:分析师工作平台

 

智能投研是知识图谱能够有较多应用的一个场景。每个行业分析师都有一套行业产业链逻辑,并且依据这套逻辑准确定位市场现状、动态,预测并制作市场模型。借助知识图谱,这套逻辑可以演化成一个投研工具,一个智能投研的分析平台,满足分析师私有化、个性化的要求,做到能够自动添加实体(公司)、关系(产业链条)、属性(私有数据),自定义投研逻辑与预警规则,帮助分析师进行产业链与企业关系的分析。

 

展望

 

在当下的智能金融时代,一方面我们需要着手进行面向人工智能的大数据治理,在数据层面上通过知识图谱将原有的金融数据做再一次的加工、整理;另一方面,一个金融机构往往动辄几十套、上百套系统,如何把知识图谱等人工智能技术的服务能力开放给传统的业务系统,进行面向人工智能的服务治理,这也是我们必须面对的一个挑战。


此外,浙江大学陈华钧教授曾提到过知识图谱的数据源问题,由于数据太容易被复制了,一旦发生数据外泄很容易侵犯个人隐私与数据所有权,所以在知识图谱领域,我们也可以考虑结合区块链技术来对数据来源进行溯源。现在知识图谱更多是集中式的,未来可能有更多分散式的知识图谱架构出现,来帮助我们解决这个问题。


300多年,英国哲学家培根曾说,知识就是力量。而随着人工智能时代的启幕,我们或许也可以说:知识图谱就是力量。知识图谱起于搜索,又不止于搜索,它是底层的,是无处不在的,支撑着人工智能在各个场景中的应用。未来,知识图谱必将让金融更智能,在更多的金融业务场景中发挥更大的价值。



OpenKG.CN


中文开放知识图谱(简称OpenKG.CN)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 博客。

登录查看更多
1

相关内容

知识图谱(Knowledge Graph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。 知识图谱是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。它能为学科研究提供切实的、有价值的参考。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
商业数据分析,39页ppt
专知会员服务
160+阅读 · 2020年6月2日
2020年中国《知识图谱》行业研究报告,45页ppt
专知会员服务
239+阅读 · 2020年4月18日
德勤:2020技术趋势报告,120页pdf
专知会员服务
190+阅读 · 2020年3月31日
【综述】金融领域中的深度学习,附52页论文下载
专知会员服务
164+阅读 · 2020年2月27日
【大数据白皮书 2019】中国信息通信研究院
专知会员服务
137+阅读 · 2019年12月12日
【白皮书】“物联网+区块链”应用与发展白皮书-2019
专知会员服务
93+阅读 · 2019年11月13日
中文知识图谱构建技术以及应用的综述
专知会员服务
312+阅读 · 2019年10月19日
医疗知识图谱构建与应用
专知会员服务
384+阅读 · 2019年9月25日
领域应用 | 企业效益最大化的秘密:知识图谱
开放知识图谱
8+阅读 · 2019年4月11日
领域应用 | NLP 和知识图谱:金融科技领域的“双子星”
开放知识图谱
21+阅读 · 2018年8月12日
领域应用 | 知识图谱的技术与应用
开放知识图谱
17+阅读 · 2018年6月14日
智能时代如何构建金融反欺诈体系?
数据猿
12+阅读 · 2018年3月26日
领域应用 | CCKS-2017 行业知识图谱构建与应用-下篇
开放知识图谱
12+阅读 · 2017年9月21日
【知识图谱】CCKS-2017 行业知识图谱构建与应用-下篇
A Survey on Bayesian Deep Learning
Arxiv
63+阅读 · 2020年7月2日
A Survey on Edge Intelligence
Arxiv
52+阅读 · 2020年3月26日
A Survey on Deep Learning for Named Entity Recognition
Arxiv
26+阅读 · 2020年3月13日
Arxiv
102+阅读 · 2020年3月4日
Efficiently Embedding Dynamic Knowledge Graphs
Arxiv
14+阅读 · 2019年10月15日
AutoML: A Survey of the State-of-the-Art
Arxiv
70+阅读 · 2019年8月14日
Arxiv
8+阅读 · 2018年3月17日
VIP会员
相关VIP内容
商业数据分析,39页ppt
专知会员服务
160+阅读 · 2020年6月2日
2020年中国《知识图谱》行业研究报告,45页ppt
专知会员服务
239+阅读 · 2020年4月18日
德勤:2020技术趋势报告,120页pdf
专知会员服务
190+阅读 · 2020年3月31日
【综述】金融领域中的深度学习,附52页论文下载
专知会员服务
164+阅读 · 2020年2月27日
【大数据白皮书 2019】中国信息通信研究院
专知会员服务
137+阅读 · 2019年12月12日
【白皮书】“物联网+区块链”应用与发展白皮书-2019
专知会员服务
93+阅读 · 2019年11月13日
中文知识图谱构建技术以及应用的综述
专知会员服务
312+阅读 · 2019年10月19日
医疗知识图谱构建与应用
专知会员服务
384+阅读 · 2019年9月25日
相关资讯
领域应用 | 企业效益最大化的秘密:知识图谱
开放知识图谱
8+阅读 · 2019年4月11日
领域应用 | NLP 和知识图谱:金融科技领域的“双子星”
开放知识图谱
21+阅读 · 2018年8月12日
领域应用 | 知识图谱的技术与应用
开放知识图谱
17+阅读 · 2018年6月14日
智能时代如何构建金融反欺诈体系?
数据猿
12+阅读 · 2018年3月26日
领域应用 | CCKS-2017 行业知识图谱构建与应用-下篇
开放知识图谱
12+阅读 · 2017年9月21日
【知识图谱】CCKS-2017 行业知识图谱构建与应用-下篇
相关论文
A Survey on Bayesian Deep Learning
Arxiv
63+阅读 · 2020年7月2日
A Survey on Edge Intelligence
Arxiv
52+阅读 · 2020年3月26日
A Survey on Deep Learning for Named Entity Recognition
Arxiv
26+阅读 · 2020年3月13日
Arxiv
102+阅读 · 2020年3月4日
Efficiently Embedding Dynamic Knowledge Graphs
Arxiv
14+阅读 · 2019年10月15日
AutoML: A Survey of the State-of-the-Art
Arxiv
70+阅读 · 2019年8月14日
Arxiv
8+阅读 · 2018年3月17日
Top
微信扫码咨询专知VIP会员