云孚知识图谱YFKG:可自动扩充的知识图谱

2021 年 4 月 23 日 哈工大SCIR

声明:本文转载自 云孚科技 公众号

 

编者按:云孚科技总部位于北京市中关村国际孵化园,由哈尔滨工业大学社会计算与信息检索研究中心(HIT-SCIR)独家技术孵化。核心产品包括语义中台YFNLP、知识图谱YFKG和对话系统YFBOT。


知识图谱(Knowledge Graph)以结构化的形式描述客观世界中概念、实体及其关系,将信息表达成更接近人类认知世界的形式。目前,知识图谱正在逐步应用到各行各业,常见的知识图谱产品主要专注于将结构化、半结构化数据通过一系列规则转换为知识图谱,但不能有效处理文档、网页等非结构化数据,而非机构化数据的占比通常达到80%以上。针对这个问题,云孚科技自主研发了一整套知识图谱解决方案,可以从非结构化数据自动抽取知识,并自动融合到知识图谱中,从而达到海量非结构化数据的效用最大化。


01

云孚知识图谱是什么?


云孚知识图谱(YunFu Knowledge Graph,YFKG是由云孚科技自主研发的一套面向知识应用全生命周期的知识图谱一站式解决方案,融合了哈尔滨工业大学社会计算与信息检索研究中心(HIT-SCIR)业内领先的自然语言处理、《大词林》等技术,并结合行业知识图谱实践经验进行了深度优化,可助力企业高效打造自己的知识计算平台,全面提升运行效率和决策智能化水平,有效解决企业生产运营中普遍存在的数据孤岛、知识查询不便、专家经验难以传承等问题。




(一)一站式、全生命周期的解决方案


YFKG提供了知识图谱的所有常规功能模块,包括数据标注、模型管理、知识建模、知识抽取、知识融合、知识搜索、知识问答、知识推荐等。用户无需关注底层实现细节,通过专门设计的知识图谱构建流水线,可以自定义知识图谱构建过程中的各个步骤,有效降低了知识图谱的构建难度、缩短开发周期。YFKG面向上层应用开发者,提供了丰富的API调用接口,不限开发语言,方便开发者基于构建好的知识图谱做二次开发。YFKG支持公有云和私有化部署,用户可灵活选择部署方式

云孚知识图谱(YFKG)系统架构图




(二)基于深度学习的自动知识抽取


YFKG基于业内领先深度自然语言处理技术,可以从非结构化数据中自动抽取实体、关系、属性、事件等知识,并自动融合到已有的知识图谱中,从而实现知识图谱24小时不间断地自动扩充,可有效扩大知识的覆盖率,同时保证知识的时效性。






(三)开放域事件追踪


YFKG支持在非结构化数据中进行开放域事件抽取,并将知识图谱中事件涉及的实体与该事件进行关联,从而可以动态追踪知识图谱中实体关联的各类事件,并按时间线浏览,追踪事件的发展脉络。





(四)支持多模态数据


YFKG除了支持文本数据,还支持融合图像视频音频等多模态数据,能更有效地表示和理解真实世界的业务场景,让语义搜索、智能问答、推荐系统等上游任务更加智能,为用户带来更丰富的体验。





(五)支持事理图谱


事理图谱HIT-SCIR2017年首先提出,可以描述事件的演化规律和发展逻辑。YFKG紧跟知识图谱研究前沿,支持构建事理图谱,并通过实体和事件的关联,实现了事理图谱与知识图谱的融合。




02

云孚知识图谱能干什么?


云孚知识图谱的核心在于对多模多源异构数据和多维复杂关系的高效处理与可视化展示,将社会生活与生产活动中难以用数学模型直接表示的关联属性,融合成一张以关系为纽带的数据网络,通过对关系的挖掘与分析,能够找到隐藏在行为之下的关联,并进行直观的展示。


云孚知识图谱能高效地处理数据和加工推理知识,推动升级人工智能既有产品或提供更有效的解决方案,同时也可以转化为新的商业产品形式。通过与知识图谱的配合使用,依托于行业知识与经验的深度学习将产生更多贴近产业核心的认知智能应用,有助于覆盖场景中大多数问题,形成完整的以“场景需求”为导向的人工智能解决方案,进一步实现生产力升级的终极目标。


03

云孚知识图谱成功案例


案例1:通用知识图谱


基于采集的网络资讯,将不同来源的各实体相关信息进行聚合,围绕实体进行全方面的介绍,自动构建通用知识图谱。目前系统包含1600多万实体3亿多关系


通用知识图谱




案例2:军事知识图谱


基于公开军事新闻,自动获取相关军事新闻并构建军事领域知识图谱。实现自动的实体识别,关系、事件、属性的抽取。在构建的知识图谱上可以进行相关信息检索,知识推理等等行业相关语义场景的应用。


军事知识图谱





案例3:医学知识图谱


对医学知识进行分析、识别、理解并关联,自动抽取医学实体及关系,构建医学知识图谱。提供展示及查询界面。同时可对现有医学知识抽取经典算法进行集成,并提供接口可对现有算法进行二次开发及新算法的在线调试,可对医学知识抽取工具进行多维度的优化。


医学知识图谱




案例4:金融事理图谱


基于腾讯、网易、和讯等网站的海量财经新闻文本,构建的金融领域的事理图谱。目前包含约134万事件节点和约140万的因果关系。


图12. 金融事理图谱




案例5:案件知识图谱


通过对判决书、口供等信息的定制化抽取和信息聚合,构建案件知识图谱,可帮助用户快速发现挖掘出嫌疑人员的上下级关系、团伙的组成、交易特点等信息,开展案情侦破。


案件知识图谱


04

关于云孚


云孚科技总部位于北京市中关村国际孵化园,由哈尔滨工业大学社会计算与信息检索研究中心(HIT-SCIR)独家技术孵化,致力为企业客户提供全生命周期的知识应用解决方案,助力企业认知升级。


核心产品包括语义中台YFNLP知识图谱YFKG对话系统YFBOT,囊括多项国际技术评测世界第一的成果和多项独家语义技术,广泛应用于互联网、金融、医疗、教育、电网、军工、汽车、消费电子等数十家行业头部客户。


公司目前已通过国家高新技术企业、双软企业、ISO9001、ISO27001等资质认证,荣获北京市中关村雏鹰人才企业、北京市中关村金种子企业等荣誉。



05

关于HIT-SCIR


哈尔滨工业大学社会计算与信息检索研究中心,简称HIT-SCIR隶属于哈工大计算学部,深耕于自然语言处理和社会计算领域20年,以“理解语言,挖掘知识,认知社会”为口号,以”以中文技术助民族复兴”为理想,致力于句子级的语言分析、人机对话、篇章级的自然语言处理、社会计算等方向的研究。


HIT-SCIR已完成或正在承担的国家973课题、国家自然科学基金重点项目、国家863重点项目、国际合作、企业合作等课题60余项。近年来持续在自然语言处理和人工智能国际顶级会议ACL、SIGIR、KDD、AAAI、IJCAI、EMNLP上等发表多篇高水平论文。已将多项技术成果直接或间接地嵌入百度、腾讯、讯飞、金山等企业的产品中,并获得国家科技进步二等奖及黑龙江省科技进步一、二等奖。


本期责任编辑:刘   铭
本期编辑:冯   晨


哈工大SCIR公众号
主编:张伟男
副主编:丁效,刘铭,冯骁骋,赵森栋
执行编辑:杜佳琪
编辑: 钟蔚弘,彭湃,朱文轩,冯晨,牟虹霖,张馨,王若珂,高建男

长按下图即可关注哈尔滨工业大学社会计算与信息检索研究中心微信公众号 哈工大SCIR
登录查看更多
4

相关内容

知识图谱(Knowledge Graph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。 知识图谱是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。它能为学科研究提供切实的、有价值的参考。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
浙江大学《知识图谱导论》课程
专知会员服务
192+阅读 · 2021年12月26日
专知会员服务
151+阅读 · 2021年8月26日
专知会员服务
189+阅读 · 2021年3月22日
最新《知识图谱:构建到应用》2020大综述论文,261页pdf
专知会员服务
289+阅读 · 2020年10月6日
面向司法案件的案情知识图谱自动构建
专知会员服务
125+阅读 · 2020年4月17日
医疗知识图谱构建与应用
专知会员服务
384+阅读 · 2019年9月25日
图谱实战 | 医学知识图谱的价值与应用场景
开放知识图谱
5+阅读 · 2022年4月6日
知识图谱的自动构建
DataFunTalk
55+阅读 · 2019年12月9日
公开课 | 知识图谱构建与应用概述
开放知识图谱
52+阅读 · 2019年11月6日
你不得不看的六篇知识图谱落地好文
AI前线
29+阅读 · 2017年11月19日
课程 |《知识图谱》第一期
开放知识图谱
22+阅读 · 2017年10月15日
【知识图谱】如何构建知识图谱
产业智能官
134+阅读 · 2017年9月19日
【知识图谱】大规模知识图谱的构建、推理及应用
产业智能官
37+阅读 · 2017年9月12日
【知识图谱】CCKS-2017 行业知识图谱构建与应用-下篇
大规模知识图谱的构建、推理及应用
人工智能头条
15+阅读 · 2017年8月29日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2011年12月31日
国家自然科学基金
4+阅读 · 2009年12月31日
Arxiv
33+阅读 · 2021年12月31日
CSKG: The CommonSense Knowledge Graph
Arxiv
18+阅读 · 2020年12月21日
Arxiv
102+阅读 · 2020年3月4日
Arxiv
14+阅读 · 2019年11月26日
Arxiv
20+阅读 · 2019年9月7日
Arxiv
30+阅读 · 2019年3月13日
VIP会员
相关VIP内容
浙江大学《知识图谱导论》课程
专知会员服务
192+阅读 · 2021年12月26日
专知会员服务
151+阅读 · 2021年8月26日
专知会员服务
189+阅读 · 2021年3月22日
最新《知识图谱:构建到应用》2020大综述论文,261页pdf
专知会员服务
289+阅读 · 2020年10月6日
面向司法案件的案情知识图谱自动构建
专知会员服务
125+阅读 · 2020年4月17日
医疗知识图谱构建与应用
专知会员服务
384+阅读 · 2019年9月25日
相关资讯
图谱实战 | 医学知识图谱的价值与应用场景
开放知识图谱
5+阅读 · 2022年4月6日
知识图谱的自动构建
DataFunTalk
55+阅读 · 2019年12月9日
公开课 | 知识图谱构建与应用概述
开放知识图谱
52+阅读 · 2019年11月6日
你不得不看的六篇知识图谱落地好文
AI前线
29+阅读 · 2017年11月19日
课程 |《知识图谱》第一期
开放知识图谱
22+阅读 · 2017年10月15日
【知识图谱】如何构建知识图谱
产业智能官
134+阅读 · 2017年9月19日
【知识图谱】大规模知识图谱的构建、推理及应用
产业智能官
37+阅读 · 2017年9月12日
【知识图谱】CCKS-2017 行业知识图谱构建与应用-下篇
大规模知识图谱的构建、推理及应用
人工智能头条
15+阅读 · 2017年8月29日
相关基金
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2011年12月31日
国家自然科学基金
4+阅读 · 2009年12月31日
相关论文
Arxiv
33+阅读 · 2021年12月31日
CSKG: The CommonSense Knowledge Graph
Arxiv
18+阅读 · 2020年12月21日
Arxiv
102+阅读 · 2020年3月4日
Arxiv
14+阅读 · 2019年11月26日
Arxiv
20+阅读 · 2019年9月7日
Arxiv
30+阅读 · 2019年3月13日
Top
微信扫码咨询专知VIP会员