声明:本文转载自 云孚科技 公众号
编者按:云孚科技总部位于北京市中关村国际孵化园,由哈尔滨工业大学社会计算与信息检索研究中心(HIT-SCIR)独家技术孵化。核心产品包括语义中台YFNLP、知识图谱YFKG和对话系统YFBOT。
知识图谱(Knowledge Graph)以结构化的形式描述客观世界中概念、实体及其关系,将信息表达成更接近人类认知世界的形式。目前,知识图谱正在逐步应用到各行各业,常见的知识图谱产品主要专注于将结构化、半结构化数据通过一系列规则转换为知识图谱,但不能有效处理文档、网页等非结构化数据,而非机构化数据的占比通常达到80%以上。针对这个问题,云孚科技自主研发了一整套知识图谱解决方案,可以从非结构化数据自动抽取知识,并自动融合到知识图谱中,从而达到海量非结构化数据的效用最大化。
01
云孚知识图谱是什么?
云孚知识图谱(YunFu Knowledge Graph,YFKG)是由云孚科技自主研发的一套面向知识应用全生命周期的知识图谱一站式解决方案,融合了哈尔滨工业大学社会计算与信息检索研究中心(HIT-SCIR)业内领先的自然语言处理、《大词林》等技术,并结合行业知识图谱实践经验进行了深度优化,可助力企业高效打造自己的知识计算平台,全面提升运行效率和决策智能化水平,有效解决企业生产运营中普遍存在的数据孤岛、知识查询不便、专家经验难以传承等问题。
(一)一站式、全生命周期的解决方案
YFKG提供了知识图谱的所有常规功能模块,包括数据标注、模型管理、知识建模、知识抽取、知识融合、知识搜索、知识问答、知识推荐等。用户无需关注底层实现细节,通过专门设计的知识图谱构建流水线,可以自定义知识图谱构建过程中的各个步骤,有效降低了知识图谱的构建难度、缩短开发周期。YFKG面向上层应用开发者,提供了丰富的API调用接口,不限开发语言,方便开发者基于构建好的知识图谱做二次开发。YFKG支持公有云和私有化部署,用户可灵活选择部署方式。
云孚知识图谱(YFKG)系统架构图
(二)基于深度学习的自动知识抽取
YFKG基于业内领先的深度自然语言处理技术,可以从非结构化数据中自动抽取实体、关系、属性、事件等知识,并自动融合到已有的知识图谱中,从而实现知识图谱24小时不间断地自动扩充,可有效扩大知识的覆盖率,同时保证知识的时效性。
(三)开放域事件追踪
YFKG支持在非结构化数据中进行开放域的事件抽取,并将知识图谱中事件涉及的实体与该事件进行关联,从而可以动态追踪知识图谱中实体关联的各类事件,并按时间线浏览,追踪事件的发展脉络。
(四)支持多模态数据
YFKG除了支持文本数据,还支持融合图像、视频、音频等多模态数据,能更有效地表示和理解真实世界的业务场景,让语义搜索、智能问答、推荐系统等上游任务更加智能,为用户带来更丰富的体验。
(五)支持事理图谱
事理图谱由HIT-SCIR于2017年首先提出,可以描述事件的演化规律和发展逻辑。YFKG紧跟知识图谱研究前沿,支持构建事理图谱,并通过实体和事件的关联,实现了事理图谱与知识图谱的融合。
02
云孚知识图谱能干什么?
云孚知识图谱的核心在于对多模、多源异构数据和多维复杂关系的高效处理与可视化展示,将社会生活与生产活动中难以用数学模型直接表示的关联属性,融合成一张以关系为纽带的数据网络,通过对关系的挖掘与分析,能够找到隐藏在行为之下的关联,并进行直观的展示。
云孚知识图谱能高效地处理数据和加工推理知识,推动升级人工智能既有产品或提供更有效的解决方案,同时也可以转化为新的商业产品形式。通过与知识图谱的配合使用,依托于行业知识与经验的深度学习将产生更多贴近产业核心的认知智能应用,有助于覆盖场景中大多数问题,形成完整的以“场景需求”为导向的人工智能解决方案,进一步实现生产力升级的终极目标。
03
云孚知识图谱成功案例
案例1:通用知识图谱
基于采集的网络资讯,将不同来源的各实体相关信息进行聚合,围绕实体进行全方面的介绍,自动构建通用知识图谱。目前系统包含1600多万实体和3亿多关系。
通用知识图谱
案例2:军事知识图谱
基于公开军事新闻,自动获取相关军事新闻并构建军事领域知识图谱。实现自动的实体识别,关系、事件、属性的抽取。在构建的知识图谱上可以进行相关信息检索,知识推理等等行业相关语义场景的应用。
军事知识图谱
案例3:医学知识图谱
对医学知识进行分析、识别、理解并关联,自动抽取医学实体及关系,构建医学知识图谱。提供展示及查询界面。同时可对现有医学知识抽取经典算法进行集成,并提供接口可对现有算法进行二次开发及新算法的在线调试,可对医学知识抽取工具进行多维度的优化。
医学知识图谱
案例4:金融事理图谱
基于腾讯、网易、和讯等网站的海量财经新闻文本,构建的金融领域的事理图谱。目前包含约134万事件节点和约140万的因果关系。
图12. 金融事理图谱
案例5:案件知识图谱
通过对判决书、口供等信息的定制化抽取和信息聚合,构建案件知识图谱,可帮助用户快速发现挖掘出嫌疑人员的上下级关系、团伙的组成、交易特点等信息,开展案情侦破。
案件知识图谱
04
关于云孚
云孚科技总部位于北京市中关村国际孵化园,由哈尔滨工业大学社会计算与信息检索研究中心(HIT-SCIR)独家技术孵化,致力为企业客户提供全生命周期的知识应用解决方案,助力企业认知升级。
核心产品包括语义中台YFNLP、知识图谱YFKG和对话系统YFBOT,囊括多项国际技术评测世界第一的成果和多项独家语义技术,广泛应用于互联网、金融、医疗、教育、电网、军工、汽车、消费电子等数十家行业头部客户。
公司目前已通过国家高新技术企业、双软企业、ISO9001、ISO27001等资质认证,荣获北京市中关村雏鹰人才企业、北京市中关村金种子企业等荣誉。
05
关于HIT-SCIR
哈尔滨工业大学社会计算与信息检索研究中心,简称HIT-SCIR,隶属于哈工大计算学部,深耕于自然语言处理和社会计算领域20年,以“理解语言,挖掘知识,认知社会”为口号,以”以中文技术助民族复兴”为理想,致力于句子级的语言分析、人机对话、篇章级的自然语言处理、社会计算等方向的研究。
HIT-SCIR已完成或正在承担的国家973课题、国家自然科学基金重点项目、国家863重点项目、国际合作、企业合作等课题60余项。近年来持续在自然语言处理和人工智能国际顶级会议ACL、SIGIR、KDD、AAAI、IJCAI、EMNLP上等发表多篇高水平论文。已将多项技术成果直接或间接地嵌入百度、腾讯、讯飞、金山等企业的产品中,并获得国家科技进步二等奖及黑龙江省科技进步一、二等奖。