开源开放 | Gowild 狗尾草“七律”知识图谱进入 OpenKG,开放 8000 万中文百科知识三元组数据

2019 年 4 月 14 日 开放知识图谱

项目网站: https://ai.gowild.cn/kg

OpenKG发布地址: http://openkg.cn/dataset/7lore

狗尾草科技:https://www.gowild.cn


1.七律开放知识图谱简介

作为人工智能技术的重要分支,知识图谱自2012年被提出并成功应用后,就获得了迅速发展,成为推动互联网及AI发展的“重要武器”。

上海Gowild狗尾草人工智能研究院此次发布了中文开放知识图谱“七律”,及实体概念体系schema。七律知识图谱包含了事物、事实、概念、规则等信息,目前涵盖超过2亿个实体和超过30亿条关系,并且每天保持稳定地增量学习和增长。

七律,源自于Gowild狗尾草旗下AI虚拟生命琥珀家乡(瓦歌世界)中魔法体系的高度抽象和理解,根据理解的层次和强弱共分为七层,称之为“七律”。七律知识图谱沿用了“七律”这一名称,将这种对于知识的抽象理解延伸至人类世界,将以结构化实体、关系为核心的百科知识图谱定作为基石的第七律,并把概念、常识、空间等复杂知识作为目标逐步抽象上层完善,最终形成真正的七律。

用户可通过七律官网:https://ai.gowild.cn/kg进行访问,目前支持三类知识查询:

  • QA 查询支持自然语言问句查询,返回问句答案,例如问句“美人鱼的导演是谁”,答案为“周星驰”

  • 实体查询支持mention-level的实体关键词查询,返回相关匹配的实体,并包含消歧字段,例如“三体”,返回结果包括“刘慈欣著科幻小说-三体”、“ 书法名词-三体”等

  • 概念查询支持mention-level的概念关键词查询,返回相关的上下位概念和同义词概念,例如“妻子”的父类(上位)概念为“配偶”,同义概念包括“媳妇”、“老婆”等



2.开放数据简介

本数据集包含百科事实三元组,即(s,p, o)形式,可用于构建百科知识图谱、抽取领域知识子图、构建冷启动训练数据等任务。本开放数据为七律的子集,后续将持续加大开放。

用户可通过访问OpenKG进行下载:http://openkg.cn/dataset/7lore

数据详情:

  • 数据类型:百科三元组

  • 数据量:8000万条

  • 数据格式:csv

  • 实体信息最新更新时间:2019-03-01

数据样例:

s, p, o

锅饺, 中文名, 锅饺

锅饺, 主要食材, 饺子

锅饺, 辅料, 油

锅饺, 辅料, 陈醋

锅饺, tag, 食品

陈醋, 外文名,  MATURE VINEGAR

陈醋, 主要原料, 大米

陈醋, 发源地, 山西省-太原市

陈醋, 主要食用功效,  散瘀

3.知识图谱助力构建AI虚拟生命

知识图谱是人类知识数据化的结晶,同时也是AI虚拟生命的“大脑”。通过多年潜心研发,Gowild人工智能研究院推出了GAVE虚拟生命引擎,并将其应用于AI虚拟生命“琥珀虚颜”,而知识图谱是让其理解、学习人类世界的重要工具。

与其他人工智能不同的是,AI虚拟生命不仅能够执行命令,还可以与人类进行语音、视觉的沟通交流,甚至有自己的生活轴和情绪输出。知识图谱是未来人工智能实现从感知到认知跨越的重要基石之一,随着数据红利的消失,以大数据和深度学习为基础的感知智能会遭遇天花板。不断更新的七律开放知识图谱,则为AI虚拟生命处理各种通用型任务、掌握客观常识、主动进行推理联想等认知能力提供了可能。

核心研发人员张凯工程师表示,七律的开放也是希望能吸引更多有志者参与到知识共享中,共同构建和完善知识金字塔。Gowild 狗尾草 AI Lab 负责人邵浩博士认为,我们人类当前所能达到的知识结构化和数字化即处于第七律这个层次,还需要无数科学家献身人工智能,为达到更高成果而努力。

 



OpenKG


开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,下载「七律」数据集。 

登录查看更多
11

相关内容

知识图谱(Knowledge Graph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。 知识图谱是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。它能为学科研究提供切实的、有价值的参考。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【IJCAI2020】图神经网络预测结构化实体交互
专知会员服务
42+阅读 · 2020年5月13日
【SIGMOD2020-腾讯】Web规模本体可扩展构建
专知会员服务
29+阅读 · 2020年4月12日
【阿里技术干货】知识结构化在阿里小蜜中的应用
专知会员服务
96+阅读 · 2019年12月14日
知识图谱更新技术研究及其应用,复旦大学硕士论文
专知会员服务
103+阅读 · 2019年11月4日
中文知识图谱构建技术以及应用的综述
专知会员服务
312+阅读 · 2019年10月19日
[综述]基于深度学习的开放领域对话系统研究综述
专知会员服务
78+阅读 · 2019年10月12日
史上最大规模:这有一份1.4亿的中文开源知识图谱
机器之心
25+阅读 · 2019年10月17日
最全中文自然语言处理数据集、平台和工具整理
深度学习与NLP
34+阅读 · 2019年6月22日
科普 | 典型的知识库/链接数据/知识图谱项目
开放知识图谱
15+阅读 · 2017年10月13日
推荐|中文通用百科知识图谱(CN-DBpedia)
全球人工智能
26+阅读 · 2017年9月15日
【推荐】中文通用知识图谱(CN-DBpedia)
机器学习研究会
31+阅读 · 2017年9月15日
徐波 | 百科知识图谱构建
开放知识图谱
13+阅读 · 2017年9月11日
Reasoning on Knowledge Graphs with Debate Dynamics
Arxiv
14+阅读 · 2020年1月2日
Arxiv
9+阅读 · 2018年10月18日
Arxiv
7+阅读 · 2018年3月21日
VIP会员
相关VIP内容
相关资讯
史上最大规模:这有一份1.4亿的中文开源知识图谱
机器之心
25+阅读 · 2019年10月17日
最全中文自然语言处理数据集、平台和工具整理
深度学习与NLP
34+阅读 · 2019年6月22日
科普 | 典型的知识库/链接数据/知识图谱项目
开放知识图谱
15+阅读 · 2017年10月13日
推荐|中文通用百科知识图谱(CN-DBpedia)
全球人工智能
26+阅读 · 2017年9月15日
【推荐】中文通用知识图谱(CN-DBpedia)
机器学习研究会
31+阅读 · 2017年9月15日
徐波 | 百科知识图谱构建
开放知识图谱
13+阅读 · 2017年9月11日
Top
微信扫码咨询专知VIP会员