读书报告 | CN-DBpedia: A Chinese Knowledge Extraction System - 专知

会员服务 ·

1

读书报告 | CN-DBpedia: A Chinese Knowledge Extraction System

2018 年 1 月 4 日 科技创新与创业 李浩然

论文信息

CN-DBpedia: A Never-Ending Chinese Knowledge Extraction System

作者：Bo Xu1, Yong Xu1, Jiaqing Liang1,2, Chenhao Xie1,2, Bin Liang1, Wanyun Cui1, and Yanghua Xiao

学校：复旦大学

简介

这篇论文利用现存的英文知识图谱DBpedia，提出了一种不需要过多人力参与的框架，来从百度百科等中文百科中构建中文知识图谱。
其中比较关键的两个步骤：1.对于实体进行类型推断 2.从文本中抽取关系

框架

抽取：包括爬取网页，解析网页，抽取结构化的信息
归一化：对于表达相同概念的属性和属性值进行归一化
补充：进行跨语言的实体链接和实体类型推断
改正：1.基于规则的改正（如要求主谓语的类型匹配）。2.基于用户反馈
更新：基于当前网络中的热点对知识图谱进行动态更新

类型推断

类型推断是实体在知识图谱中的重要语义信息，需要应用都需要用到这个信息。传统的方法依赖大量的标注数据，而本论文利用DBpedia来自动构造一个可用的标注数据。

步骤：

依据DBpedia中的实体和中文实体的名字的完全匹配，找到一些匹配的实体对。那么DBpedia中的实体类型就可以赋予给对应的中文实体。
依据以下特征训练一个多类分类器。

中文实体的种类（歌手，演员）
实体属性（职业）
实体属性和属性的值（职业——演员）

关系抽取

使用中文实体的infobox信息作为distant supervision的已知知识，对每种关系单独训练一个宾语抽取器。使用的模型是BI-LSTM。 distant supervision: 若三元组⟨Leonardo DiCaprio, BirthPlace, Hollywood⟩出现在Leonardo DiCaprio的infobox中，那么就可以标注句子... DiCaprio was born in Hollywood, California, the only child of ...中的Hollywood和California是BirthPlace的宾语。

总结

这篇论文提出的利用现有的英文源知识图谱构建中文知识图谱的方法是可以借鉴的。但是论文对其中比较重要的归一化是如何做的并没有说明。我在他们开放的API网站进行搜索，但是搜索到的实体关系都是在百度的infobox中可以找到的。

作者：李浩然，北京大学在读硕士。

登录查看更多

19

相关内容

DBpedia

DBpedia 是一个很特殊的语义网应用范例，它从维基百科(Wikipedia)的词条里撷取出结构化的资料，以强化维基百科的搜寻功能，并将其他资料集连结至维基百科。

COVID-19文献知识图谱构建，UIUC-哥伦比亚大学

COVID-19文献知识图谱构建，UIUC-哥伦比亚大学

专知会员服务

43+阅读 · 2020年7月2日

KG-BERT：基于BERT的知识图谱补全，KG-BERT: BERT for Knowledge Graph Completion

KG-BERT：基于BERT的知识图谱补全，KG-BERT: BERT for Knowledge Graph Completion

专知会员服务

195+阅读 · 2020年5月31日

【IJCAI2020-南京大学】用紧凑、有代表性的相关知识图谱丰富文档，Enriching Documents with Compact, Representative, Relevant Knowledge Graphs

【IJCAI2020-南京大学】用紧凑、有代表性的相关知识图谱丰富文档，Enriching Documents with Compact, Representative, Relevant Knowledge Graphs

专知会员服务

17+阅读 · 2020年5月4日

【2020关键词提取】使用多个本地功能从单个文档中提取关键字，YAKE! Keyword extraction from single documents using multiple local features

【2020关键词提取】使用多个本地功能从单个文档中提取关键字，YAKE! Keyword extraction from single documents using multiple local features

专知会员服务

26+阅读 · 2020年5月2日

【2020关键词提取】医学报告的关键词提取和结构化，Keyword extraction and structuralization of medical reports

【2020关键词提取】医学报告的关键词提取和结构化，Keyword extraction and structuralization of medical reports

专知会员服务

33+阅读 · 2020年5月2日

【WWW2020-南京大学】长尾实体开放知识充实，Open Knowledge Enrichment

【WWW2020-南京大学】长尾实体开放知识充实，Open Knowledge Enrichment

专知会员服务

37+阅读 · 2020年2月24日

【AAAI2020知识图谱论文概述】Knowledge Graphs @ AAAI 2020

【AAAI2020知识图谱论文概述】Knowledge Graphs @ AAAI 2020

专知会员服务

134+阅读 · 2020年2月13日

【ISWC2019教程】可扩展可持续知识图谱构建，251页ppt，Scalable construction of sustainable knowledge bases

【ISWC2019教程】可扩展可持续知识图谱构建，251页ppt，Scalable construction of sustainable knowledge bases

专知会员服务

47+阅读 · 2019年12月1日

【论文|知识图谱】小样本知识图谱补全，Few-Shot Knowledge Graph Completion

【论文|知识图谱】小样本知识图谱补全，Few-Shot Knowledge Graph Completion

专知会员服务

121+阅读 · 2019年11月30日

知识图谱本体结构构建论文合集

知识图谱本体结构构建论文合集

专知会员服务

110+阅读 · 2019年10月9日

技术动态 | 知识图谱上的实体链接

技术动态 | 知识图谱上的实体链接

开放知识图谱

69+阅读 · 2019年9月8日

【论文】Awesome Relation Extraction Paper（关系抽取）（PART V）

【论文】Awesome Relation Extraction Paper（关系抽取）（PART V）

AINLP

38+阅读 · 2019年9月3日

【论文】Awesome Relation Extraction Paper（关系抽取）（PART IV）

【论文】Awesome Relation Extraction Paper（关系抽取）（PART IV）

AINLP

15+阅读 · 2019年8月26日

【论文】Awesome Relation Extraction Paper（关系抽取）（PART III）

【论文】Awesome Relation Extraction Paper（关系抽取）（PART III）

AINLP

25+阅读 · 2019年8月21日

论文浅尝 | Zero-Shot Transfer Learning for Event Extraction

论文浅尝 | Zero-Shot Transfer Learning for Event Extraction

开放知识图谱

26+阅读 · 2018年11月1日

论文浅尝 | Distant Supervision for Relation Extraction

论文浅尝 | Distant Supervision for Relation Extraction

开放知识图谱

4+阅读 · 2017年12月25日

【知识图谱】基于神经网络的实体识别和关系抽取联合学习

【知识图谱】基于神经网络的实体识别和关系抽取联合学习

产业智能官

25+阅读 · 2017年12月6日

基于Wikipedia知识源的开放领域问答系统（读书报告）

基于Wikipedia知识源的开放领域问答系统（读书报告）

科技创新与创业

9+阅读 · 2017年11月7日

【推荐】中文通用知识图谱（CN-DBpedia）

【推荐】中文通用知识图谱（CN-DBpedia）

机器学习研究会

31+阅读 · 2017年9月15日

徐波 | 百科知识图谱构建

徐波 | 百科知识图谱构建

开放知识图谱

13+阅读 · 2017年9月11日

Knowledge Graphs

Arxiv

102+阅读 · 2020年3月4日

Span-based Joint Entity and Relation Extraction with Transformer Pre-training

Arxiv

7+阅读 · 2019年9月17日

Learning Attention-based Embeddings for Relation Prediction in Knowledge Graphs

Arxiv

40+阅读 · 2019年6月4日

Span Based Open Information Extraction

Arxiv

3+阅读 · 2019年3月1日

Unifying Knowledge Graph Learning and Recommendation: Towards a Better Understanding of User Preferences

Arxiv

6+阅读 · 2019年2月17日

Rapid Customization for Event Extraction

Rapid Customization for Event Extraction

Arxiv

7+阅读 · 2018年9月20日

The Vadalog System: Datalog-based Reasoning for Knowledge Graphs

The Vadalog System: Datalog-based Reasoning for Knowledge Graphs

Arxiv

5+阅读 · 2018年7月23日

Entity-Duet Neural Ranking: Understanding the Role of Knowledge Graph Semantics in Neural Information Retrieval

Arxiv

7+阅读 · 2018年6月3日

DSGAN: Generative Adversarial Training for Distant Supervision Relation Extraction

Arxiv

15+阅读 · 2018年5月24日

Global Relation Embedding for Relation Extraction

Arxiv

10+阅读 · 2018年4月19日

VIP会员

相关主题

相关VIP内容

COVID-19文献知识图谱构建，UIUC-哥伦比亚大学

COVID-19文献知识图谱构建，UIUC-哥伦比亚大学

专知会员服务

43+阅读 · 2020年7月2日

KG-BERT：基于BERT的知识图谱补全，KG-BERT: BERT for Knowledge Graph Completion

KG-BERT：基于BERT的知识图谱补全，KG-BERT: BERT for Knowledge Graph Completion

专知会员服务

195+阅读 · 2020年5月31日

【IJCAI2020-南京大学】用紧凑、有代表性的相关知识图谱丰富文档，Enriching Documents with Compact, Representative, Relevant Knowledge Graphs

【IJCAI2020-南京大学】用紧凑、有代表性的相关知识图谱丰富文档，Enriching Documents with Compact, Representative, Relevant Knowledge Graphs

专知会员服务

17+阅读 · 2020年5月4日

【2020关键词提取】使用多个本地功能从单个文档中提取关键字，YAKE! Keyword extraction from single documents using multiple local features

【2020关键词提取】使用多个本地功能从单个文档中提取关键字，YAKE! Keyword extraction from single documents using multiple local features

专知会员服务

26+阅读 · 2020年5月2日

【2020关键词提取】医学报告的关键词提取和结构化，Keyword extraction and structuralization of medical reports

【2020关键词提取】医学报告的关键词提取和结构化，Keyword extraction and structuralization of medical reports

专知会员服务

33+阅读 · 2020年5月2日

【WWW2020-南京大学】长尾实体开放知识充实，Open Knowledge Enrichment

【WWW2020-南京大学】长尾实体开放知识充实，Open Knowledge Enrichment

专知会员服务

37+阅读 · 2020年2月24日

【AAAI2020知识图谱论文概述】Knowledge Graphs @ AAAI 2020

【AAAI2020知识图谱论文概述】Knowledge Graphs @ AAAI 2020

专知会员服务

134+阅读 · 2020年2月13日

【ISWC2019教程】可扩展可持续知识图谱构建，251页ppt，Scalable construction of sustainable knowledge bases

【ISWC2019教程】可扩展可持续知识图谱构建，251页ppt，Scalable construction of sustainable knowledge bases

专知会员服务

47+阅读 · 2019年12月1日

【论文|知识图谱】小样本知识图谱补全，Few-Shot Knowledge Graph Completion

【论文|知识图谱】小样本知识图谱补全，Few-Shot Knowledge Graph Completion

专知会员服务

121+阅读 · 2019年11月30日

知识图谱本体结构构建论文合集

知识图谱本体结构构建论文合集

专知会员服务

110+阅读 · 2019年10月9日

热门VIP内容

开通专知VIP会员享更多权益服务

大语言模型智能体强化学习：全景综述

《城市滨海地区：理解复杂多变环境下的指挥控制框架》50页报告

【伯克利博士论文】从推理服务到训练：面向大规模 LLM 智能体的高效系统

美空军“顶点2025”实验：推进AI在C2、动态目标锁定与联盟集成中的应用

相关资讯

技术动态 | 知识图谱上的实体链接

技术动态 | 知识图谱上的实体链接

开放知识图谱

69+阅读 · 2019年9月8日

【论文】Awesome Relation Extraction Paper（关系抽取）（PART V）

【论文】Awesome Relation Extraction Paper（关系抽取）（PART V）

AINLP

38+阅读 · 2019年9月3日

【论文】Awesome Relation Extraction Paper（关系抽取）（PART IV）

【论文】Awesome Relation Extraction Paper（关系抽取）（PART IV）

AINLP

15+阅读 · 2019年8月26日

【论文】Awesome Relation Extraction Paper（关系抽取）（PART III）

【论文】Awesome Relation Extraction Paper（关系抽取）（PART III）

AINLP

25+阅读 · 2019年8月21日

论文浅尝 | Zero-Shot Transfer Learning for Event Extraction

论文浅尝 | Zero-Shot Transfer Learning for Event Extraction

开放知识图谱

26+阅读 · 2018年11月1日

论文浅尝 | Distant Supervision for Relation Extraction

论文浅尝 | Distant Supervision for Relation Extraction

开放知识图谱

4+阅读 · 2017年12月25日

【知识图谱】基于神经网络的实体识别和关系抽取联合学习

【知识图谱】基于神经网络的实体识别和关系抽取联合学习

产业智能官

25+阅读 · 2017年12月6日

基于Wikipedia知识源的开放领域问答系统（读书报告）

基于Wikipedia知识源的开放领域问答系统（读书报告）

科技创新与创业

9+阅读 · 2017年11月7日

【推荐】中文通用知识图谱（CN-DBpedia）

【推荐】中文通用知识图谱（CN-DBpedia）

机器学习研究会

31+阅读 · 2017年9月15日

徐波 | 百科知识图谱构建

徐波 | 百科知识图谱构建

开放知识图谱

13+阅读 · 2017年9月11日

相关论文

Knowledge Graphs

Arxiv

102+阅读 · 2020年3月4日

Span-based Joint Entity and Relation Extraction with Transformer Pre-training

Arxiv

7+阅读 · 2019年9月17日

Learning Attention-based Embeddings for Relation Prediction in Knowledge Graphs

Arxiv

40+阅读 · 2019年6月4日

Span Based Open Information Extraction

Arxiv

3+阅读 · 2019年3月1日

Unifying Knowledge Graph Learning and Recommendation: Towards a Better Understanding of User Preferences

Arxiv

6+阅读 · 2019年2月17日

Rapid Customization for Event Extraction

Rapid Customization for Event Extraction

Arxiv

7+阅读 · 2018年9月20日

The Vadalog System: Datalog-based Reasoning for Knowledge Graphs

The Vadalog System: Datalog-based Reasoning for Knowledge Graphs

Arxiv

5+阅读 · 2018年7月23日

Entity-Duet Neural Ranking: Understanding the Role of Knowledge Graph Semantics in Neural Information Retrieval

Arxiv

7+阅读 · 2018年6月3日

DSGAN: Generative Adversarial Training for Distant Supervision Relation Extraction

Arxiv

15+阅读 · 2018年5月24日

Global Relation Embedding for Relation Extraction

Arxiv

10+阅读 · 2018年4月19日

大家都在搜

大型语言模型

朱克爱德华兹家族

蓝牙安全攻防

【论文笔记】用于数据驱动交通预测的扩散卷积循环神经网络（DCRNN）

微信扫码咨询专知VIP会员