论文浅尝 | Hike: A Hybrid Human-Machine Method for Entity Alignment - 专知

会员服务 ·

0

论文浅尝 | Hike: A Hybrid Human-Machine Method for Entity Alignment

2018 年 1 月 6 日 机器学习研究会

Zhuang Y,Li G, Zhong Z, et al. Hike: A Hybrid Human-Machine Method for Entity Alignmentin Large-Scale Knowledge Bases[C]// ACM, 2017:1917-1926. ( CIKM 2017 )

论文链接：http://dbgroup.cs.tsinghua.edu.cn/ligl/crowdalign.pdf

Motivation

随着语义网络的迅速发展，越来越多的大规模知识图谱公开发布，为了综合使用多个来源的知识图谱，首要步骤就是进行实体对齐(Entity Alignment)。近年来，许多研究者提出了自动化的实体对齐方法，但是，由于知识图谱数据的不均衡性，导致此类方法对齐质量较低，特别是召回率(Recall)。因此，可考虑借助于众包平台提升对齐效果，文章提出了一个人机协作的方法，对大规模知识图谱进行实体对齐。

Framework

方法主要流程如图所示：

首先，通过机器学习方法对知识库进行粗略的实体对齐，然后分别将以对齐实体对(MatchedPairs)和未对齐实体对(UnmatchedPairs)放入众包平台，让人进行判断。两条流水线的步骤类似，主要包括四个部分：实体集划分(EntityPartition)、建立偏序(PartialOrder Construction)、问题选择(QuestionSelection)、容错处理(ErrorTolerance)。

实体集划分的目的是将同类的实体聚类到一个集合，实体对齐只在集合内部进行，集合之间不进行对齐操作。实体集划分的依据是属性，通常同一类实体的属性是相似的。

偏序定义如下：

建立偏序的目的在于找出最具有推理期望(InferenceExpectation)的实体对，偏序集实例如下：

其中，如果P₁₁被判断为Unmatch，则所有偏序小于P₁₁的节点都可以推断为unmatch。反之，如果P₄₅被推断为Match,则所有偏序大于P₄₅的节点都可以推断为Match。

转自：开放知识图谱

完整内容请点击“阅读原文”

登录查看更多

6

相关内容

entity

【IJCAJ 2019】多视角知识图谱嵌入的实体对齐，Multi-view Knowledge Graph Embedding for Entity Alignment

【IJCAJ 2019】多视角知识图谱嵌入的实体对齐，Multi-view Knowledge Graph Embedding for Entity Alignment

专知会员服务

59+阅读 · 2020年6月30日

KG-BERT：基于BERT的知识图谱补全，KG-BERT: BERT for Knowledge Graph Completion

KG-BERT：基于BERT的知识图谱补全，KG-BERT: BERT for Knowledge Graph Completion

专知会员服务

195+阅读 · 2020年5月31日

【天津大学】知识图谱划分算法研究综述

【天津大学】知识图谱划分算法研究综述

专知会员服务

111+阅读 · 2020年4月27日

【SIGMOD2020】一个全面的主动学习方法的实体匹配基准框架，A Comprehensive Benchmark Framework for Active Learning Methods in Entity Matching

【SIGMOD2020】一个全面的主动学习方法的实体匹配基准框架，A Comprehensive Benchmark Framework for Active Learning Methods in Entity Matching

专知会员服务

24+阅读 · 2020年3月31日

【独立研究者I-Sheng Yang论文】因果机器学习损失函数（A Loss-Function for Causal Machine-Learning）

【独立研究者I-Sheng Yang论文】因果机器学习损失函数（A Loss-Function for Causal Machine-Learning）

专知会员服务

20+阅读 · 2020年1月7日

论文浅尝 | Interaction Embeddings for Prediction and Explanation

论文浅尝 | Interaction Embeddings for Prediction and Explanation

开放知识图谱

11+阅读 · 2019年2月1日

论文浅尝 | Zero-Shot Transfer Learning for Event Extraction

论文浅尝 | Zero-Shot Transfer Learning for Event Extraction

开放知识图谱

26+阅读 · 2018年11月1日

「知识图谱」领域近期值得读的 6 篇顶会论文

「知识图谱」领域近期值得读的 6 篇顶会论文

数盟

5+阅读 · 2018年1月29日

论文浅尝 | 「知识图谱」领域近期值得读的 6 篇顶会论文

论文浅尝 | 「知识图谱」领域近期值得读的 6 篇顶会论文

开放知识图谱

5+阅读 · 2018年1月19日

论文浅尝 | CFO: Conditional Focused Neural Question Answering

论文浅尝 | CFO: Conditional Focused Neural Question Answering

开放知识图谱

6+阅读 · 2017年12月15日

Span-based Joint Entity and Relation Extraction with Transformer Pre-training

Arxiv

7+阅读 · 2019年9月17日

Multi-view Knowledge Graph Embedding for Entity Alignment

Arxiv

36+阅读 · 2019年6月6日

Unifying Knowledge Graph Learning and Recommendation: Towards a Better Understanding of User Preferences

Arxiv

6+阅读 · 2019年2月17日

EARL: Joint Entity and Relation Linking for Question Answering over Knowledge Graphs

Arxiv

21+阅读 · 2018年1月16日

MatchZoo: A Toolkit for Deep Text Matching

Arxiv

5+阅读 · 2017年7月23日

VIP会员

相关主题

大规模知识图谱

相关VIP内容

【IJCAJ 2019】多视角知识图谱嵌入的实体对齐，Multi-view Knowledge Graph Embedding for Entity Alignment

【IJCAJ 2019】多视角知识图谱嵌入的实体对齐，Multi-view Knowledge Graph Embedding for Entity Alignment

专知会员服务

59+阅读 · 2020年6月30日

KG-BERT：基于BERT的知识图谱补全，KG-BERT: BERT for Knowledge Graph Completion

KG-BERT：基于BERT的知识图谱补全，KG-BERT: BERT for Knowledge Graph Completion

专知会员服务

195+阅读 · 2020年5月31日

【天津大学】知识图谱划分算法研究综述

【天津大学】知识图谱划分算法研究综述

专知会员服务

111+阅读 · 2020年4月27日

【SIGMOD2020】一个全面的主动学习方法的实体匹配基准框架，A Comprehensive Benchmark Framework for Active Learning Methods in Entity Matching

【SIGMOD2020】一个全面的主动学习方法的实体匹配基准框架，A Comprehensive Benchmark Framework for Active Learning Methods in Entity Matching

专知会员服务

24+阅读 · 2020年3月31日

【独立研究者I-Sheng Yang论文】因果机器学习损失函数（A Loss-Function for Causal Machine-Learning）

【独立研究者I-Sheng Yang论文】因果机器学习损失函数（A Loss-Function for Causal Machine-Learning）

专知会员服务

20+阅读 · 2020年1月7日

热门VIP内容

开通专知VIP会员享更多权益服务

从代码基础模型到智能体与应用：代码智能的全面综述与实践指南

《北约认知战概念报告》

【MIT博士论文】高效的视觉合成生成模型

美海军放弃星座级转而采用国家安全巡逻舰设计

相关资讯

论文浅尝 | Interaction Embeddings for Prediction and Explanation

论文浅尝 | Interaction Embeddings for Prediction and Explanation

开放知识图谱

11+阅读 · 2019年2月1日

论文浅尝 | Zero-Shot Transfer Learning for Event Extraction

论文浅尝 | Zero-Shot Transfer Learning for Event Extraction

开放知识图谱

26+阅读 · 2018年11月1日

「知识图谱」领域近期值得读的 6 篇顶会论文

「知识图谱」领域近期值得读的 6 篇顶会论文

数盟

5+阅读 · 2018年1月29日

论文浅尝 | 「知识图谱」领域近期值得读的 6 篇顶会论文

论文浅尝 | 「知识图谱」领域近期值得读的 6 篇顶会论文

开放知识图谱

5+阅读 · 2018年1月19日

论文浅尝 | CFO: Conditional Focused Neural Question Answering

论文浅尝 | CFO: Conditional Focused Neural Question Answering

开放知识图谱

6+阅读 · 2017年12月15日

相关论文

Span-based Joint Entity and Relation Extraction with Transformer Pre-training

Arxiv

7+阅读 · 2019年9月17日

Multi-view Knowledge Graph Embedding for Entity Alignment

Arxiv

36+阅读 · 2019年6月6日

Unifying Knowledge Graph Learning and Recommendation: Towards a Better Understanding of User Preferences

Arxiv

6+阅读 · 2019年2月17日

EARL: Joint Entity and Relation Linking for Question Answering over Knowledge Graphs

Arxiv

21+阅读 · 2018年1月16日

MatchZoo: A Toolkit for Deep Text Matching

Arxiv

5+阅读 · 2017年7月23日

大家都在搜

蓝牙安全攻防

大型语言模型

朱克爱德华兹家族

【泡泡读者来搞】ROS、Simulink、Carsim的互联与规划、控制算法的验证

微信扫码咨询专知VIP会员