论文浅尝 | Iterative Cross-Lingual Entity Alignment Based on TransC - 专知

会员服务 ·

0

论文浅尝 | Iterative Cross-Lingual Entity Alignment Based on TransC

2020 年 7 月 3 日 开放知识图谱

论文笔记整理：谭亦鸣，东南大学博士。

来源：IEICE TRANSACTIONS on Information and Systems, 2020, 103(5): 1002-1005.

链接：

https://www.jstage.jst.go.jp/article/transinf/E103.D/5/E103.D_2019DAL0001/_pdf

介绍

这篇论文关注的任务是跨语言实体对齐，目标是将不同语言知识库中具有相同语义的实体相匹配。作者认为不同语言的知识图谱可能具备相同的本体划分，这一点对于实体对齐来说可能起到作用。（在作者的了解范围里，目前还没有实体对齐工作是基于本体信息的，但是多语言知识图谱如DBpedia，是先构建了统一的本体划分，然后再遵循这一划分构建各个语言版本的知识图谱，如下图）

为了验证这一猜测，本文提出了一个基于TransC的embedding模型：首先由TransC以及参数共享模型将图谱中所有的实体和关系映射到一个共享的低维语义空间；之后模型迭代通过reinitalization以及soft alignment（软对齐）策略提升实体对齐的性能。

实验结果显示，相对于benchmark算法，本文方法可以有效的利用本体信息，从而得到更好的结果。

P.S. 需要说明的是，本文使用到的本体间关系只有“SubclassOf”这一个。

模型

模型整体可以分为三个部分：

a. Knowledge embedding part

首先是对实例的embedding：TransE被用于对三元组中的实体和关系进行embedding，投影到一个低维空间中

之后是对实体的InstanceOf三元组的embedding：这种三元组的构成为(实体，InstanceOf，实体对应的本体类型)，TransC将每个类型对应的向量建模为一个球型空间s(p,m)，其中p表示球心，m表示球的半径，对于一个InstanceOf三元组，其对应的energy function为：

其中e为e的向量表示。

整体三元组的得分计算为：

最后是SubClassOf triple embedding：这个部分主要是反应不同类型的本体之间的相对位置，因此计算的方式通过球形空间的相对位置来衡量，即：

b. Joint embedding part

本文使用的参数共享模型基于MTransE(IJCAI 2017)构成，其目的是基于ILLs（DBpedia提供的已知多语言实体对齐），将已知对齐实体embedding，在训练过程中强制对等。

c. Alignment part

为了弥补标注数据（已知对齐）的不足，这一步的普遍方案是使用训练得到的模型对未标注数据进行对齐标注，然后使用新的标注数据作为训练集迭代的更新模型，但是这种过程必然引入错误对齐。作者提出了两个策略处理这个问题：

1)Reinitialization

在每轮迭代中，首先训练multilingual knowledge embedding直至验证集上的效果边差，而后对于那些embedding相似性高于预设阈值的实体对，将具有最高相似性的样本选入ILLs，构成新的标注集。之后对knowledge做重新初始化，并且开始新的迭代训练。

2)Soft Alignment

3)对于更新的标注集中的实体对，这里参照Soft Alignmen(IJCAI 2017)定义的得分函数：

对于不同语言的KG1和KG2，更新的标注集不会被用于参数共享模型，而是仅仅用于对齐训练

实验

实验数据：

作者基于DBpedia构建了一个多语言知识图谱，包含英-法以及英-德两种语言对。

其构建过程为：首先随机的从ILLs中抽取1000个实体对，而后利用这些实体对在ILLs中找到其他包含对齐实体的三元组（但是不在1000样本中，例如A-B对齐，借助ILLs找到(A, r1, C)，(B, r2, D)，其中，C和D在ILLs中是对齐实体，这些将被用于测试模型的对齐性能）

数据集的统计信息如下表所示

实验结果：

跨语言实体对齐实验结果如下表，其中Ps-TransC(RE+SA)是本文方法，其他Ps为本文方法的变体，作为对照组，参考的其他方法为LM（Linear Mapping）以及MTransE。

OpenKG

开放知识图谱（简称 OpenKG）旨在促进中文知识图谱数据的开放与互联，促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文，进入 OpenKG 博客。

登录查看更多

0

相关内容

实体对齐

实体对齐（Entity Alignment）也被称作实体匹配（Entity Matching），是指对于异构数据源知识库中的各个实体，找出属于现实世界中的同一实体。实体对齐常用的方法是利用实体的属性信息判定不同源实体是否可进行对齐。

【IJCAJ 2019】多视角知识图谱嵌入的实体对齐，Multi-view Knowledge Graph Embedding for Entity Alignment

【IJCAJ 2019】多视角知识图谱嵌入的实体对齐，Multi-view Knowledge Graph Embedding for Entity Alignment

专知会员服务

59+阅读 · 2020年6月30日

【NeurIPS 2019】多关系庞加莱图嵌入，Multi-relational Poincaré Graph Embeddings

【NeurIPS 2019】多关系庞加莱图嵌入，Multi-relational Poincaré Graph Embeddings

专知会员服务

49+阅读 · 2020年6月15日

超越三元组:基于超关系知识图谱嵌入的链接预测，Beyond Triplets: Hyper-Relational Knowledge Graph Embedding for Link Prediction

专知会员服务

78+阅读 · 2020年5月11日

【知识图谱嵌入补全综述论文】embedding models for knowledge base completion

【知识图谱嵌入补全综述论文】embedding models for knowledge base completion

专知会员服务

103+阅读 · 2020年4月25日

【ACL2019】基于学习注意力机制的知识图谱中关系预测的嵌入 Learning Attention-based Embeddings for Relation Prediction in Knowledge Graphs

【ACL2019】基于学习注意力机制的知识图谱中关系预测的嵌入 Learning Attention-based Embeddings for Relation Prediction in Knowledge Graphs

专知会员服务

122+阅读 · 2020年3月29日

【AAAI2020知识图谱论文概述】Knowledge Graphs @ AAAI 2020

【AAAI2020知识图谱论文概述】Knowledge Graphs @ AAAI 2020

专知会员服务

134+阅读 · 2020年2月13日

17篇知识图谱Knowledge Graphs论文 @AAAI2020

17篇知识图谱Knowledge Graphs论文 @AAAI2020

专知会员服务

172+阅读 · 2020年2月13日

【AAAI2020】知识图谱的生成式对抗零样本关系学习，Generative Adversarial Zero-Shot Relational Learning for Knowledge Graphs

【AAAI2020】知识图谱的生成式对抗零样本关系学习，Generative Adversarial Zero-Shot Relational Learning for Knowledge Graphs

专知会员服务

64+阅读 · 2020年1月11日

【AAAI2020论文】无监督归属多路网络嵌入， Unsupervised Attributed Multiplex Network Embedding (附pdf)

专知会员服务

39+阅读 · 2019年11月19日

【AAAI2020论文-清华大学】Enhanced Meta-Learning for Cross-lingual Named Entity Recognition with Minimal Resources，最小资源增强的元学习跨语言命名实体识别

【AAAI2020论文-清华大学】Enhanced Meta-Learning for Cross-lingual Named Entity Recognition with Minimal Resources，最小资源增强的元学习跨语言命名实体识别

专知会员服务

31+阅读 · 2019年11月17日

论文浅尝 | 基于图匹配神经网络的跨语言知识图对齐 (ACL 2019)

论文浅尝 | 基于图匹配神经网络的跨语言知识图对齐 (ACL 2019)

开放知识图谱

15+阅读 · 2019年11月30日

【论文】Awesome Relation Extraction Paper（关系抽取）（PART V）

【论文】Awesome Relation Extraction Paper（关系抽取）（PART V）

AINLP

38+阅读 · 2019年9月3日

论文浅尝 | 面向知识图谱补全的共享嵌入神经网络模型

论文浅尝 | 面向知识图谱补全的共享嵌入神经网络模型

开放知识图谱

31+阅读 · 2019年4月7日

论文浅尝 | 基于属性嵌入的知识图谱间实体对齐方法

论文浅尝 | 基于属性嵌入的知识图谱间实体对齐方法

开放知识图谱

30+阅读 · 2019年3月26日

论文浅尝 | Interaction Embeddings for Prediction and Explanation

论文浅尝 | Interaction Embeddings for Prediction and Explanation

开放知识图谱

11+阅读 · 2019年2月1日

论文浅尝 | 区分概念和实例的知识图谱嵌入方法

论文浅尝 | 区分概念和实例的知识图谱嵌入方法

开放知识图谱

17+阅读 · 2019年1月19日

论文浅尝 | 基于知识图谱嵌入的 Bootstrapping 实体对齐方法

论文浅尝 | 基于知识图谱嵌入的 Bootstrapping 实体对齐方法

开放知识图谱

17+阅读 · 2019年1月5日

论文浅尝 | 面向跨语言实体对齐的知识图谱与实体描述协同嵌入方法

论文浅尝 | 面向跨语言实体对齐的知识图谱与实体描述协同嵌入方法

开放知识图谱

11+阅读 · 2018年10月4日

论文浅尝 | Hike: A Hybrid Human-Machine Method for Entity Alignment

论文浅尝 | Hike: A Hybrid Human-Machine Method for Entity Alignment

机器学习研究会

6+阅读 · 2018年1月6日

论文浅尝 | Distant Supervision for Relation Extraction

论文浅尝 | Distant Supervision for Relation Extraction

开放知识图谱

4+阅读 · 2017年12月25日

Improving Candidate Generation for Low-resource Cross-lingual Entity Linking

Arxiv

8+阅读 · 2020年3月3日

Open Knowledge Enrichment for Long-tail Entities

Arxiv

6+阅读 · 2020年2月15日

Zero-Resource Cross-Lingual Named Entity Recognition

Arxiv

5+阅读 · 2019年11月22日

Multi-view Knowledge Graph Embedding for Entity Alignment

Arxiv

36+阅读 · 2019年6月6日

Cross-lingual Knowledge Graph Alignment via Graph Matching Neural Network

Arxiv

15+阅读 · 2019年5月28日

Matching Entities Across Different Knowledge Graphs with Graph Embeddings

Arxiv

3+阅读 · 2019年3月15日

Embedding Logical Queries on Knowledge Graphs

Embedding Logical Queries on Knowledge Graphs

Arxiv

5+阅读 · 2018年9月6日

EARL: Joint Entity and Relation Linking for Question Answering over Knowledge Graphs

EARL: Joint Entity and Relation Linking for Question Answering over Knowledge Graphs

Arxiv

4+阅读 · 2018年6月25日

Entity-aware Image Caption Generation

Arxiv

7+阅读 · 2018年4月21日

Baselines and test data for cross-lingual inference

Arxiv

3+阅读 · 2018年3月2日

VIP会员

相关主题

本体（信息科学）

相关VIP内容

【IJCAJ 2019】多视角知识图谱嵌入的实体对齐，Multi-view Knowledge Graph Embedding for Entity Alignment

【IJCAJ 2019】多视角知识图谱嵌入的实体对齐，Multi-view Knowledge Graph Embedding for Entity Alignment

专知会员服务

59+阅读 · 2020年6月30日

【NeurIPS 2019】多关系庞加莱图嵌入，Multi-relational Poincaré Graph Embeddings

【NeurIPS 2019】多关系庞加莱图嵌入，Multi-relational Poincaré Graph Embeddings

专知会员服务

49+阅读 · 2020年6月15日

超越三元组:基于超关系知识图谱嵌入的链接预测，Beyond Triplets: Hyper-Relational Knowledge Graph Embedding for Link Prediction

专知会员服务

78+阅读 · 2020年5月11日

【知识图谱嵌入补全综述论文】embedding models for knowledge base completion

【知识图谱嵌入补全综述论文】embedding models for knowledge base completion

专知会员服务

103+阅读 · 2020年4月25日

【ACL2019】基于学习注意力机制的知识图谱中关系预测的嵌入 Learning Attention-based Embeddings for Relation Prediction in Knowledge Graphs

【ACL2019】基于学习注意力机制的知识图谱中关系预测的嵌入 Learning Attention-based Embeddings for Relation Prediction in Knowledge Graphs

专知会员服务

122+阅读 · 2020年3月29日

【AAAI2020知识图谱论文概述】Knowledge Graphs @ AAAI 2020

【AAAI2020知识图谱论文概述】Knowledge Graphs @ AAAI 2020

专知会员服务

134+阅读 · 2020年2月13日

17篇知识图谱Knowledge Graphs论文 @AAAI2020

17篇知识图谱Knowledge Graphs论文 @AAAI2020

专知会员服务

172+阅读 · 2020年2月13日

【AAAI2020】知识图谱的生成式对抗零样本关系学习，Generative Adversarial Zero-Shot Relational Learning for Knowledge Graphs

【AAAI2020】知识图谱的生成式对抗零样本关系学习，Generative Adversarial Zero-Shot Relational Learning for Knowledge Graphs

专知会员服务

64+阅读 · 2020年1月11日

【AAAI2020论文】无监督归属多路网络嵌入， Unsupervised Attributed Multiplex Network Embedding (附pdf)

专知会员服务

39+阅读 · 2019年11月19日

【AAAI2020论文-清华大学】Enhanced Meta-Learning for Cross-lingual Named Entity Recognition with Minimal Resources，最小资源增强的元学习跨语言命名实体识别

【AAAI2020论文-清华大学】Enhanced Meta-Learning for Cross-lingual Named Entity Recognition with Minimal Resources，最小资源增强的元学习跨语言命名实体识别

专知会员服务

31+阅读 · 2019年11月17日

热门VIP内容

开通专知VIP会员享更多权益服务

大语言模型智能体强化学习：全景综述

《城市滨海地区：理解复杂多变环境下的指挥控制框架》50页报告

【伯克利博士论文】从推理服务到训练：面向大规模 LLM 智能体的高效系统

美空军“顶点2025”实验：推进AI在C2、动态目标锁定与联盟集成中的应用

相关资讯

论文浅尝 | 基于图匹配神经网络的跨语言知识图对齐 (ACL 2019)

论文浅尝 | 基于图匹配神经网络的跨语言知识图对齐 (ACL 2019)

开放知识图谱

15+阅读 · 2019年11月30日

【论文】Awesome Relation Extraction Paper（关系抽取）（PART V）

【论文】Awesome Relation Extraction Paper（关系抽取）（PART V）

AINLP

38+阅读 · 2019年9月3日

论文浅尝 | 面向知识图谱补全的共享嵌入神经网络模型

论文浅尝 | 面向知识图谱补全的共享嵌入神经网络模型

开放知识图谱

31+阅读 · 2019年4月7日

论文浅尝 | 基于属性嵌入的知识图谱间实体对齐方法

论文浅尝 | 基于属性嵌入的知识图谱间实体对齐方法

开放知识图谱

30+阅读 · 2019年3月26日

论文浅尝 | Interaction Embeddings for Prediction and Explanation

论文浅尝 | Interaction Embeddings for Prediction and Explanation

开放知识图谱

11+阅读 · 2019年2月1日

论文浅尝 | 区分概念和实例的知识图谱嵌入方法

论文浅尝 | 区分概念和实例的知识图谱嵌入方法

开放知识图谱

17+阅读 · 2019年1月19日

论文浅尝 | 基于知识图谱嵌入的 Bootstrapping 实体对齐方法

论文浅尝 | 基于知识图谱嵌入的 Bootstrapping 实体对齐方法

开放知识图谱

17+阅读 · 2019年1月5日

论文浅尝 | 面向跨语言实体对齐的知识图谱与实体描述协同嵌入方法

论文浅尝 | 面向跨语言实体对齐的知识图谱与实体描述协同嵌入方法

开放知识图谱

11+阅读 · 2018年10月4日

论文浅尝 | Hike: A Hybrid Human-Machine Method for Entity Alignment

论文浅尝 | Hike: A Hybrid Human-Machine Method for Entity Alignment

机器学习研究会

6+阅读 · 2018年1月6日

论文浅尝 | Distant Supervision for Relation Extraction

论文浅尝 | Distant Supervision for Relation Extraction

开放知识图谱

4+阅读 · 2017年12月25日

相关论文

Improving Candidate Generation for Low-resource Cross-lingual Entity Linking

Arxiv

8+阅读 · 2020年3月3日

Open Knowledge Enrichment for Long-tail Entities

Arxiv

6+阅读 · 2020年2月15日

Zero-Resource Cross-Lingual Named Entity Recognition

Arxiv

5+阅读 · 2019年11月22日

Multi-view Knowledge Graph Embedding for Entity Alignment

Arxiv

36+阅读 · 2019年6月6日

Cross-lingual Knowledge Graph Alignment via Graph Matching Neural Network

Arxiv

15+阅读 · 2019年5月28日

Matching Entities Across Different Knowledge Graphs with Graph Embeddings

Arxiv

3+阅读 · 2019年3月15日

Embedding Logical Queries on Knowledge Graphs

Embedding Logical Queries on Knowledge Graphs

Arxiv

5+阅读 · 2018年9月6日

EARL: Joint Entity and Relation Linking for Question Answering over Knowledge Graphs

EARL: Joint Entity and Relation Linking for Question Answering over Knowledge Graphs

Arxiv

4+阅读 · 2018年6月25日

Entity-aware Image Caption Generation

Arxiv

7+阅读 · 2018年4月21日

Baselines and test data for cross-lingual inference

Arxiv

3+阅读 · 2018年3月2日

大家都在搜

大型语言模型

蓝牙安全攻防

朱克爱德华兹家族

【泡泡读者来搞】ROS、Simulink、Carsim的互联与规划、控制算法的验证

微信扫码咨询专知VIP会员