论文浅尝 | Multilingual LAMA: 探索多语言预训练语言模型中的知识 - 专知

会员服务 ·

0

论文浅尝 | Multilingual LAMA: 探索多语言预训练语言模型中的知识

2021 年 11 月 11 日 开放知识图谱

笔记整理：谭亦鸣，东南大学博士生

来源：EACL‘21

链接：https://aclanthology.org/2021.eacl-main.284.pdf

概述

本文关注将语言模型（LM）视作一个知识库，然后用于解决例如句子填空这样的NLP任务，这个做法在单语言（英语）取得了不错的效果。因此在这篇论文里，作者着重关注了以m-BERT为代表的多语言语言模型是否也能作为多语言KG适用于多语言NLP场景。他将单语LAMA数据集翻译为53种语言，并使用m-BERT作为知识库进行了实验评估，着重关注了m-BERT的可用性，和在不同语言上的性能差异性。从实验效果来看，首先m-BERT在部分语言上能够实现和单语LAMA实验类似的效果，另一方面，m-BERT虽然基于104weikipedia训练得到，但是依然存在语言偏置

背景与动机

单语上，使用预训练模型作为知识库（不做微调的情况下）来完成一些自然语言处理任务例如简单的文本生成，模板填空等，已经被证明是有效的。既然LAMA在英语但遇上已经取得了许多研究进展，作者对多语言预训练模型上是否也同样有效产生好奇，论文主要围绕三个问题进行展开：

1.M-BERT是否也能被当作一个多语言知识库来使用，这对于方法发展的多样性和可用性非常重要2.M-BERT作为知识库是否在不同语言上有性能差异，或者它不受语言不同的影响3.M-BERT相比单语模型包含了更多语言（104种）的训练数据，这些是否会在性能上带来额外的影响

贡献

作者总结论文的主要贡献如下：

1.论文建立了一个多语言版本（覆盖53种语言）的TREx以及GooleRE2.提出了一种“实体类型+模板”的模式替换传统“挖空查询”，并证明它具有更好的效果3.实验论证了M-BERT在不同语言上回答查询的性能差别明显4.论文论证了M-BERT作为知识库应用时存在语言偏向，例如当查询由意大利语构成，那么查询得到的实体往往也是意大利语的5.跨语言池化预测能够大幅提升实验性能，甚至优于英语单语BERT

数据

作者沿用了LAMA的做法，也使用了TREx以及GoogleRE这两个数据集，两者都是由三元组构成。LAMA的思路是使用模板直接在预训练模型种查询三元组的内容，例如对于三元组(巴黎，首都，法国)，查询模板为：巴黎是___的首都。

TREx涵盖34,039个三元组，涉及41种关系类型，GoogleRE则包含5528三元组以及3种关系，每个关系对应的模板都是由人工制作的。

在LAMA的基础上，作者使用谷歌翻译将其模板翻译为其他语言，通过确定模板插槽是否被准确保留来验证翻译的准确性，并在必要的部分进行后处理修正。

M-BERT支持104种语言，谷歌翻译覆盖了其中的77种，维基百科和谷歌知识图谱都没有支持所有语言的实体翻译，并且也不是所有实体都被包含在知识图谱中。对于英语，作者找到共计37,498个三元组。平均下来，34%的三元组可以被翻译。最终构建得到mLAMA，其统计信息如图1。

实验

作者在实验中验证了两种查询构建模式：

1.沿用Petroni等人的做法，使用带有插槽的模板例如：巴黎是___的首都2.增加对于插槽实体的类型约束，从而解决部分歧义问题例如：汤姆出生在_____，插槽处即可能是地点，也可能是年份，添加类型约束解决了这个问题。

对于插槽本身，作者分析了两种情况：

1.限定插槽为单个token，反应在模板上就是 “汤姆出生在[_____]”2.设置插槽为多个token，即 “汤姆出生在[__][_]” 多个插槽的情况下，生成过程可以描述为连续的条件概率如下：

其中，e是实体，t是构成e的token序列

主要实验结果：

OpenKG

OpenKG（中文开放知识图谱）旨在推动以中文为核心的知识图谱数据的开放、互联及众包，并促进知识图谱算法、工具及平台的开源开放。

点击阅读原文，进入 OpenKG 网站。

登录查看更多

1

相关内容

LaMa

【AAAI 2022】XLM-K：通过多语言知识库提高跨语言预训练模型

【AAAI 2022】XLM-K：通过多语言知识库提高跨语言预训练模型

专知会员服务

27+阅读 · 2022年1月13日

【CIKM2021】用领域知识增强预训练语言模型的问题回答

【CIKM2021】用领域知识增强预训练语言模型的问题回答

专知会员服务

17+阅读 · 2021年11月18日

开放领域知识图谱问答研究综述

开放领域知识图谱问答研究综述

专知会员服务

64+阅读 · 2021年10月30日

基于预训练语言模型的文本生成研究综述

专知会员服务

82+阅读 · 2021年10月15日

知识感知的预训练语言模型综述

专知会员服务

51+阅读 · 2021年9月25日

【ACL2021】预训练语言模型的少样本知识图谱文本生成

专知会员服务

39+阅读 · 2021年6月6日

【知识图谱@EMNLP2020】Knowledge Graphs in NLP @ EMNLP 2020

【知识图谱@EMNLP2020】Knowledge Graphs in NLP @ EMNLP 2020

专知会员服务

43+阅读 · 2020年11月22日

1750亿参数！GPT-3来了！31位作者，OpenAI发布小样本学习器语言模型

1750亿参数！GPT-3来了！31位作者，OpenAI发布小样本学习器语言模型

专知会员服务

73+阅读 · 2020年5月30日

17篇知识图谱Knowledge Graphs论文 @AAAI2020

17篇知识图谱Knowledge Graphs论文 @AAAI2020

专知会员服务

172+阅读 · 2020年2月13日

【AAAI2020接受论文】隐式关系语言模型，CMU&微软，Latent Relation Language Models

【AAAI2020接受论文】隐式关系语言模型，CMU&微软，Latent Relation Language Models

专知会员服务

54+阅读 · 2019年11月12日

论文浅尝 - ACL2022 | 基于多语言语义解耦表示的跨语言迁移方法实现多语言阅读理解

论文浅尝 - ACL2022 | 基于多语言语义解耦表示的跨语言迁移方法实现多语言阅读理解

开放知识图谱

2+阅读 · 2022年4月8日

论文浅尝 | 改善多语言KGQA的 Zero-shot 跨语言转换

论文浅尝 | 改善多语言KGQA的 Zero-shot 跨语言转换

开放知识图谱

0+阅读 · 2022年2月26日

EMNLP 2021 最新综述：语言模型中的关系性知识

EMNLP 2021 最新综述：语言模型中的关系性知识

PaperWeekly

0+阅读 · 2021年12月3日

论文浅尝 | 重新审视语言模型与知识库的关系

论文浅尝 | 重新审视语言模型与知识库的关系

开放知识图谱

0+阅读 · 2021年10月3日

论文浅尝 | 通过知识到文本的转换进行知识增强的常识问答

论文浅尝 | 通过知识到文本的转换进行知识增强的常识问答

开放知识图谱

1+阅读 · 2021年9月20日

论文浅尝 | 问题多样性对于问答的帮助

论文浅尝 | 问题多样性对于问答的帮助

开放知识图谱

0+阅读 · 2021年8月26日

赛尔原创@ACL 2021 | 基于一致性正则的跨语言微调方法

赛尔原创@ACL 2021 | 基于一致性正则的跨语言微调方法

哈工大SCIR

0+阅读 · 2021年6月22日

论文浅尝 | XQA：一个跨语言开放域问答数据集

论文浅尝 | XQA：一个跨语言开放域问答数据集

开放知识图谱

26+阅读 · 2019年9月11日

ACL 2019 | 多语言BERT的语言表征探索

ACL 2019 | 多语言BERT的语言表征探索

AI科技评论

21+阅读 · 2019年9月6日

论文浅尝 | 用于知识图中链接预测的嵌入方法 SimplE

论文浅尝 | 用于知识图中链接预测的嵌入方法 SimplE

开放知识图谱

22+阅读 · 2019年4月3日

基于格值逻辑的语言真值α-群锁语义归结自动推理研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于神经网络的跨语言实体链指研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向异构数据库的查询语言设计及其基础理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于单语语料的无监督统计机器翻译模型研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于主题模型的枢轴语言统计机器翻译研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于概率化SC文法的多策略机器翻译研究

国家自然科学基金

0+阅读 · 2012年12月31日

跨语言信息检索中的机器翻译研究

国家自然科学基金

2+阅读 · 2011年12月31日

基于在线百科和问答社区的中文文本蕴涵知识获取

国家自然科学基金

0+阅读 · 2011年12月31日

基于图的统计机器翻译方法研究

国家自然科学基金

2+阅读 · 2010年12月31日

基于语言理解的机器翻译方法研究

国家自然科学基金

2+阅读 · 2009年12月31日

Does Interference Exist When Training a Once-For-All Network?

Arxiv

0+阅读 · 2022年4月20日

P-Adapters: Robustly Extracting Factual Information from Language Models with Diverse Prompts

Arxiv

0+阅读 · 2022年4月19日

Mono vs Multilingual BERT for Hate Speech Detection and Text Classification: A Case Study in Marathi

Arxiv

0+阅读 · 2022年4月19日

On the Transferability of Pre-trained Language Models for Low-Resource Programming Languages

Arxiv

0+阅读 · 2022年4月5日

Adaptive Attentional Network for Few-Shot Knowledge Graph Completion

Arxiv

17+阅读 · 2020年10月19日

A survey of embedding models of entities and relationships for knowledge graph completion

Arxiv

23+阅读 · 2020年8月10日

Few-Shot Knowledge Graph Completion

Arxiv

14+阅读 · 2019年11月26日

K-BERT: Enabling Language Representation with Knowledge Graph

K-BERT: Enabling Language Representation with Knowledge Graph

Arxiv

19+阅读 · 2019年9月17日

KG-BERT: BERT for Knowledge Graph Completion

Arxiv

20+阅读 · 2019年9月7日

Distance-based Self-Attention Network for Natural Language Inference

Arxiv

10+阅读 · 2017年12月6日

VIP会员

相关主题

预训练语言模型

相关VIP内容

【AAAI 2022】XLM-K：通过多语言知识库提高跨语言预训练模型

【AAAI 2022】XLM-K：通过多语言知识库提高跨语言预训练模型

专知会员服务

27+阅读 · 2022年1月13日

【CIKM2021】用领域知识增强预训练语言模型的问题回答

【CIKM2021】用领域知识增强预训练语言模型的问题回答

专知会员服务

17+阅读 · 2021年11月18日

开放领域知识图谱问答研究综述

开放领域知识图谱问答研究综述

专知会员服务

64+阅读 · 2021年10月30日

基于预训练语言模型的文本生成研究综述

专知会员服务

82+阅读 · 2021年10月15日

知识感知的预训练语言模型综述

专知会员服务

51+阅读 · 2021年9月25日

【ACL2021】预训练语言模型的少样本知识图谱文本生成

专知会员服务

39+阅读 · 2021年6月6日

【知识图谱@EMNLP2020】Knowledge Graphs in NLP @ EMNLP 2020

【知识图谱@EMNLP2020】Knowledge Graphs in NLP @ EMNLP 2020

专知会员服务

43+阅读 · 2020年11月22日

1750亿参数！GPT-3来了！31位作者，OpenAI发布小样本学习器语言模型

1750亿参数！GPT-3来了！31位作者，OpenAI发布小样本学习器语言模型

专知会员服务

73+阅读 · 2020年5月30日

17篇知识图谱Knowledge Graphs论文 @AAAI2020

17篇知识图谱Knowledge Graphs论文 @AAAI2020

专知会员服务

172+阅读 · 2020年2月13日

【AAAI2020接受论文】隐式关系语言模型，CMU&微软，Latent Relation Language Models

【AAAI2020接受论文】隐式关系语言模型，CMU&微软，Latent Relation Language Models

专知会员服务

54+阅读 · 2019年11月12日

热门VIP内容

开通专知VIP会员享更多权益服务

《乌克兰无人机产业：志愿者与政策在构建新兴无人机产业中的协同作用》最新报告

《人工智能辅助决策中的数据可视化：系统性综述》

人工智能驱动弹药制造现代化：美国陆军转型之路

《敏捷作战部署中枢纽-辐条基地选址优化研究》80页

相关资讯

论文浅尝 - ACL2022 | 基于多语言语义解耦表示的跨语言迁移方法实现多语言阅读理解

论文浅尝 - ACL2022 | 基于多语言语义解耦表示的跨语言迁移方法实现多语言阅读理解

开放知识图谱

2+阅读 · 2022年4月8日

论文浅尝 | 改善多语言KGQA的 Zero-shot 跨语言转换

论文浅尝 | 改善多语言KGQA的 Zero-shot 跨语言转换

开放知识图谱

0+阅读 · 2022年2月26日

EMNLP 2021 最新综述：语言模型中的关系性知识

EMNLP 2021 最新综述：语言模型中的关系性知识

PaperWeekly

0+阅读 · 2021年12月3日

论文浅尝 | 重新审视语言模型与知识库的关系

论文浅尝 | 重新审视语言模型与知识库的关系

开放知识图谱

0+阅读 · 2021年10月3日

论文浅尝 | 通过知识到文本的转换进行知识增强的常识问答

论文浅尝 | 通过知识到文本的转换进行知识增强的常识问答

开放知识图谱

1+阅读 · 2021年9月20日

论文浅尝 | 问题多样性对于问答的帮助

论文浅尝 | 问题多样性对于问答的帮助

开放知识图谱

0+阅读 · 2021年8月26日

赛尔原创@ACL 2021 | 基于一致性正则的跨语言微调方法

赛尔原创@ACL 2021 | 基于一致性正则的跨语言微调方法

哈工大SCIR

0+阅读 · 2021年6月22日

论文浅尝 | XQA：一个跨语言开放域问答数据集

论文浅尝 | XQA：一个跨语言开放域问答数据集

开放知识图谱

26+阅读 · 2019年9月11日

ACL 2019 | 多语言BERT的语言表征探索

ACL 2019 | 多语言BERT的语言表征探索

AI科技评论

21+阅读 · 2019年9月6日

论文浅尝 | 用于知识图中链接预测的嵌入方法 SimplE

论文浅尝 | 用于知识图中链接预测的嵌入方法 SimplE

开放知识图谱

22+阅读 · 2019年4月3日

相关基金

基于格值逻辑的语言真值α-群锁语义归结自动推理研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于神经网络的跨语言实体链指研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向异构数据库的查询语言设计及其基础理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于单语语料的无监督统计机器翻译模型研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于主题模型的枢轴语言统计机器翻译研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于概率化SC文法的多策略机器翻译研究

国家自然科学基金

0+阅读 · 2012年12月31日

跨语言信息检索中的机器翻译研究

国家自然科学基金

2+阅读 · 2011年12月31日

基于在线百科和问答社区的中文文本蕴涵知识获取

国家自然科学基金

0+阅读 · 2011年12月31日

基于图的统计机器翻译方法研究

国家自然科学基金

2+阅读 · 2010年12月31日

基于语言理解的机器翻译方法研究

国家自然科学基金

2+阅读 · 2009年12月31日

相关论文

Does Interference Exist When Training a Once-For-All Network?

Arxiv

0+阅读 · 2022年4月20日

P-Adapters: Robustly Extracting Factual Information from Language Models with Diverse Prompts

Arxiv

0+阅读 · 2022年4月19日

Mono vs Multilingual BERT for Hate Speech Detection and Text Classification: A Case Study in Marathi

Arxiv

0+阅读 · 2022年4月19日

On the Transferability of Pre-trained Language Models for Low-Resource Programming Languages

Arxiv

0+阅读 · 2022年4月5日

Adaptive Attentional Network for Few-Shot Knowledge Graph Completion

Arxiv

17+阅读 · 2020年10月19日

A survey of embedding models of entities and relationships for knowledge graph completion

Arxiv

23+阅读 · 2020年8月10日

Few-Shot Knowledge Graph Completion

Arxiv

14+阅读 · 2019年11月26日

K-BERT: Enabling Language Representation with Knowledge Graph

K-BERT: Enabling Language Representation with Knowledge Graph

Arxiv

19+阅读 · 2019年9月17日

KG-BERT: BERT for Knowledge Graph Completion

Arxiv

20+阅读 · 2019年9月7日

Distance-based Self-Attention Network for Natural Language Inference

Arxiv

10+阅读 · 2017年12月6日

大家都在搜

CMU博士论文

无人机集群

久别重逢话双塔

国防科技创新

无人机航拍交通事故现场勘查处置系统——行业第一的警用事故处理软件

微信扫码咨询专知VIP会员