【ACL2021】利用自标注的词对齐提升预训练跨语言语言模型 - 专知VIP

会员服务 ·

3

ACL 2021 · 预训练 · 预训练跨语言语言模型 ·

2021 年 8 月 13 日

【ACL2021】利用自标注的词对齐提升预训练跨语言语言模型

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

预训练跨语言语言模型（Pretrained Cross-Lingual Language Model）在自然语言推断、问答、序列标注等诸多任务上展现了强大的跨语言迁移能力。例如，仅用英语的问答训练数据来微调预训练跨语言语言模型，得到的模型就可以直接在多个语言上实现问答任务。以往的跨语言预训练任务更关注句子级别的对齐，隐式地鼓励跨语言对齐，而忽略了显示的词级别的细粒度的对齐。

在本文中，微软亚洲研究院的研究员们将词级别的跨语言对齐引入预训练，并提出了一个新的跨语言预训练任务：去噪声词对齐（Denoising word alignment），来训练 XLM-Align 模型。

在训练过程中，对翻译句对交替进行词对齐自标注和去噪声词对齐。词对齐自标注（Word alignment self-labeling）是指将输入的翻译句对的词对齐问题转化为最优传输问题，并在训练过程中在线得到输入句对的词对齐标注；去噪声词对齐则是指随机地将输入句对中的词进行掩盖，然后使用指针网络预测翻译句对原始的词对齐关系。

研究员们在 XTREME 多语言理解评价基准上进行了验证，包括序列标注、问答、句子分类等。实验使用“跨语言迁移”（Cross-lingual transfer）的实验设置——模型用英文的训练数据微调，但在多种语言的测试集上进行测试。如表13所示，XLM-Align 在7项任务上都超越了 XLM-R_base，且取得了最好的平均分数。

成为VIP会员查看完整内容

17

相关内容

ACL 2021

【ACL2021】ERICA:通过对比学习提高预训练语言模型的实体和关系理解

专知会员服务

26+阅读 · 2021年8月12日

【ACL2021】可学习知识引导的事件因果关系识别数据增强方法

专知会员服务

35+阅读 · 2021年8月11日

【ACL2021】基于跨模态对比学习的统一模态理解与生成方法

专知会员服务

29+阅读 · 2021年8月5日

【ICML2021】基于标记和未标记数据的统一语音表示学习

专知会员服务

10+阅读 · 2021年7月28日

ACL2021 | OntoED：利用本体表示学习实现低资源的事件抽取

专知会员服务

24+阅读 · 2021年6月19日

【ACL2021】预训练语言模型的少样本知识图谱文本生成

专知会员服务

42+阅读 · 2021年6月6日

【WWW2021】实体自适应语义依赖图立场检测

专知会员服务

22+阅读 · 2021年4月15日

【AAAI2021】预训练用户表示提升推荐

【AAAI2021】预训练用户表示提升推荐

专知会员服务

44+阅读 · 2021年2月8日

【EMNLP2020】利用文本和一阶逻辑中的声明知识进行细粒度的宣传手段检测

【EMNLP2020】利用文本和一阶逻辑中的声明知识进行细粒度的宣传手段检测

专知会员服务

13+阅读 · 2020年9月19日

基于迁移学习的细粒度实体分类方法的研究

专知会员服务

32+阅读 · 2020年9月2日

单语言表征如何迁移到多语言去？

单语言表征如何迁移到多语言去？

AI科技评论

5+阅读 · 2019年11月21日

赛尔原创 | EMNLP 2019 基于BERT的跨语言上下文相关词向量在零样本依存分析中的应用

赛尔原创 | EMNLP 2019 基于BERT的跨语言上下文相关词向量在零样本依存分析中的应用

哈工大SCIR

10+阅读 · 2019年11月18日

论文浅尝 | 利用问题生成提升知识图谱问答

论文浅尝 | 利用问题生成提升知识图谱问答

开放知识图谱

20+阅读 · 2019年11月5日

多项NLP任务新SOTA，Facebook提出预训练模型BART

多项NLP任务新SOTA，Facebook提出预训练模型BART

机器之心

22+阅读 · 2019年11月4日

论文浅尝 | XQA：一个跨语言开放域问答数据集

论文浅尝 | XQA：一个跨语言开放域问答数据集

开放知识图谱

26+阅读 · 2019年9月11日

ACL 2019 | 多语言BERT的语言表征探索

ACL 2019 | 多语言BERT的语言表征探索

AI科技评论

21+阅读 · 2019年9月6日

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

机器之心

15+阅读 · 2019年3月18日

深度思考 | 从BERT看大规模数据的无监督利用

深度思考 | 从BERT看大规模数据的无监督利用

PaperWeekly

11+阅读 · 2019年2月18日

EMNLP2018论文解读 | 利用篇章信息提升机器翻译质量

EMNLP2018论文解读 | 利用篇章信息提升机器翻译质量

PaperWeekly

6+阅读 · 2018年11月22日

赛尔原创 | IJCAI 2018 利用跨语言知识改进稀缺资源语言命名实体识别

赛尔原创 | IJCAI 2018 利用跨语言知识改进稀缺资源语言命名实体识别

哈工大SCIR

7+阅读 · 2018年5月21日

Multi-Task Learning for Situated Multi-Domain End-to-End Dialogue Systems

Arxiv

0+阅读 · 2021年10月11日

A study of the robustness of raw waveform based speaker embeddings under mismatched conditions

A study of the robustness of raw waveform based speaker embeddings under mismatched conditions

Arxiv

0+阅读 · 2021年10月8日

Cross-speaker Emotion Transfer Based on Speaker Condition Layer Normalization and Semi-Supervised Training in Text-To-Speech

Arxiv

0+阅读 · 2021年10月8日

A Compositional Feature Embedding and Similarity Metric for Ultra-Fine-Grained Visual Categorization

Arxiv

0+阅读 · 2021年10月6日

Graph Learning: A Survey

Arxiv

58+阅读 · 2021年5月3日

Contrastive Transformation for Self-supervised Correspondence Learning

Contrastive Transformation for Self-supervised Correspondence Learning

Arxiv

13+阅读 · 2020年12月9日

Query Understanding via Intent Description Generation

Arxiv

9+阅读 · 2020年8月25日

LayoutLM: Pre-training of Text and Layout for Document Image Understanding

LayoutLM: Pre-training of Text and Layout for Document Image Understanding

Arxiv

12+阅读 · 2020年2月19日

Unsupervised Cross-lingual Representation Learning at Scale

Arxiv

5+阅读 · 2019年11月5日

Unsupervised Multilingual Word Embeddings

Arxiv

3+阅读 · 2018年8月27日

VIP会员

相关主题

预训练跨语言语言模型

相关VIP内容

【ACL2021】ERICA:通过对比学习提高预训练语言模型的实体和关系理解

专知会员服务

26+阅读 · 2021年8月12日

【ACL2021】可学习知识引导的事件因果关系识别数据增强方法

专知会员服务

35+阅读 · 2021年8月11日

【ACL2021】基于跨模态对比学习的统一模态理解与生成方法

专知会员服务

29+阅读 · 2021年8月5日

【ICML2021】基于标记和未标记数据的统一语音表示学习

专知会员服务

10+阅读 · 2021年7月28日

ACL2021 | OntoED：利用本体表示学习实现低资源的事件抽取

专知会员服务

24+阅读 · 2021年6月19日

【ACL2021】预训练语言模型的少样本知识图谱文本生成

专知会员服务

42+阅读 · 2021年6月6日

【WWW2021】实体自适应语义依赖图立场检测

专知会员服务

22+阅读 · 2021年4月15日

【AAAI2021】预训练用户表示提升推荐

【AAAI2021】预训练用户表示提升推荐

专知会员服务

44+阅读 · 2021年2月8日

【EMNLP2020】利用文本和一阶逻辑中的声明知识进行细粒度的宣传手段检测

【EMNLP2020】利用文本和一阶逻辑中的声明知识进行细粒度的宣传手段检测

专知会员服务

13+阅读 · 2020年9月19日

基于迁移学习的细粒度实体分类方法的研究

专知会员服务

32+阅读 · 2020年9月2日

热门VIP内容

开通专知VIP会员享更多权益服务

《太空边缘（临近空间）的武器化？军事高空平台的进展与前景》

《利用星基增强系统（SBAS）信号进行射频干扰（RFI）检测与特征分析》

美陆军在“艾布拉姆斯”坦克与“布拉德利”步战车上测试“牛蛙”反无人机炮塔

《军事领域特性及其对军事人工智能应用的影响》

相关资讯

单语言表征如何迁移到多语言去？

单语言表征如何迁移到多语言去？

AI科技评论

5+阅读 · 2019年11月21日

赛尔原创 | EMNLP 2019 基于BERT的跨语言上下文相关词向量在零样本依存分析中的应用

赛尔原创 | EMNLP 2019 基于BERT的跨语言上下文相关词向量在零样本依存分析中的应用

哈工大SCIR

10+阅读 · 2019年11月18日

论文浅尝 | 利用问题生成提升知识图谱问答

论文浅尝 | 利用问题生成提升知识图谱问答

开放知识图谱

20+阅读 · 2019年11月5日

多项NLP任务新SOTA，Facebook提出预训练模型BART

多项NLP任务新SOTA，Facebook提出预训练模型BART

机器之心

22+阅读 · 2019年11月4日

论文浅尝 | XQA：一个跨语言开放域问答数据集

论文浅尝 | XQA：一个跨语言开放域问答数据集

开放知识图谱

26+阅读 · 2019年9月11日

ACL 2019 | 多语言BERT的语言表征探索

ACL 2019 | 多语言BERT的语言表征探索

AI科技评论

21+阅读 · 2019年9月6日

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

机器之心

15+阅读 · 2019年3月18日

深度思考 | 从BERT看大规模数据的无监督利用

深度思考 | 从BERT看大规模数据的无监督利用

PaperWeekly

11+阅读 · 2019年2月18日

EMNLP2018论文解读 | 利用篇章信息提升机器翻译质量

EMNLP2018论文解读 | 利用篇章信息提升机器翻译质量

PaperWeekly

6+阅读 · 2018年11月22日

赛尔原创 | IJCAI 2018 利用跨语言知识改进稀缺资源语言命名实体识别

赛尔原创 | IJCAI 2018 利用跨语言知识改进稀缺资源语言命名实体识别

哈工大SCIR

7+阅读 · 2018年5月21日

相关论文

Multi-Task Learning for Situated Multi-Domain End-to-End Dialogue Systems

Arxiv

0+阅读 · 2021年10月11日

A study of the robustness of raw waveform based speaker embeddings under mismatched conditions

A study of the robustness of raw waveform based speaker embeddings under mismatched conditions

Arxiv

0+阅读 · 2021年10月8日

Cross-speaker Emotion Transfer Based on Speaker Condition Layer Normalization and Semi-Supervised Training in Text-To-Speech

Arxiv

0+阅读 · 2021年10月8日

A Compositional Feature Embedding and Similarity Metric for Ultra-Fine-Grained Visual Categorization

Arxiv

0+阅读 · 2021年10月6日

Graph Learning: A Survey

Arxiv

58+阅读 · 2021年5月3日

Contrastive Transformation for Self-supervised Correspondence Learning

Contrastive Transformation for Self-supervised Correspondence Learning

Arxiv

13+阅读 · 2020年12月9日

Query Understanding via Intent Description Generation

Arxiv

9+阅读 · 2020年8月25日

LayoutLM: Pre-training of Text and Layout for Document Image Understanding

LayoutLM: Pre-training of Text and Layout for Document Image Understanding

Arxiv

12+阅读 · 2020年2月19日

Unsupervised Cross-lingual Representation Learning at Scale

Arxiv

5+阅读 · 2019年11月5日

Unsupervised Multilingual Word Embeddings

Arxiv

3+阅读 · 2018年8月27日

微信扫码咨询专知VIP会员