【ICML2020投稿论文-CMU-DeepMind-Google】用于评估跨语言泛化的大规模多语言多任务基准 - 专知VIP

会员服务 ·

1

跨语言泛化 ·

2020 年 3 月 27 日

【ICML2020投稿论文-CMU-DeepMind-Google】用于评估跨语言泛化的大规模多语言多任务基准

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

机器学习模型在自然语言处理中的应用最近的进展是由评估各种任务模型的基准驱动的。然而，这些覆盖范围广泛的基准测试主要局限于英语，尽管人们对多语言模型的兴趣越来越大，但是仍然缺少一个基准测试来全面评估这些方法对各种语言和任务的影响。为此，我们引入了多语言编码器XTREME基准的跨语言转换评估，这是一个多任务基准，用于评估40种语言和9个任务的多语言表示的跨语言泛化能力。我们证明，虽然英语测试的模型在许多任务上达到了人类的表现，但在跨语言迁移模型的表现上仍然有相当大的差距，特别是在句法和句子检索任务上。在不同的语言之间也有广泛的结果。我们发布基准测试是为了鼓励对跨语言学习方法的研究，这种方法可以将语言知识传递到不同的、有代表性的语言和任务中。

成为VIP会员查看完整内容

14

相关内容

自然语言处理ACL2020最佳论文出炉！微软摘得最佳论文，Bengio论文获时间检验奖

自然语言处理ACL2020最佳论文出炉！微软摘得最佳论文，Bengio论文获时间检验奖

专知会员服务

45+阅读 · 2020年7月9日

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

专知会员服务

70+阅读 · 2020年7月1日

【清华大学】低资源语言:回顾综述和未来的挑战，14页pdf

【清华大学】低资源语言:回顾综述和未来的挑战，14页pdf

专知会员服务

37+阅读 · 2020年6月16日

1750亿参数！GPT-3来了！31位作者，OpenAI发布小样本学习器语言模型

1750亿参数！GPT-3来了！31位作者，OpenAI发布小样本学习器语言模型

专知会员服务

73+阅读 · 2020年5月30日

【ACL2020】DeeBERT:动态加速BERT推理，DeeBERT: Dynamic Early Exiting for Accelerating BERT Inference

【ACL2020】DeeBERT:动态加速BERT推理，DeeBERT: Dynamic Early Exiting for Accelerating BERT Inference

专知会员服务

21+阅读 · 2020年4月30日

【ACL2020-CMU-Google】MobileBERT:用于资源受限设备的任务无关“瘦版”BERT

【ACL2020-CMU-Google】MobileBERT:用于资源受限设备的任务无关“瘦版”BERT

专知会员服务

13+阅读 · 2020年4月9日

【ACL2020-Facebook AI】跨语言表示学习，Unsupervised Cross-lingual Representation Learning at Scale

【ACL2020-Facebook AI】跨语言表示学习，Unsupervised Cross-lingual Representation Learning at Scale

专知会员服务

27+阅读 · 2020年4月5日

【ACL2020-Facebook AI】大规模无监督跨语言表示学习

【ACL2020-Facebook AI】大规模无监督跨语言表示学习

专知会员服务

34+阅读 · 2020年4月5日

AAAI2020最新「迁移表示学习最新进展」247页PPT，宾夕法尼亚大学

AAAI2020最新「迁移表示学习最新进展」247页PPT，宾夕法尼亚大学

专知会员服务

112+阅读 · 2020年2月11日

【元学习 | 论文】CoRL19，元世界:多任务和元强化学习的基准和评估，伯克利分校，Google

【元学习 | 论文】CoRL19，元世界:多任务和元强化学习的基准和评估，伯克利分校，Google

专知会员服务

27+阅读 · 2019年11月21日

ChineseGLUE：为中文NLP模型定制的自然语言理解基准

ChineseGLUE：为中文NLP模型定制的自然语言理解基准

机器之心

4+阅读 · 2019年10月23日

【微软ICLR2020提交论文】多模态预训练表示UNITER：通用图像-文本语言表示学习

【微软ICLR2020提交论文】多模态预训练表示UNITER：通用图像-文本语言表示学习

专知

50+阅读 · 2019年10月20日

[Google]BERT压缩到7MB！最新基于最优子词和共享投影的极限语言压缩模型

[Google]BERT压缩到7MB！最新基于最优子词和共享投影的极限语言压缩模型

专知

31+阅读 · 2019年10月6日

ACL 2019 | 多语言BERT的语言表征探索

ACL 2019 | 多语言BERT的语言表征探索

AI科技评论

21+阅读 · 2019年9月6日

微软亚研提出VL-BERT：通用的视觉-语言预训练模型

微软亚研提出VL-BERT：通用的视觉-语言预训练模型

机器之心

15+阅读 · 2019年9月3日

NAACL 2019自然语言处理亮点

NAACL 2019自然语言处理亮点

专知

15+阅读 · 2019年6月15日

谷歌BERT斩获最佳长论文！自然语言顶会NAACL2019最佳论文5篇出炉

谷歌BERT斩获最佳长论文！自然语言顶会NAACL2019最佳论文5篇出炉

专知

5+阅读 · 2019年4月11日

GLUE排行榜上全面超越BERT的模型近日公布了！

GLUE排行榜上全面超越BERT的模型近日公布了！

机器之心

9+阅读 · 2019年2月13日

ELMo的朋友圈：预训练语言模型真的一枝独秀吗？

ELMo的朋友圈：预训练语言模型真的一枝独秀吗？

机器之心

10+阅读 · 2019年1月1日

资源 | FAIR & NYU开发XNLI语料库：15种语言（含低资源语言）

资源 | FAIR & NYU开发XNLI语料库：15种语言（含低资源语言）

机器之心

3+阅读 · 2018年11月12日

XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating Cross-lingual Generalization

XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating Cross-lingual Generalization

Arxiv

3+阅读 · 2020年3月24日

CoKE: Contextualized Knowledge Graph Embedding

Arxiv

9+阅读 · 2019年11月6日

KG-BERT: BERT for Knowledge Graph Completion

Arxiv

20+阅读 · 2019年9月7日

Hierarchical Meta Learning

Arxiv

9+阅读 · 2019年4月19日

Efficient Parameter-free Clustering Using First Neighbor Relations

Efficient Parameter-free Clustering Using First Neighbor Relations

Arxiv

7+阅读 · 2019年2月28日

Physical Primitive Decomposition

Physical Primitive Decomposition

Arxiv

4+阅读 · 2018年9月13日

QuAC : Question Answering in Context

QuAC : Question Answering in Context

Arxiv

4+阅读 · 2018年8月21日

Scaling Neural Machine Translation

Arxiv

3+阅读 · 2018年6月1日

Think Visually: Question Answering through Virtual Imagery

Arxiv

3+阅读 · 2018年5月25日

Representation Learning for Visual-Relational Knowledge Graphs

Arxiv

9+阅读 · 2018年3月31日

VIP会员

相关主题

跨语言泛化

相关VIP内容

自然语言处理ACL2020最佳论文出炉！微软摘得最佳论文，Bengio论文获时间检验奖

自然语言处理ACL2020最佳论文出炉！微软摘得最佳论文，Bengio论文获时间检验奖

专知会员服务

45+阅读 · 2020年7月9日

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

专知会员服务

70+阅读 · 2020年7月1日

【清华大学】低资源语言:回顾综述和未来的挑战，14页pdf

【清华大学】低资源语言:回顾综述和未来的挑战，14页pdf

专知会员服务

37+阅读 · 2020年6月16日

1750亿参数！GPT-3来了！31位作者，OpenAI发布小样本学习器语言模型

1750亿参数！GPT-3来了！31位作者，OpenAI发布小样本学习器语言模型

专知会员服务

73+阅读 · 2020年5月30日

【ACL2020】DeeBERT:动态加速BERT推理，DeeBERT: Dynamic Early Exiting for Accelerating BERT Inference

【ACL2020】DeeBERT:动态加速BERT推理，DeeBERT: Dynamic Early Exiting for Accelerating BERT Inference

专知会员服务

21+阅读 · 2020年4月30日

【ACL2020-CMU-Google】MobileBERT:用于资源受限设备的任务无关“瘦版”BERT

【ACL2020-CMU-Google】MobileBERT:用于资源受限设备的任务无关“瘦版”BERT

专知会员服务

13+阅读 · 2020年4月9日

【ACL2020-Facebook AI】跨语言表示学习，Unsupervised Cross-lingual Representation Learning at Scale

【ACL2020-Facebook AI】跨语言表示学习，Unsupervised Cross-lingual Representation Learning at Scale

专知会员服务

27+阅读 · 2020年4月5日

【ACL2020-Facebook AI】大规模无监督跨语言表示学习

【ACL2020-Facebook AI】大规模无监督跨语言表示学习

专知会员服务

34+阅读 · 2020年4月5日

AAAI2020最新「迁移表示学习最新进展」247页PPT，宾夕法尼亚大学

AAAI2020最新「迁移表示学习最新进展」247页PPT，宾夕法尼亚大学

专知会员服务

112+阅读 · 2020年2月11日

【元学习 | 论文】CoRL19，元世界:多任务和元强化学习的基准和评估，伯克利分校，Google

【元学习 | 论文】CoRL19，元世界:多任务和元强化学习的基准和评估，伯克利分校，Google

专知会员服务

27+阅读 · 2019年11月21日

热门VIP内容

开通专知VIP会员享更多权益服务

大语言模型基准综述

《自适应训练辅助系统概念导论及其在空战指挥官加速培训中的应用》125页

【剑桥博士论文】多智能体学习中的神经多样性

以色列-伊朗空战：短暂而激烈冲突的启示

相关资讯

ChineseGLUE：为中文NLP模型定制的自然语言理解基准

ChineseGLUE：为中文NLP模型定制的自然语言理解基准

机器之心

4+阅读 · 2019年10月23日

【微软ICLR2020提交论文】多模态预训练表示UNITER：通用图像-文本语言表示学习

【微软ICLR2020提交论文】多模态预训练表示UNITER：通用图像-文本语言表示学习

专知

50+阅读 · 2019年10月20日

[Google]BERT压缩到7MB！最新基于最优子词和共享投影的极限语言压缩模型

[Google]BERT压缩到7MB！最新基于最优子词和共享投影的极限语言压缩模型

专知

31+阅读 · 2019年10月6日

ACL 2019 | 多语言BERT的语言表征探索

ACL 2019 | 多语言BERT的语言表征探索

AI科技评论

21+阅读 · 2019年9月6日

微软亚研提出VL-BERT：通用的视觉-语言预训练模型

微软亚研提出VL-BERT：通用的视觉-语言预训练模型

机器之心

15+阅读 · 2019年9月3日

NAACL 2019自然语言处理亮点

NAACL 2019自然语言处理亮点

专知

15+阅读 · 2019年6月15日

谷歌BERT斩获最佳长论文！自然语言顶会NAACL2019最佳论文5篇出炉

谷歌BERT斩获最佳长论文！自然语言顶会NAACL2019最佳论文5篇出炉

专知

5+阅读 · 2019年4月11日

GLUE排行榜上全面超越BERT的模型近日公布了！

GLUE排行榜上全面超越BERT的模型近日公布了！

机器之心

9+阅读 · 2019年2月13日

ELMo的朋友圈：预训练语言模型真的一枝独秀吗？

ELMo的朋友圈：预训练语言模型真的一枝独秀吗？

机器之心

10+阅读 · 2019年1月1日

资源 | FAIR & NYU开发XNLI语料库：15种语言（含低资源语言）

资源 | FAIR & NYU开发XNLI语料库：15种语言（含低资源语言）

机器之心

3+阅读 · 2018年11月12日

相关论文

XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating Cross-lingual Generalization

XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating Cross-lingual Generalization

Arxiv

3+阅读 · 2020年3月24日

CoKE: Contextualized Knowledge Graph Embedding

Arxiv

9+阅读 · 2019年11月6日

KG-BERT: BERT for Knowledge Graph Completion

Arxiv

20+阅读 · 2019年9月7日

Hierarchical Meta Learning

Arxiv

9+阅读 · 2019年4月19日

Efficient Parameter-free Clustering Using First Neighbor Relations

Efficient Parameter-free Clustering Using First Neighbor Relations

Arxiv

7+阅读 · 2019年2月28日

Physical Primitive Decomposition

Physical Primitive Decomposition

Arxiv

4+阅读 · 2018年9月13日

QuAC : Question Answering in Context

QuAC : Question Answering in Context

Arxiv

4+阅读 · 2018年8月21日

Scaling Neural Machine Translation

Arxiv

3+阅读 · 2018年6月1日

Think Visually: Question Answering through Virtual Imagery

Arxiv

3+阅读 · 2018年5月25日

Representation Learning for Visual-Relational Knowledge Graphs

Arxiv

9+阅读 · 2018年3月31日

微信扫码咨询专知VIP会员