【ICML2020投稿论文-CMU-DeepMind-Google】用于评估跨语言泛化的大规模多语言多任务基准

2020 年 3 月 27 日 专知


机器学习模型在自然语言处理中的应用最近的进展是由评估各种任务模型的基准驱动的。然而,这些覆盖范围广泛的基准测试主要局限于英语,尽管人们对多语言模型的兴趣越来越大,但是仍然缺少一个基准测试来全面评估这些方法对各种语言和任务的影响。为此,我们引入了多语言编码器XTREME基准的跨语言转换评估,这是一个多任务基准,用于评估40种语言和9个任务的多语言表示的跨语言泛化能力。我们证明,虽然英语测试的模型在许多任务上达到了人类的表现,但在跨语言迁移模型的表现上仍然有相当大的差距,特别是在句法和句子检索任务上。在不同的语言之间也有广泛的结果。我们发布基准测试是为了鼓励对跨语言学习方法的研究,这种方法可以将语言知识传递到不同的、有代表性的语言和任务中。

https://www.zhuanzhi.ai/paper/6ed6ed532bbff73c5ba65cdd2633da2e


专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“XTR” 就可以获取【ICML2020投稿论文-CMU-DeepMind-Google】用于评估跨语言泛化的大规模多语言多任务基准》专知下载链接

专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取5000+AI主题知识资源
登录查看更多
0

相关内容

【ICML2020】用于强化学习的对比无监督表示嵌入
专知会员服务
27+阅读 · 2020年7月6日
【清华大学】低资源语言:回顾综述和未来的挑战,14页pdf
【ICML2020-哈佛】深度语言表示中可分流形
专知会员服务
12+阅读 · 2020年6月2日
【ACL2020-Facebook AI】大规模无监督跨语言表示学习
专知会员服务
33+阅读 · 2020年4月5日
ChineseGLUE:为中文NLP模型定制的自然语言理解基准
多模态多任务学习新论文
专知
46+阅读 · 2019年2月9日
新任务&数据集:视觉常识推理(VCR)
专知
50+阅读 · 2018年12月1日
Arxiv
4+阅读 · 2019年12月2日
Arxiv
9+阅读 · 2019年11月6日
Arxiv
20+阅读 · 2019年9月7日
Music Transformer
Arxiv
5+阅读 · 2018年12月12日
Physical Primitive Decomposition
Arxiv
4+阅读 · 2018年9月13日
VIP会员
相关论文
Top
微信扫码咨询专知VIP会员