In this paper, we present an extensive investigation of multi-bridge, many-to-many multilingual NMT models (MB-M2M) ie., models trained on non-English language pairs in addition to English-centric language pairs. In addition to validating previous work which shows that MB-M2M models can overcome zeroshot translation problems, our analysis reveals the following results about multibridge models: (1) it is possible to extract a reasonable amount of parallel corpora between non-English languages for low-resource languages (2) with limited non-English centric data, MB-M2M models are competitive with or outperform pivot models, (3) MB-M2M models can outperform English-Any models and perform at par with Any-English models, so a single multilingual NMT system can serve all translation directions.


翻译:在本文中,我们提出了对多桥、多至多种多语种NMT模式(MB-M2M)的广泛调查,这些模式除了以英语为中心的语言配对之外,还就非英语语言配对进行了培训。除了证实以往的工作表明MB-M2M模式能够克服零弹射翻译问题外,我们的分析还揭示了多桥模式的以下结果:(1) 有可能为低资源语言提取出非英语语言之间数量合理的平行体系(2) 有限非英语中心数据,MB-M2M模式与非英语中心模式具有竞争力,或优于外型支流模式,(3) MB-M2M模式能够超越英语模式,并和任何英语模式一样运作,因此单一的多语言NMT系统可以为所有翻译方向服务。

0
下载
关闭预览

相关内容

多语言机器翻译使用一个翻译模型来处理多种语言。
专知会员服务
88+阅读 · 2021年6月29日
【干货书】机器学习速查手册,135页pdf
专知会员服务
125+阅读 · 2020年11月20日
专知会员服务
17+阅读 · 2020年9月6日
最新BERT相关论文清单,BERT-related Papers
专知会员服务
52+阅读 · 2019年9月29日
强化学习三篇论文 避免遗忘等
CreateAMind
19+阅读 · 2019年5月24日
已删除
将门创投
5+阅读 · 2019年3月29日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
LibRec 精选:推荐系统的论文与源码
LibRec智能推荐
14+阅读 · 2018年11月29日
Hierarchical Imitation - Reinforcement Learning
CreateAMind
19+阅读 · 2018年5月25日
【推荐】自然语言处理(NLP)指南
机器学习研究会
35+阅读 · 2017年11月17日
Arxiv
3+阅读 · 2018年3月28日
Arxiv
6+阅读 · 2018年2月28日
Arxiv
7+阅读 · 2018年1月30日
Arxiv
3+阅读 · 2017年12月18日
VIP会员
Top
微信扫码咨询专知VIP会员