Recent studies have demonstrated a perceivable improvement on the performance of neural machine translation by applying cross-lingual language model pretraining (Lample and Conneau, 2019), especially the Translation Language Modeling (TLM). To alleviate the need for expensive parallel corpora by TLM, in this work, we incorporate the translation information from dictionaries into the pretraining process and propose a novel Bilingual Dictionary-based Language Model (BDLM). We evaluate our BDLM in Chinese, English, and Romanian. For Chinese-English, we obtained a 55.0 BLEU on WMT-News19 (Tiedemann, 2012) and a 24.3 BLEU on WMT20 news-commentary, outperforming the Vanilla Transformer (Vaswani et al., 2017) by more than 8.4 BLEU and 2.3 BLEU, respectively. According to our results, the BDLM also has advantages on convergence speed and predicting rare words. The increase in BLEU for WMT16 Romanian-English also shows its effectiveness in low-resources language translation.


翻译:最近的研究显示,通过采用跨语言语言模式的预培训(Lample和Conneau,2019年),特别是翻译语言模型(TLM),神经机机翻译的性能取得了明显改善。为了减轻TLM在这项工作中对昂贵的平行公司平行公司的需求,我们将词典的翻译信息纳入预培训过程,并提出了以双语词典为基础的新语言模型(BDLM)。我们用中文、英文和罗马尼亚文评价了我们的BDLM BDLM。对于中文英语,我们在WMT-News19(Tiedemann,2012年)上获得了55.0 BLEU,在WMT20新闻公告上获得了24.3 BLEU,比Vanilla变形器(Vaswani等人,2017年)分别提高了8.4 BLEU和2.3 BLEU。根据我们的结果,BDLM在趋同速度和预测稀有文字方面也有优势。WMT16罗马尼亚文的BLEU的增加也显示了其低资源语言翻译的效用。

0
下载
关闭预览

相关内容

多任务学习(Multi-task Learning)方法总结
极市平台
6+阅读 · 2020年4月26日
Transferring Knowledge across Learning Processes
CreateAMind
28+阅读 · 2019年5月18日
Call for Participation: Shared Tasks in NLPCC 2019
中国计算机学会
5+阅读 · 2019年3月22日
无监督元学习表示学习
CreateAMind
27+阅读 · 2019年1月4日
自然语言处理 (NLP)资源大全
机械鸡
35+阅读 · 2017年9月17日
Andrew NG的新书《Machine Learning Yearning》
我爱机器学习
11+阅读 · 2016年12月7日
自然语言处理(二)机器翻译 篇 (NLP: machine translation)
DeepLearning中文论坛
10+阅读 · 2015年7月1日
Phrase-Based & Neural Unsupervised Machine Translation
Arxiv
3+阅读 · 2018年3月28日
Arxiv
6+阅读 · 2018年2月26日
VIP会员
相关VIP内容
相关资讯
多任务学习(Multi-task Learning)方法总结
极市平台
6+阅读 · 2020年4月26日
Transferring Knowledge across Learning Processes
CreateAMind
28+阅读 · 2019年5月18日
Call for Participation: Shared Tasks in NLPCC 2019
中国计算机学会
5+阅读 · 2019年3月22日
无监督元学习表示学习
CreateAMind
27+阅读 · 2019年1月4日
自然语言处理 (NLP)资源大全
机械鸡
35+阅读 · 2017年9月17日
Andrew NG的新书《Machine Learning Yearning》
我爱机器学习
11+阅读 · 2016年12月7日
自然语言处理(二)机器翻译 篇 (NLP: machine translation)
DeepLearning中文论坛
10+阅读 · 2015年7月1日
Top
微信扫码咨询专知VIP会员