Pronouns are important determinants of a text's meaning but difficult to translate. This is because pronoun choice can depend on entities described in previous sentences, and in some languages pronouns may be dropped when the referent is inferrable from the context. These issues can lead Neural Machine Translation (NMT) systems to make critical errors on pronouns that impair intelligibility and even reinforce gender bias. We investigate the severity of this pronoun issue, showing that (1) in some domains, pronoun choice can account for more than half of a NMT systems' errors, and (2) pronouns have a disproportionately large impact on perceived translation quality. We then investigate a possible solution: fine-tuning BERT on a pronoun prediction task using chunks of source-side sentences, then using the resulting classifier to repair the translations of an existing NMT model. We offer an initial case study of this approach for the Japanese-English language pair, observing that a small number of translations are significantly improved according to human evaluators.


翻译:Pronouns 是文本含义的重要决定因素, 但很难翻译。 这是因为 pronnoun 选择取决于前几句中描述的实体, 在有些语言中, 当引用从上下文中可以推断出时, ponnouns 可能会被丢弃。 这些问题可以引导神经机器翻译( NMT) 系统在 prononuns 上做出关键错误, 这会损害智能, 甚至强化性别偏见。 我们调查了这个Pronoun 问题的严重性, 表明(1) 在某些领域, 代noun 选择可能占 NMT 系统错误的一半以上, (2) 代nouns 会对感知到的翻译质量产生过大的影响 。 我们然后调查一个可能的解决办法: 利用源边句块对预言预测任务进行微调 BERT, 然后使用由此产生的分类器来修复现有的 NMT 模型的翻译。 我们为日- 英语对提供了这一方法的初步案例研究, 指出, 根据人类评价者的意见, 少数翻译得到显著改进 。

0
下载
关闭预览

相关内容

最新《Transformers模型》教程,64页ppt
专知会员服务
319+阅读 · 2020年11月26日
【NeurIPS 2020】融入BERT到并行序列模型
专知会员服务
26+阅读 · 2020年10月15日
Linux导论,Introduction to Linux,96页ppt
专知会员服务
80+阅读 · 2020年7月26日
【Google】无监督机器翻译,Unsupervised Machine Translation
专知会员服务
36+阅读 · 2020年3月3日
最新BERT相关论文清单,BERT-related Papers
专知会员服务
53+阅读 · 2019年9月29日
已删除
将门创投
6+阅读 · 2019年9月3日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
Doubly Attentive Transformer Machine Translation
Arxiv
4+阅读 · 2018年7月30日
Arxiv
3+阅读 · 2018年3月28日
Arxiv
6+阅读 · 2018年2月28日
VIP会员
相关资讯
已删除
将门创投
6+阅读 · 2019年9月3日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
Top
微信扫码咨询专知VIP会员