Google 翻译提供 “特定性别翻译”,大大消除性别表述歧义

2018 年 12 月 29 日 谷歌开发者

文 / Melvin Johnson,Google 翻译高级软件工程师

在过去几年中,Google 翻译通过切换到基于神经网络的端到端系统,在翻译质量方面取得了显著提升。与此同时,我们也发现,由模型提供的翻译可能会呈现社会偏见,例如性别偏见。具体而言,语言表示性别的方式千差万别,如果在翻译过程中存在性别表述歧义,系统往往会选择反映社会不平等性的性别选项,从而产生有偏见的翻译。例如,Google 翻译过去将意为 “他/她是一名医生” 的土耳其语文本翻译成阳性形式,将意为 “他/她是一名护士” 的土耳其语文本翻译成阴性形式。

最近,Google 宣布在减少翻译中的性别偏见方面迈出了第一步。现在,在将单字查询从英语翻译成四种不同语言(法语、意大利语、葡萄牙语和西班牙语),以及将短语和句子从土耳其语翻译成英语时,我们会提供阴性和阳性两种翻译。


Google 翻译网站上的特定性别翻译


支持单字查询的特定性别翻译涉及使用性别属性丰富基础词典的内容。支持较长查询(短语和句子)的特定性别翻译格外具有挑战性,涉及到对我们的翻译框架做出重大调整。对于这些较长的查询,我们最初主攻从土耳其语到英语的翻译。为了给中性的土耳其语查询提供阳性和阴性的英语翻译,我们采用了三步法来解决这一问题。




检测中性查询

土耳其语中有许多句子在提及人时都是中性的,但并非全都如此。要检测应该为哪些查询提供特定性别翻译,这是一大难题,因为土耳其语词态复杂,既可以使用中性代词(例如 O、Ona)明确指代一个人,也可以使用隐去代词的方式表达。例如 “Biliyor mu?”,这句话没有明确的中性代词,却可以翻译成 “她知道吗?” 或者 “他知道吗?”。鉴于这种复杂性,我们无法使用简单的中性代词列表来检测中性的土耳其语查询,我们需要一个机器学习系统。据我们估计,有歧义的土耳其语翻译查询大约占 10%,需要同时提供阴性和阳性翻译。 

为了检测这些查询,我们采用最先进的文本分类算法(与 Cloud Natural Language API 中使用的算法相同)来构建一个能够检测给定土耳其语查询何时为中性的系统。这样,在获取翻译前就会多出一个步骤,所以我们必须谨慎平衡模型复杂性与延迟时间。我们使用数千个经过人工评估的土耳其语示例来训练我们的系统,其中评估者负责判断给定示例是否为中性。我们最终的分类系统是一个卷积神经网络,可以准确检测出需要提供特定性别翻译的查询。



生成特定性别翻译

接下来,我们强化了底层神经机器翻译 (NMT) 系统,以便在需要时生成阴性和阳性翻译。当不要求性别时,我们训练模型生成默认翻译。训练内容包括:


1. 识别并行训练数据,并将其划分为带有阴性词汇、阳性词汇和无性别词汇三部分。


2. 在句子的开头添加额外的输入标记,以指定需要翻译成的性别,类似于我们构建多语言 NMT 系统的方法:

  • <2MALE> O bir doktor → He is a doctor(他是一名医生)

  • <2FEMALE> O bir doktor → She is a doctor(她是一名医生)


3. 使用阴性、阳性和无性别数据源训练我们的强化版 NMT 模型。我们对这些数据源进行了不同混合比例的训练,以确保模型在这三项任务中表现同样优秀。


如果确定用户的查询为中性,我们会在翻译请求前添加性别前缀。对于这些请求,我们的最终版 NMT 模型可以在 99% 的情况下生成可靠的阴性和阳性翻译。此外,系统还能针对无性别前缀的查询保持翻译质量。



检查准确性

最后一步,我们要确定是否显示特定性别翻译。由于生成阳性翻译和阴性翻译的训练数据不同,这两种翻译与性别无关的部分可能存在差异。如果确定特定性别翻译的质量较低,则我们仅会显示单个默认翻译。为了确定特定性别翻译的质量,我们会进行以下验证:

  • 需要的阴性翻译是否为阴性

  • 需要的阳性翻译是否为阳性

  • 除了与性别相关的更改外,阴性翻译与阳性翻译是否完全一致。即便是翻译在措辞上的细微差别,系统也会将其筛选出来


上图:这个阳性翻译和阴性翻译仅在性别上存在差异,即 “he” 和 “his” 与 “she” 和 “her”。因此,我们会显示特定性别翻译。下图:这个阳性翻译和阴性翻译确实在性别上存在差异,即 “he” 与 “she”,但从 “really” 到 “acutally” 的变化与性别无关。因此,我们会筛选出特定性别翻译,并显示默认翻译


综合来说,输入的句子首先要经过分类器处理,检测是否需要提供特定性别翻译。如果分类器说 “是”,我们会向增强的 NMT 模型发送三个请求,一个阴性请求、一个阳性请求,还有一个无性别请求。在最后一步,我们会考虑所有三个响应,并决定显示特定性别翻译还是只显示默认翻译。为了最大限度保证所显示的特定性别翻译的质量,我们在这一步仍然做得非常保守,因此我们的整体召回率大概只有 60%。我们计划扩大范围,在未来的迭代中为更多复杂句子添加支持。 

这只是我们向解决机器翻译系统中存在的性别偏见迈出的第一步,我们将重申 Google 的机器学习公平性承诺。未来,我们计划将特定性别翻译扩展到更多语言,并解决翻译中的非二进制性别问题。



致谢

这项成果离不开许多人的辛勤工作,包括但不限于以下人士(以姓氏字母排序):Lindsey Boran、HyunJeong Choe、Héctor Fernández Alcalde、Orhan Firat、Qin Gao、Rick Genter、Macduff Hughes、Tolga Kayadelen、James Kuczmarski、Tatiana Lando、Liu Liu、Michael Mandl、Nihal Meriç Atilla、Mengmeng Niu、Adnan Ozturel、Emily Pitler、Kathy Ray、John Richardson、Larissa Rinaldi、Alex Rudnick、Apu Shah、Jason Smith、Antonio Stella、Romina Stella、Jana Strnadova、Katrin Tomanek、Barak Turovsky、Dan Schwarz、Shilp Vaishnav、Clayton Watts、Kellie Webster、Colin Young、Pendar Yousefi、Candice Zhang 和 Min Zhao。



更多 AI 相关阅读:




登录查看更多
1

相关内容

【WWW2020-微软】理解用户行为用于文档推荐
专知会员服务
36+阅读 · 2020年4月5日
【WWW2020-UIUC】为新闻故事生成具有代表性的标题
专知会员服务
27+阅读 · 2020年3月18日
了解情感分析中的NLP技术么?
七月在线实验室
9+阅读 · 2019年4月12日
干货 | 揭开多语言词嵌入模型的神秘面纱
AI科技评论
5+阅读 · 2018年4月3日
已删除
生物探索
3+阅读 · 2018年2月10日
没有数据也能翻译?一文读懂「无监督」机器翻译
人工智能学家
3+阅读 · 2018年1月7日
用于神经网络机器翻译的全并行文本生成
用于神经机器翻译的全并行文本生成
全球人工智能
7+阅读 · 2017年11月13日
Arxiv
6+阅读 · 2019年7月11日
Arxiv
9+阅读 · 2018年4月12日
Arxiv
10+阅读 · 2018年3月22日
VIP会员
相关资讯
了解情感分析中的NLP技术么?
七月在线实验室
9+阅读 · 2019年4月12日
干货 | 揭开多语言词嵌入模型的神秘面纱
AI科技评论
5+阅读 · 2018年4月3日
已删除
生物探索
3+阅读 · 2018年2月10日
没有数据也能翻译?一文读懂「无监督」机器翻译
人工智能学家
3+阅读 · 2018年1月7日
用于神经网络机器翻译的全并行文本生成
用于神经机器翻译的全并行文本生成
全球人工智能
7+阅读 · 2017年11月13日
Top
微信扫码咨询专知VIP会员