Written language carries explicit and implicit biases that can distract from meaningful signals. For example, letters of reference may describe male and female candidates differently, or their writing style may indirectly reveal demographic characteristics. At best, such biases distract from the meaningful content of the text; at worst they can lead to unfair outcomes. We investigate the challenge of re-generating input sentences to 'neutralize' sensitive attributes while maintaining the semantic meaning of the original text (e.g. is the candidate qualified?). We propose a gradient-based rewriting framework, Detect and Perturb to Neutralize (DEPEN), that first detects sensitive components and masks them for regeneration, then perturbs the generation model at decoding time under a neutralizing constraint that pushes the (predicted) distribution of sensitive attributes towards a uniform distribution. Our experiments in two different scenarios show that DEPEN can regenerate fluent alternatives that are neutral in the sensitive attribute while maintaining the semantics of other attributes.


翻译:书面文字含有明确和隐含的偏差,可以转移有意义的信号。例如,参考书可能以不同的方式描述男性和女性候选人,或者他们的写作风格可能间接揭示人口特征。充其量,这种偏差会分散对文本中有意义的内容的注意力;最坏的是,它们可能导致不公平的结果。我们调查了在保持原始文本的语义含义的同时,重新生成输入句“失效”敏感属性的挑战(例如,候选人有资格吗?)我们提议了一个基于梯度的重写框架,即检测和抄写以中立化(DEPEN),首先检测敏感成分并掩盖它们再生,然后在将敏感属性的(预先)分布推向统一分布的中性限制下,在解码时间干扰一代模式。我们在两种不同情况下的实验表明,DEPEN可以重新生成敏感属性中中性流的替代物,同时保持其他属性的语义。

0
下载
关闭预览

相关内容

专知会员服务
57+阅读 · 2021年10月12日
专知会员服务
65+阅读 · 2021年5月29日
专知会员服务
72+阅读 · 2021年5月21日
专知会员服务
28+阅读 · 2020年9月9日
【论文推荐】文本摘要简述
专知会员服务
69+阅读 · 2020年7月20日
强化学习最新教程,17页pdf
专知会员服务
177+阅读 · 2019年10月11日
LibRec 精选:AutoML for Contextual Bandits
LibRec智能推荐
7+阅读 · 2019年9月19日
【2019-26期】This Week in Extracellular Vesicles
外泌体之家
11+阅读 · 2019年6月28日
一文了解自然语言生成演变史!
AI前线
5+阅读 · 2019年5月2日
Nature 一周论文导读 | 2019 年 4 月 4 日
科研圈
7+阅读 · 2019年4月14日
自然语言生成的演变史
专知
25+阅读 · 2019年3月23日
已删除
将门创投
4+阅读 · 2018年11月20日
FastText的内部机制
黑龙江大学自然语言处理实验室
5+阅读 · 2018年7月25日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
A Survey on GANs for Anomaly Detection
Arxiv
7+阅读 · 2021年9月14日
Arxiv
6+阅读 · 2018年2月8日
Arxiv
3+阅读 · 2015年11月29日
VIP会员
相关资讯
LibRec 精选:AutoML for Contextual Bandits
LibRec智能推荐
7+阅读 · 2019年9月19日
【2019-26期】This Week in Extracellular Vesicles
外泌体之家
11+阅读 · 2019年6月28日
一文了解自然语言生成演变史!
AI前线
5+阅读 · 2019年5月2日
Nature 一周论文导读 | 2019 年 4 月 4 日
科研圈
7+阅读 · 2019年4月14日
自然语言生成的演变史
专知
25+阅读 · 2019年3月23日
已删除
将门创投
4+阅读 · 2018年11月20日
FastText的内部机制
黑龙江大学自然语言处理实验室
5+阅读 · 2018年7月25日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
Top
微信扫码咨询专知VIP会员