Natural Language Processing (NLP) systems learn harmful societal biases that cause them to amplify inequality as they are deployed in more and more situations. To guide efforts at debiasing these systems, the NLP community relies on a variety of metrics that quantify bias in models. Some of these metrics are intrinsic, measuring bias in word embedding spaces, and some are extrinsic, measuring bias in downstream tasks that the word embeddings enable. Do these intrinsic and extrinsic metrics correlate with each other? We compare intrinsic and extrinsic metrics across hundreds of trained models covering different tasks and experimental conditions. Our results show no reliable correlation between these metrics that holds in all scenarios across tasks and languages. We urge researchers working on debiasing to focus on extrinsic measures of bias, and to make using these measures more feasible via creation of new challenge sets and annotated test data. To aid this effort, we release code, a new intrinsic metric, and an annotated test set focused on gender bias in hate speech.


翻译:自然语言处理系统(NLP)学会了有害的社会偏见,导致它们扩大不平等,因为它们在越来越多的情况下被运用。为了指导贬低这些制度的努力,NLP社区依靠各种衡量标准来量化模型中的偏向。其中一些衡量标准是内在的,衡量文字嵌入空间中的偏向,有些则是外在的,衡量词嵌入所促成的下游任务中的偏向。这些内在的和外在的衡量标准是相互联系的。我们将这些内在的和外在的衡量标准在涉及不同任务和实验条件的数百个经过训练的模型中进行比较。我们的结果显示,这些衡量标准之间没有可靠的关联性,这些衡量标准存在于各种任务和语言的所有情况中。我们敦促从事偏向性研究的研究人员把重点放在偏见的极端衡量标准上,并通过创建新的挑战数据集和附加说明的测试数据使这些措施的使用更加可行。为了帮助这一努力,我们发布了代码、新的内在的衡量标准,以及侧重于仇恨言论中的性别偏见的附加说明的测试组。

0
下载
关闭预览

相关内容

【图与几何深度学习】Graph and geometric deep learning,49页ppt
专知会员服务
41+阅读 · 2021年4月2日
【干货书】机器学习速查手册,135页pdf
专知会员服务
125+阅读 · 2020年11月20日
【快讯】KDD2020论文出炉,216篇上榜, 你的paper中了吗?
专知会员服务
50+阅读 · 2020年5月16日
因果图,Causal Graphs,52页ppt
专知会员服务
246+阅读 · 2020年4月19日
机器学习入门的经验与建议
专知会员服务
92+阅读 · 2019年10月10日
最新BERT相关论文清单,BERT-related Papers
专知会员服务
52+阅读 · 2019年9月29日
已删除
将门创投
10+阅读 · 2019年3月6日
Arxiv
0+阅读 · 2021年7月29日
Arxiv
13+阅读 · 2019年1月26日
VIP会员
相关VIP内容
【图与几何深度学习】Graph and geometric deep learning,49页ppt
专知会员服务
41+阅读 · 2021年4月2日
【干货书】机器学习速查手册,135页pdf
专知会员服务
125+阅读 · 2020年11月20日
【快讯】KDD2020论文出炉,216篇上榜, 你的paper中了吗?
专知会员服务
50+阅读 · 2020年5月16日
因果图,Causal Graphs,52页ppt
专知会员服务
246+阅读 · 2020年4月19日
机器学习入门的经验与建议
专知会员服务
92+阅读 · 2019年10月10日
最新BERT相关论文清单,BERT-related Papers
专知会员服务
52+阅读 · 2019年9月29日
相关资讯
已删除
将门创投
10+阅读 · 2019年3月6日
Top
微信扫码咨询专知VIP会员