In this work we study the problem of measuring the fairness of a machine learning model under noisy information. Focusing on group fairness metrics, we investigate the particular but common situation when the evaluation requires controlling for the confounding effect of covariate variables. In a practical setting, we might not be able to jointly observe the covariate and group information, and a standard workaround is to then use proxies for one or more of these variables. Prior works have demonstrated the challenges with using a proxy for sensitive attributes, and strong independence assumptions are needed to provide guarantees on the accuracy of the noisy estimates. In contrast, in this work we study using a proxy for the covariate variable and present a theoretical analysis that aims to characterize weaker conditions under which accurate fairness evaluation is possible. Furthermore, our theory identifies potential sources of errors and decouples them into two interpretable parts $\gamma$ and $\epsilon$. The first part $\gamma$ depends solely on the performance of the proxy such as precision and recall, whereas the second part $\epsilon$ captures correlations between all the variables of interest. We show that in many scenarios the error in the estimates is dominated by $\gamma$ via a linear dependence, whereas the dependence on the correlations $\epsilon$ only constitutes a lower order term. As a result we expand the understanding of scenarios where measuring model fairness via proxies can be an effective approach. Finally, we compare, via simulations, the theoretical upper-bounds to the distribution of simulated estimation errors and show that assuming some structure on the data, even weak, is key to significantly improve both theoretical guarantees and empirical results.


翻译:在这项工作中,我们研究了在噪音信息下衡量机器学习模型公平性的问题。 以群体公平度衡量为焦点, 我们调查了在评估需要控制共变变量混杂效应的情况下, 特定但常见的情况。 在实际环境下, 我们可能无法共同观察共变和组信息, 标准变通方法是使用一个或一个以上变量的代理。 先前的工程展示了使用敏感属性替代工具的挑战, 并且需要强有力的独立假设来提供对噪音估算准确性的保证。 相反, 我们研究的这项工作中, 使用共变变量的代理数据, 并提出理论分析, 旨在描述准确公平性评估可能的薄弱条件。 此外, 我们的理论可能无法共同观测出错误的潜在来源, 并把它们分解成两个可解释的部分 $gamma 和 $ eepslon$ 。 第一部分仅取决于替代模型的性能, 例如精确和回顾, 而第二部分 美元 则需要为测算所有利息变量之间的关联性。 相比之下, 我们使用共变数变量的替代值变量, 并进行理论分析 分析 度 度 。 我们显示, 在 以 美元 度 度 度 度 度 度 度 度 度 度 数据 假设 中 中 的 的 最终 将 将 数据 数据 的 将 以 以 度 以 度 度 以 度 度 以 度 以 以 度 度 度 度 度 表示 表示 以 以 度 度 度 度 度 度 表示 表示 度 度 表示 表示 表示 表示 表示 表示 表示 表示 表示 表示 表示 度 表示 表示 表示 表示 表示 表示 表示 表示 表示 度 表示 表示 表示 表示 表示 表示 表示 表示 表示 表示 表示 表示 度 表示 度 表示 表示 表示 表示 表示 表示 表示 表示 表示 表示 表示 表示 表示 表示 表示 表示 表示 表示 表示 表示 表示 表示 表示 表示 表示 表示 表示 表示 表示 表示 表示 表示 表示 表示 表示 表示 表示 表示 表示

0
下载
关闭预览

相关内容

专知会员服务
91+阅读 · 2021年6月3日
IJCAI2020接受论文列表,592篇论文pdf都在这了!
专知会员服务
63+阅读 · 2020年7月16日
因果图,Causal Graphs,52页ppt
专知会员服务
243+阅读 · 2020年4月19日
【深度学习视频分析/多模态学习资源大列表】
专知会员服务
91+阅读 · 2019年10月16日
强化学习最新教程,17页pdf
专知会员服务
174+阅读 · 2019年10月11日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用
专知会员服务
39+阅读 · 2019年10月9日
Transferring Knowledge across Learning Processes
CreateAMind
27+阅读 · 2019年5月18日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
计算机视觉近一年进展综述
机器学习研究会
9+阅读 · 2017年11月25日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
【学习】Hierarchical Softmax
机器学习研究会
4+阅读 · 2017年8月6日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Arxiv
0+阅读 · 2021年7月8日
Arxiv
4+阅读 · 2018年1月15日
VIP会员
相关VIP内容
专知会员服务
91+阅读 · 2021年6月3日
IJCAI2020接受论文列表,592篇论文pdf都在这了!
专知会员服务
63+阅读 · 2020年7月16日
因果图,Causal Graphs,52页ppt
专知会员服务
243+阅读 · 2020年4月19日
【深度学习视频分析/多模态学习资源大列表】
专知会员服务
91+阅读 · 2019年10月16日
强化学习最新教程,17页pdf
专知会员服务
174+阅读 · 2019年10月11日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用
专知会员服务
39+阅读 · 2019年10月9日
相关资讯
Transferring Knowledge across Learning Processes
CreateAMind
27+阅读 · 2019年5月18日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
计算机视觉近一年进展综述
机器学习研究会
9+阅读 · 2017年11月25日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
【学习】Hierarchical Softmax
机器学习研究会
4+阅读 · 2017年8月6日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Top
微信扫码咨询专知VIP会员