CVPR 2022：微笑识别也带性别歧视？浙大武大联合蚂蚁Adobe搞了个公平性提升框架

会员服务 ·

CVPR 2022：微笑识别也带性别歧视？浙大武大联合蚂蚁Adobe搞了个公平性提升框架

2022 年 4 月 22 日 量子位

作者：董小威
武汉大学

AI模型存在偏见怎么办？

近年来，AI在多个领域展现出卓越的性能，给人类生活带来便捷和改善。

与此同时，不少AI系统被发现存在对特定群体的偏见或者歧视现象。

犯罪预测系统COMPAS在美国被广泛使用，通过预测再次犯罪的可能性来指导判刑。

研究者发现，相比于白人，黑人被预测为高暴力犯罪风险的可能性竟然高77%。这里就存在一个严肃的问题：犯罪与否难道能由肤色来决定？

我们经常使用的搜索引擎也普遍存在偏见。如果搜索“护士”的图片，返回的结果中大部分都是女性。

亚马逊的员工招聘系统，被曝出倾向于给男性打高分，给女性打低分。

为什么AI系统存在偏见？它是如何学会的？多半是数据教会了它。

例如，在亚马逊的雇员数据中，男性远多于女性，导致AI学到了性别和录用间的虚假关联，误以为男性更有资格被录用。

针对这一问题，研究者提出了多种公平性提升方案，但它们本质上都要修改已部署的深度学习模型。

“如果已部署上线的深度学习模型存在偏见，如何在不修改模型的情况下提升公平性呢？”浙江大学王志波教授提出了这个问题。

针对该问题，浙大王志波和任奎团队联合武汉大学、蚂蚁集团与Adobe公司，提出了一种基于对抗性扰动的深度学习模型公平性提升方案，在无须改变已部署模型的情况下提升系统的公平性。

该方案的基本思想是：通过自适应地对输入数据添加对抗性扰动，阻止模型提取出敏感属性相关信息，保留目标任务相关信息，从而使得模型公平地对待不同敏感属性的群体，给出公平的预测结果。

公平性提升方案FAAP

FAAP框架包含已部署的模型、扰动生成器和判别器三个部分：

首先，用扰动生成器对图像添加对抗性扰动，扰动后的图像会输入到部署模型的特征提取器，获得图像的隐空间表示，并分别输入到标签预测器和判别器。

接着衡量扰动后的图像中包含的敏感属性的信息，训练判别器从隐空间表示中预测敏感属性，并对判别器进行更新。

之后对扰动生成器进行更新，欺骗判别器，使扰动后的图像在隐空间表示中不包含敏感属性的信息，同时使标签预测器的预测结果准确。

对以上步骤进行迭代，获得最终的扰动生成器，作为数据预处理单元，为已有的AI系统提升公平性。

模型预测真的变公平了吗？

通过观察注意力显著图可以发现，有性别偏见的微笑识别模型，会关注于原始图像的头发区域，不可避免地使用性别相关特征进行预测。相比之下，该方案可以让模型更关注于图像嘴部区域，从而不受敏感属性的影响，做出公平的预测：

使用T-SNE处理模型特征空间的输出，可以发现，带有性别偏见的模型，在特征空间能分辨出原始图像中不同性别的样本，因而区别对待不同性别的人群。相比之下，该方案让具有不同敏感属性的样本在特征空间发生混淆，使得它们被模型公平对待：

该项研究首次考虑在不改变深度学习模型的前提下提升公平性，提出的方案更贴合真实应用场景。

对于一般的部署模型，在基本不影响准确率的情况下，该方案可以大幅提升公平性，例如，在公平性指标DP和DEO上平均能够获得27.5%和66.1%的提升。

目前，该研究成果的相关论文“Fairness-aware Adversarial Perturbation Towards Bias Mitigation for Deployed Deep Models”已被CVPR 2022录用。

论文地址：

https://arxiv.org/abs/2203.01584

— 完 —

「人工智能」、「智能汽车」微信社群邀你加入！

欢迎关注人工智能、智能汽车的小伙伴们加入我们，与AI从业者交流、切磋，不错过最新行业发展&技术进展。

ps.加好友请务必备注您的姓名-公司-职位哦~

点这里👇关注我，记得标星哦～

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见~

登录查看更多

相关内容

公平性

关注 5

【哈佛大学】深度学习理论实证探究

专知会员服务

43+阅读 · 2021年11月1日

【ACM Multimedia2021-tutorial】可信赖多媒体分析

专知会员服务

18+阅读 · 2021年10月20日

【KDD 2021】算法公平性解释框架FACTS

专知会员服务

24+阅读 · 2021年8月27日

【WWW2021】动态排序学习最大化边际公平性

专知会员服务

13+阅读 · 2021年3月13日

【AAAI2021】缓解语言模型政治偏见

专知会员服务

22+阅读 · 2021年2月6日

【AAAI2021】信息瓶颈和有监督表征解耦

专知会员服务

21+阅读 · 2021年1月27日

【IJCAI2020】通过双向对抗训练生成中间域样本提升半监督域自适应效果

专知会员服务

35+阅读 · 2020年9月17日

CVPR 2020 最佳论文与最佳学生论文！

专知会员服务

36+阅读 · 2020年6月17日

【IJCAI2020】基于生成对抗模仿学习的多模态模仿学习算法框架

专知会员服务

58+阅读 · 2020年5月26日

Capsule Networks，胶囊网络，57页ppt，布法罗大学

专知会员服务

69+阅读 · 2020年2月29日

ACL 2022 | 提升支付宝搜索体验，蚂蚁、北大提出基于层次化对比学习的文本生成框架

机器之心

0+阅读 · 2022年5月27日

CVPR 2022 | 微笑识别也带性别歧视？浙大/武大/蚂蚁/Adobe搞了个公平性提升框架

CVer

0+阅读 · 2022年5月1日

【动态】 “人工智能安全与隐私”系列论坛第12期圆满落幕

中国图象图形学学会CSIG

0+阅读 · 2022年4月11日

浙大小姐姐搞出秃头生成器登CVPR，完美保留五官脸型，这就去给我的简历加加分

量子位

0+阅读 · 2022年4月10日

利用AI进行高精度图像编辑︰EditGAN（附链接）

大数据文摘

3+阅读 · 2022年3月30日

麻省理工研究：深度图像分类器，居然还会过度解读

学术头条

1+阅读 · 2022年1月29日

第一个GAN驱动的图像编辑框架！多伦多大学华人博士提出EditGAN，最注重细节的GAN模型

新智元

0+阅读 · 2021年11月22日

TPAMI 2019 | 鲁棒RGB-D人脸识别

计算机视觉life

11+阅读 · 2019年6月8日

CVPR 2018 论文解读 | 基于GAN和CNN的图像盲去噪

PaperWeekly

13+阅读 · 2019年1月22日

差异性公平视角下省域初始排污权分配模式与优化算法研究——基于不对称Nash谈判模型

国家自然科学基金

0+阅读 · 2015年12月31日

基于人脸的性别分类和年龄估计统一学习框架及其拓展研究

国家自然科学基金

0+阅读 · 2014年12月31日

员工使用企业内部社会化软件平台提升工作绩效的机理研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于面部遮挡的大学生心理测试视觉情绪计算模型研究

国家自然科学基金

2+阅读 · 2013年12月31日

基于快速视觉注意模型和深度学习的视觉跟踪

国家自然科学基金

8+阅读 · 2013年12月31日

基于人工免疫协同理论和多目标核优化的SAR图像分割框架及关键技术

国家自然科学基金

0+阅读 · 2013年12月31日

中国公共政策执行多样性的理论与实证研究——基于“制度激励-网络结构”的分析框架

国家自然科学基金

0+阅读 · 2013年12月31日

基于形状流形的自发性表情识别关键技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于高通量测序的细菌sRNA-靶标mRNA相互作用识别研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于利益演化和社会信任视角的食品安全监管绩效评估及风险预警研究

国家自然科学基金

0+阅读 · 2011年12月31日

Hierarchical Federated Learning with Privacy

Arxiv

0+阅读 · 2022年6月10日

BSM loss: A superior way in modeling aleatory uncertainty of fine_grained classification

Arxiv

0+阅读 · 2022年6月9日

NPBDREG: Uncertainty Assessment in Diffeomorphic Brain MRI Registration using a Non-parametric Bayesian Deep-Learning Based Approach

Arxiv

0+阅读 · 2022年6月9日

Bounding Training Data Reconstruction in Private (Deep) Learning

Arxiv

0+阅读 · 2022年6月9日

False Consensus, Information Theory, and Prediction Markets

Arxiv

0+阅读 · 2022年6月7日

Pix2seq: A Language Modeling Framework for Object Detection

Arxiv

10+阅读 · 2021年9月22日

A Survey on Deep Domain Adaptation and Tiny Object Detection Challenges, Techniques and Datasets

Arxiv

17+阅读 · 2021年7月16日

Personalized Cross-Silo Federated Learning on Non-IID Data

Arxiv

10+阅读 · 2021年1月7日

Exploring Visual Relationship for Image Captioning

Arxiv

15+阅读 · 2018年9月19日

An Interpretable Reasoning Network for Multi-Relation Question Answering

Arxiv

13+阅读 · 2018年6月1日

VIP会员