The use of synthetic data generated by Generative Adversarial Networks (GANs) is widely used for a variety of tasks ranging from data augmentation to stylizing images. While practitioners celebrate this method as an economical way to obtain synthetic data to train data-hungry machine learning models or provide new features to users of mobile applications, it is unclear that they recognize the perils of such techniques when applied to an already-biased dataset. Although one expects GANs to replicate the distribution of the original data, in real-world settings with limited data and finite network capacity, GANs suffer from mode-collapse. In this paper, we show that popular (conditional and unconditional) GAN variants exacerbate biases along the axes of gender and skin tone in the generated data. First, we show readily accessible GAN variants such as DCGANs 'imagine' faces of synthetic engineering professors that have masculine facial features and fair skin tones. Further, architectures such as AdaGAN, ProGAN that attempt to address mode collapse issue cannot completely correct this behavior. Second, we show that a conditional GAN variant transforms input images of female faces to have more masculine features when asked to generate faces of engineering professors. Worse yet, prevalent filters on Snapchat end up consistently lightening the skin tones in women of color when trying to make face images appear more feminine. Thus, our study is meant to serve as a cautionary tale for practitioners and educate them about the side-effect of bias amplification when applying GAN-based techniques.


翻译:利用General Adversarial Network(GANs)生成的合成数据被广泛用于从数据增强到图像简化等各种任务。虽然从业者将这种方法视为一种获取合成数据以培训数据饥饿机器学习模型或为移动应用程序用户提供新特征的一种经济方法,但不清楚他们是否认识到这些技术在应用到已经带有偏差的数据集时的危险性。虽然人们期望GANs在现实世界中复制原始数据的分发,在数据有限和网络容量有限的环境中,GANs会受到模式崩溃的困扰。在本文件中,我们表明(有条件和无条件)GAN变异体会加剧在生成的数据中性别和肤色调子轴线上的偏见。首先,我们展示了很容易获得的GAN变体,如DCGANs'imagine'面面部具有阳性面特征,皮肤更美。此外,AdaGAN、ProGAN等结构试图解决模式崩溃问题,但无法完全纠正这一行为。第二,我们显示,在将GAN变体的基质的表面变体图像转化为正统的变体,当要求女性脸色变体时,我们不断变的GAN的GAN的变的图像最终变的图像在进行着的皮肤变。当要求时,使得女性脸更难的图像的表面的图像的表面变。

0
下载
关闭预览

相关内容

最新《生成式对抗网络》简介,25页ppt
专知会员服务
175+阅读 · 2020年6月28日
【阿尔托大学】图神经网络,Graph Neural Networks,附60页ppt
专知会员服务
184+阅读 · 2020年4月26日
强化学习最新教程,17页pdf
专知会员服务
182+阅读 · 2019年10月11日
[综述]深度学习下的场景文本检测与识别
专知会员服务
78+阅读 · 2019年10月10日
机器学习入门的经验与建议
专知会员服务
94+阅读 · 2019年10月10日
【哈佛大学商学院课程Fall 2019】机器学习可解释性
专知会员服务
105+阅读 · 2019年10月9日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
18+阅读 · 2018年12月24日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
已删除
将门创投
10+阅读 · 2018年5月2日
条件GAN重大改进!cGANs with Projection Discriminator
CreateAMind
8+阅读 · 2018年2月7日
计算机视觉近一年进展综述
机器学习研究会
9+阅读 · 2017年11月25日
gan生成图像at 1024² 的 代码 论文
CreateAMind
4+阅读 · 2017年10月31日
Adversarial Variational Bayes: Unifying VAE and GAN 代码
CreateAMind
7+阅读 · 2017年10月4日
【推荐】GAN架构入门综述(资源汇总)
机器学习研究会
10+阅读 · 2017年9月3日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Arxiv
38+阅读 · 2020年12月2日
Arxiv
4+阅读 · 2019年11月21日
Generative Adversarial Networks: A Survey and Taxonomy
VIP会员
相关VIP内容
最新《生成式对抗网络》简介,25页ppt
专知会员服务
175+阅读 · 2020年6月28日
【阿尔托大学】图神经网络,Graph Neural Networks,附60页ppt
专知会员服务
184+阅读 · 2020年4月26日
强化学习最新教程,17页pdf
专知会员服务
182+阅读 · 2019年10月11日
[综述]深度学习下的场景文本检测与识别
专知会员服务
78+阅读 · 2019年10月10日
机器学习入门的经验与建议
专知会员服务
94+阅读 · 2019年10月10日
【哈佛大学商学院课程Fall 2019】机器学习可解释性
专知会员服务
105+阅读 · 2019年10月9日
相关资讯
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
18+阅读 · 2018年12月24日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
已删除
将门创投
10+阅读 · 2018年5月2日
条件GAN重大改进!cGANs with Projection Discriminator
CreateAMind
8+阅读 · 2018年2月7日
计算机视觉近一年进展综述
机器学习研究会
9+阅读 · 2017年11月25日
gan生成图像at 1024² 的 代码 论文
CreateAMind
4+阅读 · 2017年10月31日
Adversarial Variational Bayes: Unifying VAE and GAN 代码
CreateAMind
7+阅读 · 2017年10月4日
【推荐】GAN架构入门综述(资源汇总)
机器学习研究会
10+阅读 · 2017年9月3日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Top
微信扫码咨询专知VIP会员