In this paper, we focus on the fairness issues regarding unsupervised outlier detection. Traditional algorithms, without a specific design for algorithmic fairness, could implicitly encode and propagate statistical bias in data and raise societal concerns. To correct such unfairness and deliver a fair set of potential outlier candidates, we propose Deep Clustering based Fair Outlier Detection (DCFOD) that learns a good representation for utility maximization while enforcing the learnable representation to be subgroup-invariant on the sensitive attribute. Considering the coupled and reciprocal nature between clustering and outlier detection, we leverage deep clustering to discover the intrinsic cluster structure and out-of-structure instances. Meanwhile, an adversarial training erases the sensitive pattern for instances for fairness adaptation. Technically, we propose an instance-level weighted representation learning strategy to enhance the joint deep clustering and outlier detection, where the dynamic weight module re-emphasizes contributions of likely-inliers while mitigating the negative impact from outliers. Demonstrated by experiments on eight datasets comparing to 17 outlier detection algorithms, our DCFOD method consistently achieves superior performance on both the outlier detection validity and two types of fairness notions in outlier detection.


翻译:在本文中,我们侧重于有关未经监督的外部探测的公平性问题。传统的算法,如果没有具体的算法公正设计,就可能隐含地编码和传播数据中的统计偏见,并引起社会关注。为了纠正这种不公平现象,并提供一套公平的潜在外部候选人,我们提议采用基于深度集群的公平外部探测(DCFOD)战略,在推广可学习的表示方式的同时,为效用最大化学习一种良好的代表性,同时实施可学习的表示方式,作为敏感属性的次类异性。考虑到集群和外部探测之间的结合和对等性质,我们利用深度集成来发现内在的集群结构和结构外的事例。与此同时,对抗性培训可以抹去公平适应情况的敏感模式。在技术上,我们建议采用实例级加权代表制学习战略,以加强联合深度集群和外部探测,其中动态重量模块在减少外部关系的消极影响的同时,重新强调可能的内线的贡献。从八个数据集与17个外部探测算法的实验中可以看出,我们的DCFOD方法在外部探测有效性和两种类型的公平性概念中始终都取得了优异性。

0
下载
关闭预览

相关内容

MIT《图神经网络的任务结构与泛化》,22页ppt
专知会员服务
23+阅读 · 2021年2月28日
专知会员服务
42+阅读 · 2020年7月7日
知识图谱推理,50页ppt,Salesforce首席科学家Richard Socher
专知会员服务
106+阅读 · 2020年6月10日
异常检测(Anomaly Detection)综述
极市平台
20+阅读 · 2020年10月24日
深度卷积神经网络中的降采样
极市平台
12+阅读 · 2019年5月24日
深度自进化聚类:Deep Self-Evolution Clustering
我爱读PAMI
15+阅读 · 2019年4月13日
无监督元学习表示学习
CreateAMind
27+阅读 · 2019年1月4日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
Focal Loss for Dense Object Detection
统计学习与视觉计算组
11+阅读 · 2018年3月15日
Arxiv
7+阅读 · 2020年8月7日
Clustered Object Detection in Aerial Images
Arxiv
5+阅读 · 2019年8月27日
Deep Anomaly Detection with Outlier Exposure
Arxiv
17+阅读 · 2018年12月21日
VIP会员
相关资讯
异常检测(Anomaly Detection)综述
极市平台
20+阅读 · 2020年10月24日
深度卷积神经网络中的降采样
极市平台
12+阅读 · 2019年5月24日
深度自进化聚类:Deep Self-Evolution Clustering
我爱读PAMI
15+阅读 · 2019年4月13日
无监督元学习表示学习
CreateAMind
27+阅读 · 2019年1月4日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
Focal Loss for Dense Object Detection
统计学习与视觉计算组
11+阅读 · 2018年3月15日
Top
微信扫码咨询专知VIP会员