【MIT-ICLR2022】在机器学习模型中注入公平性, Injecting fairness into machine-learning models - 专知VIP

会员服务 ·

6

机器学习 · 公平性 · 麻省理工学院 (MIT) · 论文 ·

2022 年 3 月 7 日

【MIT-ICLR2022】在机器学习模型中注入公平性, Injecting fairness into machine-learning models

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

麻省理工学院(MIT)的研究人员发现，如果某一类型的机器学习模型使用一个不平衡的数据集进行训练，那么它学习到的偏差在事后是不可能修复的。他们开发了一种技术，无论训练数据集多么不平衡，都可以直接将公平性引入模型，从而提高模型在下游任务上的性能。

深度度量学习(DML)通过强调表示的相似结构，可以在较少的监督下进行学习。在诸如零样本检索等设置中，已经有很多工作在提高DML的泛化，但对其公平性的影响知之甚少。在这篇论文中，我们首次评估了在不平衡数据上训练的最先进的DML方法，并表明当用于下游任务时，这些表征对少数子群体的表现有负面影响。在本文中，我们首先通过分析表示空间的三个性质——类间对齐、类内对齐和均匀性，定义了DML中的公平性，并提出了非平衡DML基准中的公平性——finDML来描述表示公平性。利用finDML，我们发现DML表示中的偏差传播到常见的下游分类任务。令人惊讶的是，即使下游任务中的训练数据被重新平衡，这种偏差也会传播。为了解决这个问题，我们提出了部分属性去相关(Partial Attribute De-correlation, PARADE)来将敏感属性的特征表示去相关，并在嵌入空间和下游度量中减少子组之间的性能差距。

成为VIP会员查看完整内容

22

相关内容

机器学习

“机器学习是近20多年兴起的一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律，并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论，机器学习与统计推断学联系尤为密切，也被称为统计学习理论。算法设计方面，机器学习理论关注可以实现的，行之有效的学习算法。很多推论问题属于无程序可循难度，所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【ICLR 2022 paper解读】将公平性注入机器学习模型，降低模型偏差，即使用于训练模型的数据集是不平衡的

【ICLR 2022 paper解读】将公平性注入机器学习模型，降低模型偏差，即使用于训练模型的数据集是不平衡的

专知会员服务

33+阅读 · 2022年3月10日

【干货书】机器学习设计模式，408页pdf，Machine Learning Design Patterns

【干货书】机器学习设计模式，408页pdf，Machine Learning Design Patterns

专知会员服务

138+阅读 · 2022年2月6日

[ICLR2022]PU learning（Positive and Unlabeled learning）任务的mixup方法

[ICLR2022]PU learning（Positive and Unlabeled learning）任务的mixup方法

专知会员服务

19+阅读 · 2022年2月2日

【MIT】反偏差对比学习，Debiased Contrastive Learning

【MIT】反偏差对比学习，Debiased Contrastive Learning

专知会员服务

91+阅读 · 2020年7月4日

回顾机器学习公平的数学框架，Review of Mathematical frameworks for Fairness in Machine Learning

回顾机器学习公平的数学框架，Review of Mathematical frameworks for Fairness in Machine Learning

专知会员服务

38+阅读 · 2020年5月30日

【CVPR2020】视觉导航的神经拓扑SLAM，Neural Topological SLAM for Visual Navigation

【CVPR2020】视觉导航的神经拓扑SLAM，Neural Topological SLAM for Visual Navigation

专知会员服务

52+阅读 · 2020年5月26日

少标签数据学习，54页ppt

少标签数据学习，54页ppt

专知会员服务

204+阅读 · 2020年5月22日

【卡内基梅隆大学-CMU】机器学习中的公平性，Learning Fair Representations

【卡内基梅隆大学-CMU】机器学习中的公平性，Learning Fair Representations

专知会员服务

38+阅读 · 2020年2月29日

《机器学习与公平性》（Fairness and Machine Learning）新书发布，附181页PDF下载

《机器学习与公平性》（Fairness and Machine Learning）新书发布，附181页PDF下载

专知会员服务

78+阅读 · 2019年10月26日

【强化学习研讨会|Microsoft Research】安全公平的机器学习（Safe and Fair Machine Learning）

【强化学习研讨会|Microsoft Research】安全公平的机器学习（Safe and Fair Machine Learning）

专知会员服务

16+阅读 · 2019年10月3日

谷歌NIPS'21 | 如何让图神经网络更稳健？

谷歌NIPS'21 | 如何让图神经网络更稳健？

图与推荐

1+阅读 · 2022年3月22日

让图网络更稳健！谷歌提出SR-GNN，无惧数据标记偏差和领域转移

让图网络更稳健！谷歌提出SR-GNN，无惧数据标记偏差和领域转移

新智元

1+阅读 · 2022年3月18日

将公平注入AI：机器学习模型即使在不公平数据上训练也能产生公平输出

将公平注入AI：机器学习模型即使在不公平数据上训练也能产生公平输出

大数据文摘

2+阅读 · 2022年3月15日

【干货书】机器学习设计模式，408页pdf，Machine Learning Design Patterns

【干货书】机器学习设计模式，408页pdf，Machine Learning Design Patterns

专知

8+阅读 · 2022年2月6日

[ICLR2022]PU learning（Positive and Unlabeled learning）任务的mixup方法

[ICLR2022]PU learning（Positive and Unlabeled learning）任务的mixup方法

专知

0+阅读 · 2022年2月2日

最新进展：将包容性人物注释纳入 Open Image Extended 数据集

最新进展：将包容性人物注释纳入 Open Image Extended 数据集

TensorFlow

0+阅读 · 2021年7月27日

解读自监督学习(Self-Supervised Learning)几篇相关paper

解读自监督学习(Self-Supervised Learning)几篇相关paper

CVer

25+阅读 · 2020年2月21日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

77+阅读 · 2019年10月20日

吴恩达机器学习中文版笔记：异常检测（Anomaly Detection）

吴恩达机器学习中文版笔记：异常检测（Anomaly Detection）

大数据文摘

19+阅读 · 2018年4月29日

无监督学习：决策树AI异常检测

无监督学习：决策树AI异常检测

AI前线

15+阅读 · 2018年1月14日

基于分类能力结构度量与类相关性关系保留的特征选取方法研究

国家自然科学基金

1+阅读 · 2017年12月31日

近藤格点系统中的自旋轨道耦合和拓扑量子态

国家自然科学基金

0+阅读 · 2014年12月31日

空间目标全极化逆合成孔径雷达成像和特征提取研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于包间距离、直接以包为学习对象的多示例学习维数约减问题研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于超顺磁聚类和图割的复杂红外成像目标自动检测方法

国家自然科学基金

0+阅读 · 2013年12月31日

动态几何分析与三维重建

国家自然科学基金

2+阅读 · 2012年12月31日

容错存储系统的扩容问题研究

国家自然科学基金

0+阅读 · 2012年12月31日

特征值优化问题的理论和算法研究

国家自然科学基金

0+阅读 · 2012年12月31日

分布式密码系统中的基础协议与公平性研究

国家自然科学基金

0+阅读 · 2009年12月31日

网络攻击行为的高效在线机器学习技术研究

国家自然科学基金

1+阅读 · 2009年12月31日

Transformer Feed-Forward Layers Build Predictions by Promoting Concepts in the Vocabulary Space

Arxiv

0+阅读 · 2022年4月20日

Self-supervised Video Representation Learning with Cascade Positive Retrieval

Arxiv

0+阅读 · 2022年4月20日

Model Reprogramming: Resource-Efficient Cross-Domain Machine Learning

Arxiv

0+阅读 · 2022年4月14日

Automated Graph Machine Learning: Approaches, Libraries and Directions

Arxiv

20+阅读 · 2022年1月4日

Machine Learning Methods for Management UAV Flocks -- a Survey

Arxiv

40+阅读 · 2021年8月30日

A Survey of Human-in-the-loop for Machine Learning

Arxiv

35+阅读 · 2021年8月2日

Look-into-Object: Self-supervised Structure Modeling for Object Recognition

Look-into-Object: Self-supervised Structure Modeling for Object Recognition

Arxiv

15+阅读 · 2020年3月31日

A Survey of Reinforcement Learning Techniques: Strategies, Recent Development, and Future Directions

A Survey of Reinforcement Learning Techniques: Strategies, Recent Development, and Future Directions

Arxiv

80+阅读 · 2020年1月19日

XLNet: Generalized Autoregressive Pretraining for Language Understanding

Arxiv

14+阅读 · 2019年6月19日

Machine Learning: Basic Principles

Arxiv

26+阅读 · 2018年8月19日

VIP会员

相关主题

麻省理工学院 (MIT)

相关VIP内容

【ICLR 2022 paper解读】将公平性注入机器学习模型，降低模型偏差，即使用于训练模型的数据集是不平衡的

【ICLR 2022 paper解读】将公平性注入机器学习模型，降低模型偏差，即使用于训练模型的数据集是不平衡的

专知会员服务

33+阅读 · 2022年3月10日

【干货书】机器学习设计模式，408页pdf，Machine Learning Design Patterns

【干货书】机器学习设计模式，408页pdf，Machine Learning Design Patterns

专知会员服务

138+阅读 · 2022年2月6日

[ICLR2022]PU learning（Positive and Unlabeled learning）任务的mixup方法

[ICLR2022]PU learning（Positive and Unlabeled learning）任务的mixup方法

专知会员服务

19+阅读 · 2022年2月2日

【MIT】反偏差对比学习，Debiased Contrastive Learning

【MIT】反偏差对比学习，Debiased Contrastive Learning

专知会员服务

91+阅读 · 2020年7月4日

回顾机器学习公平的数学框架，Review of Mathematical frameworks for Fairness in Machine Learning

回顾机器学习公平的数学框架，Review of Mathematical frameworks for Fairness in Machine Learning

专知会员服务

38+阅读 · 2020年5月30日

【CVPR2020】视觉导航的神经拓扑SLAM，Neural Topological SLAM for Visual Navigation

【CVPR2020】视觉导航的神经拓扑SLAM，Neural Topological SLAM for Visual Navigation

专知会员服务

52+阅读 · 2020年5月26日

少标签数据学习，54页ppt

少标签数据学习，54页ppt

专知会员服务

204+阅读 · 2020年5月22日

【卡内基梅隆大学-CMU】机器学习中的公平性，Learning Fair Representations

【卡内基梅隆大学-CMU】机器学习中的公平性，Learning Fair Representations

专知会员服务

38+阅读 · 2020年2月29日

《机器学习与公平性》（Fairness and Machine Learning）新书发布，附181页PDF下载

《机器学习与公平性》（Fairness and Machine Learning）新书发布，附181页PDF下载

专知会员服务

78+阅读 · 2019年10月26日

【强化学习研讨会|Microsoft Research】安全公平的机器学习（Safe and Fair Machine Learning）

【强化学习研讨会|Microsoft Research】安全公平的机器学习（Safe and Fair Machine Learning）

专知会员服务

16+阅读 · 2019年10月3日

热门VIP内容

开通专知VIP会员享更多权益服务

面向性能、成本效益、云边隐私与可信性的大小语言模型协作综述

乌克兰太空研究（2022-2024年） | 176页

【CMU博士论文】大型语言模型的隐性特性

国防领域人工智能走向何方？

相关资讯

谷歌NIPS'21 | 如何让图神经网络更稳健？

谷歌NIPS'21 | 如何让图神经网络更稳健？

图与推荐

1+阅读 · 2022年3月22日

让图网络更稳健！谷歌提出SR-GNN，无惧数据标记偏差和领域转移

让图网络更稳健！谷歌提出SR-GNN，无惧数据标记偏差和领域转移

新智元

1+阅读 · 2022年3月18日

将公平注入AI：机器学习模型即使在不公平数据上训练也能产生公平输出

将公平注入AI：机器学习模型即使在不公平数据上训练也能产生公平输出

大数据文摘

2+阅读 · 2022年3月15日

【干货书】机器学习设计模式，408页pdf，Machine Learning Design Patterns

【干货书】机器学习设计模式，408页pdf，Machine Learning Design Patterns

专知

8+阅读 · 2022年2月6日

[ICLR2022]PU learning（Positive and Unlabeled learning）任务的mixup方法

[ICLR2022]PU learning（Positive and Unlabeled learning）任务的mixup方法

专知

0+阅读 · 2022年2月2日

最新进展：将包容性人物注释纳入 Open Image Extended 数据集

最新进展：将包容性人物注释纳入 Open Image Extended 数据集

TensorFlow

0+阅读 · 2021年7月27日

解读自监督学习(Self-Supervised Learning)几篇相关paper

解读自监督学习(Self-Supervised Learning)几篇相关paper

CVer

25+阅读 · 2020年2月21日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

77+阅读 · 2019年10月20日

吴恩达机器学习中文版笔记：异常检测（Anomaly Detection）

吴恩达机器学习中文版笔记：异常检测（Anomaly Detection）

大数据文摘

19+阅读 · 2018年4月29日

无监督学习：决策树AI异常检测

无监督学习：决策树AI异常检测

AI前线

15+阅读 · 2018年1月14日

相关基金

基于分类能力结构度量与类相关性关系保留的特征选取方法研究

国家自然科学基金

1+阅读 · 2017年12月31日

近藤格点系统中的自旋轨道耦合和拓扑量子态

国家自然科学基金

0+阅读 · 2014年12月31日

空间目标全极化逆合成孔径雷达成像和特征提取研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于包间距离、直接以包为学习对象的多示例学习维数约减问题研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于超顺磁聚类和图割的复杂红外成像目标自动检测方法

国家自然科学基金

0+阅读 · 2013年12月31日

动态几何分析与三维重建

国家自然科学基金

2+阅读 · 2012年12月31日

容错存储系统的扩容问题研究

国家自然科学基金

0+阅读 · 2012年12月31日

特征值优化问题的理论和算法研究

国家自然科学基金

0+阅读 · 2012年12月31日

分布式密码系统中的基础协议与公平性研究

国家自然科学基金

0+阅读 · 2009年12月31日

网络攻击行为的高效在线机器学习技术研究

国家自然科学基金

1+阅读 · 2009年12月31日

相关论文

Transformer Feed-Forward Layers Build Predictions by Promoting Concepts in the Vocabulary Space

Arxiv

0+阅读 · 2022年4月20日

Self-supervised Video Representation Learning with Cascade Positive Retrieval

Arxiv

0+阅读 · 2022年4月20日

Model Reprogramming: Resource-Efficient Cross-Domain Machine Learning

Arxiv

0+阅读 · 2022年4月14日

Automated Graph Machine Learning: Approaches, Libraries and Directions

Arxiv

20+阅读 · 2022年1月4日

Machine Learning Methods for Management UAV Flocks -- a Survey

Arxiv

40+阅读 · 2021年8月30日

A Survey of Human-in-the-loop for Machine Learning

Arxiv

35+阅读 · 2021年8月2日

Look-into-Object: Self-supervised Structure Modeling for Object Recognition

Look-into-Object: Self-supervised Structure Modeling for Object Recognition

Arxiv

15+阅读 · 2020年3月31日

A Survey of Reinforcement Learning Techniques: Strategies, Recent Development, and Future Directions

A Survey of Reinforcement Learning Techniques: Strategies, Recent Development, and Future Directions

Arxiv

80+阅读 · 2020年1月19日

XLNet: Generalized Autoregressive Pretraining for Language Understanding

Arxiv

14+阅读 · 2019年6月19日

Machine Learning: Basic Principles

Arxiv

26+阅读 · 2018年8月19日

微信扫码咨询专知VIP会员