We propose a theoretical framework for the problem of learning a real-valued function which meets fairness requirements. This framework is built upon the notion of $\alpha$-relative (fairness) improvement of the regression function which we introduce using the theory of optimal transport. Setting $\alpha = 0$ corresponds to the regression problem under the Demographic Parity constraint, while $\alpha = 1$ corresponds to the classical regression problem without any constraints. For $\alpha \in (0, 1)$ the proposed framework allows to continuously interpolate between these two extreme cases and to study partially fair predictors. Within this framework we precisely quantify the cost in risk induced by the introduction of the fairness constraint. We put forward a statistical minimax setup and derive a general problem-dependent lower bound on the risk of any estimator satisfying $\alpha$-relative improvement constraint. We illustrate our framework on a model of linear regression with Gaussian design and systematic group-dependent bias, deriving matching (up to absolute constants) upper and lower bounds on the minimax risk under the introduced constraint. We provide a general post-processing strategy which enjoys fairness, risk guarantees and can be applied on top of any black-box algorithm. Finally, we perform a simulation study of the linear model and numerical experiments of benchmark data, validating our theoretical contributions.
翻译:我们为学习符合公平要求的真正价值的功能问题提出了一个理论框架,这个框架以我们采用最佳运输理论引入的回归功能的 $ alpha$- relational(公平性) 概念为基础,用最佳运输理论来精确量化风险成本。设置 $ alpha = 0$ 对应人口均等限制下的回归问题, 而$ alpha = 1美元对应经典回归问题, 没有任何限制。 对于 $ alpha = 1 美元, 拟议的框架允许在这两个极端案例之间不断互调, 并研究部分公平预测者。在这个框架内,我们精确量化引入公平限制所带来的风险成本。我们提出了一个统计缩微鼠设置,并对任何符合人口均等限制条件的估算者的风险产生一个一般的较低问题约束。 而对于任何满足 $\alpha $ 相对改善限制的回归问题, $ 美元 = 1美元 对应经典回归问题。 我们用高司的设计以及系统性的基于群体的有效偏差的偏差模型来说明我们的线性回归模型框架, 匹配(至绝对不变的) 和部分公平性预测者。 在这个框架内,我们可以对引入的微缩缩缩缩风险的上和低的理论模型进行一个一般的理论分析。我们进行一个一般的理论分析, 最后,我们进行一个用于的理论分析的理论分析, 标准, 进行任何最高分析, 的 的 的 进行一个基础, 进行任何高级的 的 的理论分析的 的 的 的实验性研究。