A fundamental problem in statistics is to compare the outcomes attained by members of subpopulations. This problem arises in the analysis of randomized controlled trials, in the analysis of A/B tests, and in the assessment of fairness and bias in the treatment of sensitive subpopulations, especially when measuring the effects of algorithms and machine learning. Often the comparison makes the most sense when performed separately for individuals who are similar according to certain characteristics given by the values of covariates of interest; the separate comparisons can also be aggregated in various ways to compare across all values of the covariates. Separating, segmenting, or stratifying into those with similar values of the covariates is also known as "conditioning on" or "controlling for" those covariates; controlling for age or annual income is common. Two standard methods of controlling for covariates are (1) binning and (2) regression modeling. Binning requires making fairly arbitrary, yet frequently highly influential choices, and is unsatisfactorily temperamental in multiple dimensions, with multiple covariates. Regression analysis works wonderfully when there is good reason to believe in a particular parameterized regression model or classifier (such as logistic regression). Thus, there appears to be no extant canonical fully non-parametric regression for the comparison of subpopulations, not while conditioning on multiple specified covariates. Existing methods rely on analysts to make choices, and those choices can be debatable; analysts can deceive others or even themselves. The present paper aims to fill the gap, combining two ingredients: (1) recently developed methodologies for such comparisons that already exist when conditioning on a single scalar covariate and (2) the Hilbert space-filling curve that maps continuously from one dimension to multiple dimensions.
翻译:统计的一个根本问题在于如何比较亚组群成员获得的结果。 这个问题出现在分析随机控制试验、分析A/B测试、评估敏感亚群群处理的公平性和偏偏偏,特别是在衡量算法和机器学习的效果时。 比较通常最有道理。 比较对于与利益共变值的数值所赋予的某些特点相似的个人来说,分别进行时,比较最有意义。 单独比较也可以以不同的方式进行,以比较各种变量选择的所有值来比较。 在分析随机控制的试验、分析A/B测试,以及评估敏感亚群群群群群的处理的公平性和偏差,特别是在衡量算算算法和机器学习的效果时。 比较往往最容易发生的是,比较最常见的一个基本方法是:(1) 宾利和(2) 回归模型。 宾宁要求相当武断,但往往具有高度影响性的选择,在多个层面不令人满意地进行对比。 有多个变量的变量。 比较、分化、分解或分解或分解到类似值的变数值的变数分析在近期有很好的理由认为, 货币分析可以很好地进行,因此无法相信具体的后解、 或后解、 推、 推、 推、 推、 推、 推、 推、 推、 推、 推、 推、 、 推、 推、 推、 推、 推、 推、 推、 推、 推、 推、 推、 推、 、 推、 推、 、 、 、 、 推、 推、 、 、 推、 推、 、 、 、 推、 、 、 推、 、 推、 推、 、 、 、 推、 、 、 、 推、 、 推、 推、 推、 推、 推、 推、 、 、 、 、 推、 、 、 、 、 推、 推、 推、 推、 推、 推、 推、 、 、 、 、 、 、 、 推、 、 、 推、 推、 、 推、 推、 、 、 推、 推、 推、 推、 、