Deep predictive models often make use of spurious correlations between the label and the covariates that differ between training and test distributions. In many classification tasks, spurious correlations are induced by a changing relationship between the label and some nuisance variables correlated with the covariates. For example, in classifying animals in natural images, the background, which is the nuisance, can predict the type of animal, but this nuisance label relationship does not always hold. This nuisance-label relationship does not always hold. We formalize a family of distributions that only differ in the nuisance-label relationship and and introduce a distribution where this relationship is broken called the nuisance-randomized distribution. We introduce a set of predictive models built from the nuisance-randomized distribution with representations, that when conditioned on, do not correlate the label and the nuisance. For models in this set, we lower bound the performance for any member of the family with the mutual information between the representation and the label under the nuisance-randomized distribution. To build predictive models that maximize the performance lower bound, we develop Nuisance-Randomized Distillation (NURD). We evaluate NURD on a synthetic example, colored-MNIST, and classifying chest X-rays. When using non-lung patches as the nuisance in classifying chest X-rays, NURD produces models that predict pneumonia under strong spurious correlations.
翻译:深度预测模型往往使用标签与不同培训和测试分布之间差异的共变点之间的虚假关联。 在许多分类任务中, 标签和一些与共变点相关的麻烦变量之间的关系不断变化, 从而引发了虚假关联。 例如, 在自然图像中对动物进行分类时, 背景, 也就是讨厌, 可以预测动物的类型, 但这种令人不安的标签关系并不总是能维持。 这种骚扰标签关系并不总是能维持下去。 我们正式确定一个分布分布的组合, 分布的分布在骚扰标签关系和测试分布之间各有差异, 并引入一个分布的分布, 这种关系被打破时, 标签和一些骚扰异常变量的分布。 我们引入了一套预测模型, 建构了一套预测模型, 建构了骚扰- 随机分布, 设置时, 没有将标签和骚扰标签和骚扰标签关系联系起来。 对于这套模型, 我们降低了任何家庭成员的性能, 与我们进行不骚扰性标签- 标签- 不稳定性标签- 内部分配之间的相互信息, 并引入了一种预测性模型。 (我们用NUDLI- 进行 和 模拟 优化, 优化 优化 数据,, 将 优化 优化 数据 优化 优化 优化, 优化, 进行 进行 进行 进行 进行 进行 优化 进行 进行 进行 的 的 进行 更新 更新 进行 进行 更新- 进行 进行 更新- 更新- 更新- 和 更新- 更新- 数据 进行 进行 更新- 进行 进行 进行 更新- 进行 更新 进行 和 更新- 更新- 进行 进行 核比较 。