Informally, a 'spurious correlation' is the dependence of a model on some aspect of the input data that an analyst thinks shouldn't matter. In machine learning, these have a know-it-when-you-see-it character; e.g., changing the gender of a sentence's subject changes a sentiment predictor's output. To check for spurious correlations, we can 'stress test' models by perturbing irrelevant parts of input data and seeing if model predictions change. In this paper, we study stress testing using the tools of causal inference. We introduce counterfactual invariance as a formalization of the requirement that changing irrelevant parts of the input shouldn't change model predictions. We connect counterfactual invariance to out-of-domain model performance, and provide practical schemes for learning (approximately) counterfactual invariant predictors (without access to counterfactual examples). It turns out that both the means and implications of counterfactual invariance depend fundamentally on the true underlying causal structure of the data -- in particular, whether the label causes the features or the features cause the label. Distinct causal structures require distinct regularization schemes to induce counterfactual invariance. Similarly, counterfactual invariance implies different domain shift guarantees depending on the underlying causal structure. This theory is supported by empirical results on text classification.


翻译:非正式地说, “ 净关联” 是模型对输入数据的某些方面的依赖性, 分析员认为输入数据不应重要。 在机器学习中, 这些模型具有一个“ 知道- 当- 当- 当- 观察- 观察- 观察- ” 的特性; 例如, 改变句子主题的性别会改变情绪预测器的输出。 为了检查虚假关联性, 我们可以通过扰动输入数据中无关的部分来“ 压力测试” 模型, 并查看模型预测是否发生变化。 在本文中, 我们研究使用因果推断工具来进行压力测试。 我们引入反事实偏差作为要求的正规化, 要求改变投入中无关部分不应该改变模型预测。 我们把反事实变异性连接到主模型的性表现, 提供实用的学习计划( 约) 反真实性预测器( 没有反事实实例 ) 。 事实证明, 反真实性变异的手段和影响从根本上取决于数据的真正根本的因果结构 - 特别是, 标签是否导致这些特性或特性的变化不能改变模型的模型的模型预测性 。 不同的因果性结构需要不同的正正的理论结构 。 。 要求不同的因果变正的理结构要求 。

1
下载
关闭预览

相关内容

因果推断,Causal Inference:The Mixtape
专知会员服务
103+阅读 · 2021年8月27日
专知会员服务
27+阅读 · 2021年5月2日
专知会员服务
56+阅读 · 2021年4月12日
【新书】Python编程基础,669页pdf
专知会员服务
193+阅读 · 2019年10月10日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
【哈佛大学商学院课程Fall 2019】机器学习可解释性
专知会员服务
103+阅读 · 2019年10月9日
春招已近,这份GitHub万星的ML算法面试大全请收下
算法与数学之美
6+阅读 · 2019年2月27日
【TED】什么让我们生病
英语演讲视频每日一推
7+阅读 · 2019年1月23日
逆强化学习-学习人先验的动机
CreateAMind
15+阅读 · 2019年1月18日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
计算机视觉近一年进展综述
机器学习研究会
9+阅读 · 2017年11月25日
Capsule Networks解析
机器学习研究会
11+阅读 · 2017年11月12日
【推荐】决策树/随机森林深入解析
机器学习研究会
5+阅读 · 2017年9月21日
【推荐】RNN/LSTM时序预测
机器学习研究会
25+阅读 · 2017年9月8日
漫画:什么是Bitmap算法?
算法与数据结构
4+阅读 · 2017年8月6日
Arxiv
0+阅读 · 2022年1月7日
Arxiv
5+阅读 · 2020年12月10日
VIP会员
相关VIP内容
因果推断,Causal Inference:The Mixtape
专知会员服务
103+阅读 · 2021年8月27日
专知会员服务
27+阅读 · 2021年5月2日
专知会员服务
56+阅读 · 2021年4月12日
【新书】Python编程基础,669页pdf
专知会员服务
193+阅读 · 2019年10月10日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
【哈佛大学商学院课程Fall 2019】机器学习可解释性
专知会员服务
103+阅读 · 2019年10月9日
相关资讯
春招已近,这份GitHub万星的ML算法面试大全请收下
算法与数学之美
6+阅读 · 2019年2月27日
【TED】什么让我们生病
英语演讲视频每日一推
7+阅读 · 2019年1月23日
逆强化学习-学习人先验的动机
CreateAMind
15+阅读 · 2019年1月18日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
计算机视觉近一年进展综述
机器学习研究会
9+阅读 · 2017年11月25日
Capsule Networks解析
机器学习研究会
11+阅读 · 2017年11月12日
【推荐】决策树/随机森林深入解析
机器学习研究会
5+阅读 · 2017年9月21日
【推荐】RNN/LSTM时序预测
机器学习研究会
25+阅读 · 2017年9月8日
漫画:什么是Bitmap算法?
算法与数据结构
4+阅读 · 2017年8月6日
Top
微信扫码咨询专知VIP会员