【苏黎世联邦理工博士论文】因果推断的混杂调整

2022 年 11 月 7 日 专知


混杂现象,即治疗和结果变量都受到某些“混杂”变量的影响,是有效因果推断的最大挑战之一 。它支撑了统计中的许多谬误和误解,如辛普森悖论或“相关性并不意味着因果关系”的例子。因此,混杂调整是因果关系领域的核心。然而,这通常不是一项容易的任务,即使我们的数据的因果结构是已知的。混杂变量的维度可能很大,混杂变量可以是离散的,连续的或分类变量的混合,或者它们可以以非参数的方式影响感兴趣的变量。
https://www.research-collection.ethz.ch/handle/20.500.11850/528993
当混杂变量在手边的数据集中是已知的和可观察到的情况下,存在许多不同的混杂调整方法 。然而,很少有研究考虑到当混杂是潜在的具有挑战性的情况。尽管因果文献中普遍存在不存在未观察到的混杂因素的假设,但在实践中往往并不成立。这种数据模型的错误规范可能会导致传统方法的性能下降。在这篇论文中,我们引入了新的混杂调整方法,既解决了混杂未被观察到的情况,也解决了混杂变量被观察到的情况,但它们对感兴趣的变量的影响相当复杂,因此传统的方法不适用。
在论文A中,我们探讨了潜在混杂的调整问题。由于这个问题极具挑战性,我们考虑一个简单的情况,即数据来自(高维)线性模型,混合变量线性影响观察变量。本文提出频谱反创始估计器,在对数据应用精心选择的线性变换后使用标准Lasso。我们得到了有趣的理论结果,并通过实证验证了它优于忽略潜在混杂存在的传统方法。
在论文B中,我们提出了双去偏Lasso估计器,可以看作是谱反发现估计器的推广,其优点是具有良好的渐近分布,从而允许构造渐近有效的置信区间。所提供的理论分析非常详细,并扩展了论文A的理论结果。
论文C考虑了生物统计学中的一个重要问题,即检测两种情况(例如癌症和正常细胞)之间因果网络的扰动。提出的方法也扩展到考虑潜在的潜在混杂。虽然它不是直接应用论文A和论文B中开发的方法,但它分享了论文A和论文B中开发的主要思想。在论文D中,我们讨论了观察到混杂的情况,但这种情况可能非常复杂。我们提出了一种称为分布随机森林的通用方法,它能够非参数估计多变量联合条件分布。这是以一种无模型和无目标的方式完成的,因此可以用于许多不同的学习问题,而不仅仅是最初的因果效应估计的混杂调整问题。




专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“DEAD” 就可以获取【NeurIPS 2022】扩散模型的深度平衡方法》专知下载链接

                       
专知,专业可信的人工智能知识分发 ,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取100000+AI(AI与军事、医药、公安等)主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取100000+AI主题知识资料

登录查看更多
4

相关内容

【华盛顿大学博士论文】因果模型的似然分析,190页pdf
专知会员服务
35+阅读 · 2022年11月14日
【MIT博士论文】因果推论在社会和工程系统应用,348页pdf
【经典书】统计学中的因果推断,156页pdf
专知会员服务
95+阅读 · 2022年6月14日
【ETH博士论文】贝叶斯深度学习,241页pdf
专知会员服务
127+阅读 · 2022年1月16日
【NeurIPS2021】学习用于分布外预测的因果语义表示
专知会员服务
18+阅读 · 2021年11月19日
去伪存真:因果约束下的图神经网络泛化
PaperWeekly
0+阅读 · 2022年2月10日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
26+阅读 · 2011年12月31日
国家自然科学基金
5+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
14+阅读 · 2022年10月15日
Arxiv
23+阅读 · 2022年2月24日
Arxiv
65+阅读 · 2021年6月18日
Arxiv
103+阅读 · 2021年6月8日
Arxiv
14+阅读 · 2020年12月17日
Optimization for deep learning: theory and algorithms
Arxiv
105+阅读 · 2019年12月19日
Arxiv
15+阅读 · 2019年9月30日
VIP会员
相关VIP内容
相关基金
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
26+阅读 · 2011年12月31日
国家自然科学基金
5+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
相关论文
Arxiv
14+阅读 · 2022年10月15日
Arxiv
23+阅读 · 2022年2月24日
Arxiv
65+阅读 · 2021年6月18日
Arxiv
103+阅读 · 2021年6月8日
Arxiv
14+阅读 · 2020年12月17日
Optimization for deep learning: theory and algorithms
Arxiv
105+阅读 · 2019年12月19日
Arxiv
15+阅读 · 2019年9月30日
Top
微信扫码咨询专知VIP会员