Causal inference is understood to be a very challenging problem with observational data alone. Without making additional strong assumptions, it is only typically possible given access to data arising from perturbing the underlying system. To identify causal relations among a collections of covariates and a target or response variable, existing procedures rely on at least one of the following assumptions: i) the target variable remains unperturbed, ii) the hidden variables remain unperturbed, and iii) the hidden effects are dense. In this paper, we consider a perturbation model for interventional data (involving soft and hard interventions) over a collection of Gaussian variables that does not satisfy any of these conditions and can be viewed as a mixed-effects linear structural causal model. We propose a maximum-likelihood estimator -- dubbed DirectLikelihood -- that exploits system-wide invariances to uniquely identify the population causal structure from perturbation data. Our theoretical guarantees also carry over to settings where the variables are non-Gaussian but are generated according to a linear structural causal model. Further, we demonstrate that the population causal parameters are solutions to a worst-case risk with respect to distributional shifts from a certain perturbation class. We illustrate the utility of our perturbation model and the DirectLikelihood estimator on synthetic data as well as real data involving protein expressions.


翻译:据理解,光观察数据就是一个极具挑战性的问题。在不做更多有力的假设的情况下,只有一般有可能获得从扰动基本系统产生的数据。为了确定共变数集与目标或反应变量之间的因果关系,现有程序至少依赖于以下假设之一:一)目标变量没有被扰动,二)隐藏变量仍然未受扰动,三)隐藏效应是密集的。在本文中,我们考虑的是干预数据(包括软和硬干预)的扰动模型(涉及软和硬干预)对收集高斯变量的干扰模型,这些变量不能满足任何这些条件,可被视为一种混合效应线性结构性因果关系模型。我们提议采用一个最大相似性估测算器 -- -- 隐含直接联系 -- -- 利用全系统的变量从扰动数据中独特地识别人口因果结构。我们理论上的保证还延续到各种结构变量不是伽西文,而是根据线性结构性结构模型生成的。此外,我们展示了从最差的数据分布到最差的数据分配方式,我们以最差的数据分配为直接性指标。我们展示了人口因果参数,从每级数据分配为最差的模型。

0
下载
关闭预览

相关内容

专知会员服务
44+阅读 · 2020年10月31日
Fariz Darari简明《博弈论Game Theory》介绍,35页ppt
专知会员服务
106+阅读 · 2020年5月15日
因果图,Causal Graphs,52页ppt
专知会员服务
238+阅读 · 2020年4月19日
深度强化学习策略梯度教程,53页ppt
专知会员服务
176+阅读 · 2020年2月1日
强化学习最新教程,17页pdf
专知会员服务
168+阅读 · 2019年10月11日
【哈佛大学商学院课程Fall 2019】机器学习可解释性
专知会员服务
99+阅读 · 2019年10月9日
IEEE | DSC 2019诚邀稿件 (EI检索)
Call4Papers
10+阅读 · 2019年2月25日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
【NIPS2018】接收论文列表
专知
5+阅读 · 2018年9月10日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
计算机视觉近一年进展综述
机器学习研究会
8+阅读 · 2017年11月25日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
Adversarial Variational Bayes: Unifying VAE and GAN 代码
CreateAMind
7+阅读 · 2017年10月4日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
自然语言处理(二)机器翻译 篇 (NLP: machine translation)
DeepLearning中文论坛
10+阅读 · 2015年7月1日
Arxiv
0+阅读 · 2021年3月11日
Arxiv
0+阅读 · 2021年3月10日
Arxiv
14+阅读 · 2020年12月17日
VIP会员
相关VIP内容
专知会员服务
44+阅读 · 2020年10月31日
Fariz Darari简明《博弈论Game Theory》介绍,35页ppt
专知会员服务
106+阅读 · 2020年5月15日
因果图,Causal Graphs,52页ppt
专知会员服务
238+阅读 · 2020年4月19日
深度强化学习策略梯度教程,53页ppt
专知会员服务
176+阅读 · 2020年2月1日
强化学习最新教程,17页pdf
专知会员服务
168+阅读 · 2019年10月11日
【哈佛大学商学院课程Fall 2019】机器学习可解释性
专知会员服务
99+阅读 · 2019年10月9日
相关资讯
IEEE | DSC 2019诚邀稿件 (EI检索)
Call4Papers
10+阅读 · 2019年2月25日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
【NIPS2018】接收论文列表
专知
5+阅读 · 2018年9月10日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
计算机视觉近一年进展综述
机器学习研究会
8+阅读 · 2017年11月25日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
Adversarial Variational Bayes: Unifying VAE and GAN 代码
CreateAMind
7+阅读 · 2017年10月4日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
自然语言处理(二)机器翻译 篇 (NLP: machine translation)
DeepLearning中文论坛
10+阅读 · 2015年7月1日
Top
微信扫码咨询专知VIP会员