Randomized experiments are the gold standard for causal inference. In experiments, usually one variable is manipulated and its effect is measured on an outcome. However, practitioners may also be interested in the effect on a fixed target variable of simultaneous interventions on multiple covariates. We propose a novel method that allows to estimate the effect of joint interventions using data from different experiments in which only very few variables are manipulated. If the joint causal effect is linear, the proposed method can be used for estimation and inference of joint causal effects, and we characterize conditions for identifiability. The proposed method allows to combine data sets arising from randomized experiments as well as observational data sets for which IV assumptions or unconfoundedness hold: we indicate how to leverage all the available causal information to efficiently estimate the causal effects in the overidentified setting. If the dimension of the covariate vector is large, we may have data from experiments on every covariate, but only a few samples per randomized covariate. Under a sparsity assumption, we derive an estimator of the causal effects in this high-dimensional scenario. In addition, we show how to deal with the case where a lack of experimental constraints prevents direct estimation of the causal effects. When the joint causal effects are non-linear, we characterize conditions under which identifiability holds, and propose a non-linear causal aggregation methodology for experimental data sets similar to the gradient boosting algorithm where in each iteration we combine weak learners trained on different datasets using only unconfounded samples. We demonstrate the effectiveness of the proposed method on simulated and semi-synthetic data.


翻译:随机实验是因果推断的黄金标准。 在实验中, 通常对一个变量进行操纵, 并测量其效果结果。 但是, 实践者也可能对多个共变体同时干预对固定目标变量的影响感兴趣。 我们提出一种新的方法, 以便利用不同实验的数据来估计联合干预的效果, 而这些实验中只有很少的变量被操纵。 如果联合因果关系效应是线性的, 拟议的方法可以用来估计和推断共同因果关系效应, 我们给出了可识别性的条件。 拟议的方法允许将随机实验产生的数据集以及观测数据组合结合起来, 而观测数据集则是IV假设或无根据性所维持的: 我们表示如何利用所有可用的因果信息来有效估计超常设定环境中的因果效应。 如果共变异矢量的尺寸很大, 我们可能从每个变量的实验中获得数据, 但随机变数中只有少量的样本。 我们假设了这一高维度情景的因果关系效果的计算结果。 此外, 我们展示了如何利用所有可用的因果信息来有效估量 。 我们如何在每类正变的因果评估中, 我们如何使用不具有共同的因果分析方法 。

0
下载
关闭预览

相关内容

专知会员服务
52+阅读 · 2020年9月7日
因果图,Causal Graphs,52页ppt
专知会员服务
238+阅读 · 2020年4月19日
2019年机器学习框架回顾
专知会员服务
35+阅读 · 2019年10月11日
【哈佛大学商学院课程Fall 2019】机器学习可解释性
专知会员服务
99+阅读 · 2019年10月9日
【泡泡汇总】CVPR2019 SLAM Paperlist
泡泡机器人SLAM
14+阅读 · 2019年6月12日
Hierarchically Structured Meta-learning
CreateAMind
23+阅读 · 2019年5月22日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
【学习】(Python)SVM数据分类
机器学习研究会
6+阅读 · 2017年10月15日
【学习】Hierarchical Softmax
机器学习研究会
4+阅读 · 2017年8月6日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Meta Learning for Causal Direction
Arxiv
5+阅读 · 2020年7月6日
Arxiv
108+阅读 · 2020年2月5日
VIP会员
相关资讯
【泡泡汇总】CVPR2019 SLAM Paperlist
泡泡机器人SLAM
14+阅读 · 2019年6月12日
Hierarchically Structured Meta-learning
CreateAMind
23+阅读 · 2019年5月22日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
【学习】(Python)SVM数据分类
机器学习研究会
6+阅读 · 2017年10月15日
【学习】Hierarchical Softmax
机器学习研究会
4+阅读 · 2017年8月6日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Top
微信扫码咨询专知VIP会员