一个基本的因果建模任务是在观察到的协变量X存在的情况下,预测干预(或治疗)D= D对结果Y的影响。我们可以通过将条件平均E(Y|X,D)的估计gamma(X,D)除以P(X),来获得平均治疗效果(ATE: D干预的预期结果)。更复杂的因果问题需要更细致的处理。例如,被治疗者的平均治疗(ATT)解决了一个反事实:在接受治疗的亚群体中,治疗d'的结果是什么?在这种情况下,我们必须在条件分布P(X\d)上边缘化伽玛,这对连续多变量d来说是一个挑战。许多附加的因果问题要求我们在条件分布上边缘化,包括条件ATE、调解分析、动态治疗效应、并使用代理变量校正未观察到的混杂因素。我们使用核方法在非参数设置中解决这些问题,核方法可以应用于非常一般的处理D和协变量X(连续多元,字符串,组,…)。我们通过核岭回归学习\gamma,并使用核条件均值嵌入对条件分布进行边缘化,这可以被认为是两阶段最小二乘的推广。在一般的平滑假设下,我们提供了强大的统计保证,以及一个简单而稳健的实现(几行代码)。
https://informatics.research.ufl.edu/wp-content/uploads/Arthur-Gretton-talk.pdf