因果推理在现实世界的许多领域都有许多应用,如教育、医疗健康、政治学、市场营销和在线广告。因果推理已经研究了几十年,然而传统方法在处理大规模、高维异构数据时能力有限。最近的研究工作表明,机器学习可以极大地促进因果推理任务,如治疗效果估计和反事实推理。同时,从观察数据中提取的因果知识可以增强机器学习模型的可靠性**。在本教程中,我们将介绍因果推理和机器学习交叉的全面概述。我们将从因果推理的背景开始,简要介绍几种传统的因果推理方法。然后介绍因果推理的机器学习算法,特别是基于表示学习的方法和基于图神经网络的方法;此外,还将讨论如何利用因果知识进行可信机器学习,如可解释性、公平性和鲁棒性等。最后,展示了这些方法在多个领域的有前景的工业应用**。
https://aaai23causalinference.github.io/
我们将首先用现实世界的例子来推动所提出的主题,例如在教育、营销、医疗健康、政治学和在线广告中提出的因果问题。然后,介绍因果推理的基本概念,以及基本的因果推理框架,如潜在结果框架和因果图模型;我们还将使用说明性的例子来解释这些概念和术语。然后,介绍因果推理中几个重要概念的形式定义和含义,包括反事实、平均处理效应(ATE)、平均处理效应对被处理单位(ATT)和个体处理效应(ITE)。简要介绍了因果推理的主要方法,包括实验研究和观察研究。我们将重点关注观察性研究的潜在结果框架,并提出具有基本假设的问题定义。
基于表示学习的方法
**在这一部分中,我们将首先简要介绍最近邻匹配和倾向得分匹配等传统的因果推理方法,讨论一些有趣的理论结果,然后介绍用于因果推理有效估计的表示学习方法。**本章还将讨论子空间学习的概念和基础。我们将涵盖子空间学习和深度表示学习方法。对于子空间学习方法,我们将介绍它们的思想并讨论它们的优缺点。这些算法包括但不限于:(1)一种用于反事实学习的信息子空间学习方法,通过希尔伯特-施密特独立性准则最大化候选子空间与结果变量之间的非线性依赖;(2)非线性平衡子空间学习算法,将反事实推理问题转换为分类问题,并学习核空间进行有效匹配。对于深度表示学习方法,我们将首先解释为什么因果推理和治疗效果估计将受益于深度表示学习,然后介绍最先进的基于深度表示学习的方法。这些方法包括但不限于:(1)平衡表示学习方法,该方法对表示空间施加一些与实验组距离相关的正则化,以获得平衡表示;(2)基于深度特征选择的治疗效果估计方法及理论分析;(3)基于对抗性学习的ITE估计方法,利用生成对抗网络(GANs)来捕获反事实分布。
基于图神经网络的方法
**在这一部分中,我们将超越传统的独立同分布(i.i.d)数据上的因果推理设置,并介绍图上因果推理的最新进展。**特别地,我们关注那些基于图神经网络(GNN)的方法,因为它们在这些问题上的有效性。具体来说,我们将涵盖两种类型的工作:基于图的去混淆和网络干扰。基于图的去混淆是由未观察到的混杂因素的问题激发的。如果处理不当,混淆因子(同时影响治疗和结果的变量)可能会导致因果效应估计的偏差。传统的因果推断依赖于无混淆性假设,即不存在任何未观察到的混淆因素。然而,这一假设在现实世界中经常被违背。基于图的反发现方法通过利用不同单元之间的图结构来捕获未观察到的混杂因素。这些方法包括但不限于:(1)用于ITE估计的网络反方器,它使用GNN来控制隐藏在图结构中未观察到的混杂因素;(2)动态网络反创建者,它考虑在一个时变的网络环境中整个问题,包括时变的处理方法、结果、干扰因子和网络结构。网络干扰方法放宽了传统因果推理中稳定单元处理值假设(SUTVA)。由于干涉的存在,对一个单元的处理可以通过它们在图中的联系对另一个单元的结果产生因果影响。介绍背景和最先进的基于GNN的网络干扰方法。这些方法包括但不限于:(1)节点表示学习方法,通过GNN中的图传播对干扰进行建模;(2)基于超图神经网络的方法,对超图上的高阶干扰进行建模。
因果推理辅助机器学习
在本部分中,我们将介绍如何利用因果关系而不是看似合理的相关性,来有效解决传统机器学习方法带来的鲁棒性和可解释性挑战。我们还将讨论如何从观察数据中利用因果知识来实现可靠的机器学习。 因果推理应用
在本部分中,我们将讨论如何将所介绍的技术应用于真实的应用场景。例如,在数字营销或在线广告领域,如何通过治疗效果估计来最大化可能的点击量。另一个例子是在推荐系统中加入因果推理的思想。同时,我们还将讨论现实世界的应用如何激发新的研究课题,并扩大因果推断的范围。例如,大多数现有的方法处理分类/数值数据类型,但是文本协变量通常在广告等实际应用中观察到。在这种巨大需求的推动下,最近的工作开始用文本协变量估计因果效果。
讲者:
综述论文:
Causal Effect Estimation: Recent Advances, Challenges, and Opportunities Learning Causality with Graphs Continual Causal Effect Estimation: Challenges and Opportunities A Survey on Causal Inference A Survey of Learning Causality with Data: Problems and Methods Causal Inference in Recommender Systems: A Survey of Strategies for Bias Mitigation, Explanation, and Generalization
目录内容:
1.Welcome from Organizers 2.Background on Causal Inference 3.Representation Learning based Methods 4.Graph Neural Networks based Methods 5.Causal Inference-aided Machine Learning 6.Causal Inference Applications 7.Future Directions