从推荐买什么,看什么电影,到选择看什么新闻,关注什么人,申请什么工作,在线系统已经成为我们日常生活的重要组成部分。一个自然要问的问题是这些社会技术系统如何影响我们的行为。然而,由于这些系统的输出和人的行为之间的复杂的相互作用,确定它们对人的行为的影响是不容易的。
幸运的是,有大量关于因果推理的研究可供我们借鉴。在本教程的第一部分中,我将展示反事实推理对研究社会技术系统的价值,通过展示基于相关性的预测建模如何可能适得其反。然后,我们将讨论因果推断的不同方法,包括随机实验,自然实验,如工具变量和回归不连续,以及观察方法,如分层和匹配。在整个过程中,我们将尝试与图形模型、机器学习和过去在社会科学中的工作联系起来。
下半场将会有更多的实践。我们将通过一个实际的例子来估计一个推荐系统的因果影响,从简单到复杂的方法开始。实践练习的目标是了解不同因果推理方法的缺陷,并获得用混乱的真实世界数据进行因果推理的最佳实践。
使用的代码可以在https://github.com/amit-sharma/causal-inference-tutorial/上找到