【导读】哈佛大学公共卫生学院(HSPH)Miguel Hernan与Jamie Robins 教授共同编著了关于因果逻辑推断方面的书作《Causal Inference: What If》,总共分3个部分,22章,311多页,对因果推理的概念和方法做了系统性阐述,是各个领域包括经济学、健康医疗、心理学、计算机等从业人士的重要参鉴材料。

地址: https://www.hsph.harvard.edu/miguel-hernan/causal-inference-book/

在本书中,我们强调需要足够认真对待因果问题,才能明确表述它,我们还区别了数据和因果推断假设的不同作用。一旦建立了这些基础,因果推断就必然变得不那么随意,这有助于防止混淆。然后,本书描述了各种数据分析方法,这些方法可用于在收集一组人口中每个个体的数据时,在一组特定的假设下估算感兴趣的因果关系。本书的一个关键信息是,因果推断不能简化为用于数据分析技巧的集合。

本书分为三个难度越来越大的部分:第一部分讲述没有模型的因果推断(即,因果关系的非参数辨识),第二部分是关于模型的因果推论(即,通过参数化模型对因果关系的估计),第三部分从复杂的纵贯数据中得出因果关系的推断(即,估算时变处理的因果关系)。全书还专门设置了很多要点(Fine Points)和技术点(Technical points),解释了正文中提到的某些主题。要点针对所有读者,而技术点则是为接受过统计学方面中等程度训练的读者设计的。本书对之前分散在多个学科期刊中的因果推断概念和方法进行了紧凑的介绍。我们希望对因果推断感兴趣的任何学科的读者都能有所裨益,例如流行病、统计学、心理学、经济学、社会学、政治学、计算机科学。

第 1-10 章重点讲述一些基本概念,通过大量的简单实例和图形的方式,深入浅出地介绍了因果推断中的核心概念和方法。第 11-18 章讲述了各种各样用于进行因果推断的模型,包括工具变量法 (IV)、倾向得分匹配分析 (PSM)、调节效应、结构方程等。第 19-25 章介绍了较为复杂的情形,如面板数据、 动态处理效应、反馈效应等。

目录内容: 第一部分 无模型的因果推断 1 A definition of causal effect 3 2 Randomized experiments 13 3 Observational studies 25 4 Effect modification 41 5 Interaction 55 6 Graphical representation of causal effects 69 7 Confounding 83 8 Selection bias 99 9 Measurement bias 113 10 Random variability 123

第二部分 有模型的因果推断
11 Why model? 139 12 IP weighting and marginal structural models 149 13 Standardization and the parametric g-formula 161 14 G-estimation of structural nested models 171 15 Outcome regression and propensity scores 183 16 Instrumental variable estimation 193 17 Causal survival analysis 209 18 Variable selection for causal inference 223

第三部分 复杂纵向数据因果推断 19 Time-varying treatments 235
20 Treatment-confounder feedback 247 21 G-methods for time-varying treatments 257 22 Target trial emulation 277

成为VIP会员查看完整内容
0
75

相关内容

在因果关系领域,我们想要了解一个系统在干预(例如基因剔除实验)下是如何反应的。这些问题超出了统计上的依赖,因此不能用标准的回归或分类技术来回答。在本教程中,你将学习因果推理的有趣问题和该领域的最新发展。不需要事先了解因果关系。

第一部分: 我们引入结构化的因果模型和形式化的干预分布。我们定义因果效应,并说明如果因果结构已知,如何计算它们。

第二部分: 我们提出了三个可以用来从数据中推断因果结构的想法:(1)发现数据中的(条件)独立性,(2)限制结构方程模型和(3)利用因果模型在不同环境中保持不变的事实。

第三部分: 如果时间允许,我们将展示因果概念如何在更经典的机器学习问题中使用。

https://stat.mit.edu/news/four-lectures-causality/

成为VIP会员查看完整内容
0
43

为土木工程专业的学生和专业人士介绍概率机器学习的关键概念和技术;有许多循序渐进的例子、插图和练习。

这本书向土木工程的学生和专业人员介绍了概率机器学习的概念,以一种对没有统计学或计算机科学专业背景的读者可访问的方式提出了关键的方法和技术。通过一步步的例子、插图和练习,它清晰而直接地展示了不同的方法。掌握了材料,读者将能够理解更高级的机器学习文献,从这本书中提取。

本书介绍了概率机器学习的三个子领域的关键方法:监督学习、非监督学习和强化学习。它首先涵盖了理解机器学习所需的背景知识,包括线性代数和概率论。接着介绍了有监督和无监督学习方法背后的贝叶斯估计,以及马尔可夫链蒙特卡洛方法,该方法使贝叶斯估计能够在某些复杂情况下进行。这本书接着涵盖了与监督学习相关的方法,包括回归方法和分类方法,以及与非监督学习相关的概念,包括聚类、降维、贝叶斯网络、状态空间模型和模型校准。最后,本书介绍了不确定环境下理性决策的基本概念,以及不确定和序列上下文下理性决策的基本概念。在此基础上,这本书描述了强化学习的基础,虚拟代理学习如何通过试验和错误作出最优决策,而与它的环境交互。

目录内容: Chapter 1: 引言 Introduction Part one: 背景 Background
Chapter 2: 线性代数 Chapter 3: 概率理论 Probability Theory Chapter 4: 概率分布 Probability Distributions Chapter 5: 凸优化 Convex Optimization Part two: 贝叶斯估计 Bayesian Estimation Chapter 6: 从数据中学习 Learning from Data Chapter 7: 马尔科夫链蒙特卡洛 Markov Chain Monte Carlo
Part three: 监督学习 Supervised Learning Chapter 8: 回归 Regression Chapter 9: 分类 Classification Part four: 无监督学习 Unsupervised Learning Chapter 10: 聚类 Clustering Chapter 11: 贝叶斯网络 Bayesian Networks Chapter 12: 状态空间 State-Space Models Chapter 13: 模型 Model Calibration Part five: 强化学习 Reinforcement Learning Chapter 14: 不确定上下文决策 Decision in Uncertain Contexts Chapter 15: 序列决策 Sequential Decisions

成为VIP会员查看完整内容
0
58

本课程的教材是从机器学习的角度写的,是为那些有必要先决条件并对学习因果关系基础感兴趣的人而开设的。我尽我最大的努力整合来自许多不同领域的见解,利用因果推理,如流行病学、经济学、政治学、机器学习等。

有几个主要的主题贯穿全课程。这些主题主要是对两个不同类别的比较。当你阅读的时候,很重要的一点是你要明白书的不同部分适合什么类别,不适合什么类别。

统计与因果。即使有无限多的数据,我们有时也无法计算一些因果量。相比之下,很多统计是关于在有限样本中解决不确定性的。当给定无限数据时,没有不确定性。然而,关联,一个统计概念,不是因果关系。在因果推理方面还有更多的工作要做,即使在开始使用无限数据之后也是如此。这是激发因果推理的主要区别。我们在这一章已经做了这样的区分,并将在整本书中继续做这样的区分。

识别与评估。因果效应的识别是因果推论所独有的。这是一个有待解决的问题,即使我们有无限的数据。然而,因果推理也与传统统计和机器学习共享估计。我们将主要从识别因果效应(在第2章中,4和6)之前估计因果效应(第7章)。例外是2.5节和节4.6.2,我们进行完整的例子估计给你的整个过程是什么样子。

介入与观察。如果我们能进行干预/实验,因果效应的识别就相对容易了。这很简单,因为我们可以采取我们想要衡量因果效应的行动,并简单地衡量我们采取行动后的效果。观测数据变得更加复杂,因为数据中几乎总是引入混杂。

假设。将会有一个很大的焦点是我们用什么假设来得到我们得到的结果。每个假设都有自己的框来帮助人们注意到它。清晰的假设应该使我们很容易看到对给定的因果分析或因果模型的批评。他们希望,清晰地提出假设将导致对因果关系的更清晰的讨论。

成为VIP会员查看完整内容
0
98

有几个主要的主题贯穿全书。这些主题主要是对两个不同类别的比较。当你阅读的时候,很重要的一点是你要明白书的不同部分适合什么类别,不适合什么类别。

统计与因果。即使有无限多的数据,我们有时也无法计算一些因果量。相比之下,很多统计是关于在有限样本中解决不确定性的。当给定无限数据时,没有不确定性。然而,关联,一个统计概念,不是因果关系。在因果推理方面还有更多的工作要做,即使在开始使用无限数据之后也是如此。这是激发因果推理的主要区别。我们在这一章已经做了这样的区分,并将在整本书中继续做这样的区分。

识别与评估。因果效应的识别是因果推论所独有的。这是一个有待解决的问题,即使我们有无限的数据。然而,因果推理也与传统统计和机器学习共享估计。我们将主要从识别因果效应(在第2章中,4和6)之前估计因果效应(第7章)。例外是2.5节和节4.6.2,我们进行完整的例子估计给你的整个过程是什么样子。

介入与观察。如果我们能进行干预/实验,因果效应的识别就相对容易了。这很简单,因为我们可以采取我们想要衡量因果效应的行动,并简单地衡量我们采取行动后的效果。观测数据变得更加复杂,因为数据中几乎总是引入混杂。

假设。将会有一个很大的焦点是我们用什么假设来得到我们得到的结果。每个假设都有自己的框来帮助人们注意到它。清晰的假设应该使我们很容易看到对给定的因果分析或因果模型的批评。他们希望,清晰地提出假设将导致对因果关系的更清晰的讨论。

https://www.bradyneal.com/causal-inference-course

成为VIP会员查看完整内容
0
147

决策理论是现代人工智能和经济学的基础。本课程主要从统计学的角度,也从哲学的角度,为决策理论打下坚实的基础。本课程有两个目的:

  • 深入了解统计决策理论、实验设计的自动化方法,并将其与人类决策联系起来。
  • 通过开发算法和智能代理的实验,将该理论应用到强化学习和人工智能的实际问题中。

课程可分为两部分。

  • 第一部分,我们介绍了主观概率和效用的概念,以及如何用它们来表示和解决决策问题。然后讨论未知参数的估计和假设检验。最后,我们讨论了顺序抽样、顺序实验,以及更一般的顺序决策。

  • 第二部分是不确定性下的决策研究,特别是强化学习和专家咨询学习。首先,我们研究几个有代表性的统计模型。然后,我们给出了使用这些模型做出最优决策的算法的概述。最后,我们来看看学习如何根据专家的建议来行动的问题,这个领域最近在在线广告、游戏树搜索和优化方面有很多应用。

成为VIP会员查看完整内容
0
116

对因果推理的简明和自成体系的介绍,在数据科学和机器学习中越来越重要。

因果关系的数学化是一个相对较新的发展,在数据科学和机器学习中变得越来越重要。这本书提供了一个独立的和简明的介绍因果模型和如何学习他们的数据。在解释因果模型的必要性,讨论潜在的因果推论的一些原则,这本书教读者如何使用因果模型:如何计算干预分布,如何从观测推断因果模型和介入的数据,和如何利用因果思想经典的机器学习问题。所有这些主题都将首先以两个变量的形式进行讨论,然后在更一般的多元情况下进行讨论。对于因果学习来说,二元情况是一个特别困难的问题,因为经典方法中用于解决多元情况的条件独立不存在。作者认为分析因果之间的统计不对称是非常有意义的,他们报告了他们对这个问题十年来的深入研究。

本书对具有机器学习或统计学背景的读者开放,可用于研究生课程或作为研究人员的参考。文本包括可以复制和粘贴的代码片段、练习和附录,其中包括最重要的技术概念摘要。

首先,本书主要研究因果关系推理子问题,这可能被认为是最基本和最不现实的。这是一个因果问题,需要分析的系统只包含两个可观测值。在过去十年中,作者对这个问题进行了较为详细的研究。本书整理这方面的大部分工作,并试图将其嵌入到作者认为对研究因果关系推理问题的选择性至关重要的更大背景中。尽管先研究二元(bivariate)案例可能有指导意义,但按照章节顺序,也可以直接开始阅读多元(multivariate)章节;见图一。

第二,本书提出的解决方法来源于机器学习和计算统计领域的技术。作者对其中的方法如何有助于因果结构的推断更感兴趣,以及因果推理是否能告诉我们应该如何进行机器学习。事实上,如果我们不把概率分布描述的随机实验作为出发点,而是考虑分布背后的因果结构,机器学习的一些最深刻的开放性问题就能得到最好的理解。
成为VIP会员查看完整内容
0
318
小贴士
相关论文
Xinting Hu,Kaihua Tang,Chunyan Miao,Xian-Sheng Hua,Hanwang Zhang
0+阅读 · 3月8日
Paul Ralph,Nauman bin Ali,Sebastian Baltes,Domenico Bianculli,Jessica Diaz,Yvonne Dittrich,Neil Ernst,Michael Felderer,Robert Feldt,Antonio Filieri,Breno Bernard Nicolau de França,Carlo Alberto Furia,Greg Gay,Nicolas Gold,Daniel Graziotin,Pinjia He,Rashina Hoda,Natalia Juristo,Barbara Kitchenham,Valentina Lenarduzzi,Jorge Martínez,Jorge Melegati,Daniel Mendez,Tim Menzies,Jefferson Molleri,Dietmar Pfahl,Romain Robbes,Daniel Russo,Nyyti Saarimäki,Federica Sarro,Davide Taibi,Janet Siegmund,Diomidis Spinellis,Miroslaw Staron,Klaas Stol,Margaret-Anne Storey,Davide Taibi,Damian Tamburri,Marco Torchiano,Christoph Treude,Burak Turhan,Xiaofeng Wang,Sira Vegas
0+阅读 · 3月4日
References in Wikipedia: The Editors' Perspective
Lucie-Aimée Kaffee,Hady Elsahar
0+阅读 · 3月4日
Sugata Ghosh,Asok K. Nanda
0+阅读 · 3月3日
Zhonggang Zeng,Tien-Yien Li
0+阅读 · 3月2日
Sean Welleck,Jason Weston,Arthur Szlam,Kyunghyun Cho
5+阅读 · 2018年11月1日
Ahmet Iscen,Giorgos Tolias,Yannis Avrithis,Ondrej Chum
6+阅读 · 2018年3月29日
Top