一个额外的网络营销美元将会带来多少买家?哪些客户只有在获得折扣券时才会购买?如何建立最优的定价策略?确定我们可以利用的手段如何影响我们想要驱动的商业指标的最佳方法是通过因果推断。 在这本书中,Nubank的高级数据科学家Matheus Facure解释了因果推断用于估计影响和效果的巨大潜力。经理、数据科学家和商业分析师将学习到像随机对照试验(A/B测试)、线性回归、倾向性评分、合成控制和差异-差异等经典的因果推断方法。每种方法都伴随着一个在行业中的应用,作为一个实际的例子。 **通过这本书,你将:**学习如何使用因果推断的基本概念将一个商业问题构建为一个因果推断问题 理解偏见如何影响因果推断 了解因果效应如何在不同人之间有所不同 使用对同一客户在不同时间的反复观察来调整偏见 理解因果效应如何在不同地理位置有所不同 研究不合规偏差和效果稀释
第一部分讲述因果推断的基本概念。第一章介绍了因果推断的关键概念,你将使用它们来推理降价的影响。第二章讲述了A/B测试(或随机对照试验)的重要性,它不仅是决策工具,也是你用来对其他因果推断工具进行基准测试的黄金标准。这也是回顾一些统计概念的好机会。第三章主要是理论性的,涵盖了因果标识和图形模型,这是一个强大的方法,用于(字面上)绘制你对因果过程的假设,并推理你需要做什么才能区分关联和因果关系。完成第一部分后,你应该有足够的基础来从因果推断的角度思考问题。 第二部分将介绍两个用于区分因果关系和相关性的主要工具:线性回归和倾向性权重。第四章涵盖了线性回归,但不是从大多数数据科学家熟悉的角度来看。相反,你将学习一种重要的偏差消除技术:正交化。第五章涵盖了倾向性评分和双重稳健估计。 第三部分将第二部分中的内容和机器学习以及大数据相结合。你将研究因果推断作为个性化决策工具。通过食品配送服务的视角,你将试图理解哪些客户应该获得折扣券以获得他们的忠诚,哪些客户并不需要额外的激励。在第六章,你将进入异质性处理效应的世界。第七章深入到机器学习和因果推断交叉的最新发展中。在这一章,你将学习诸如T-、X-和S-学习者以及双重/去偏机器学习的方法,所有这些都在治疗个性化的背景下。 第四部分将时间维度加入到因果推断中。在某些情况下,你将在多个时间段内有相同客户或市场的记录,这就构成了所谓的面板数据集。你将学习如何利用面板来揭示付费营销的真实影响,即使无法随机决定谁可以看到你的广告。第八章将引导你通过差异-差异法,包括这一文献中的一些最新发展。第九章将涵盖合成控制(及其变体),也是在理解营销活动影响的背景下。 最后,第五部分深入探讨替代实验设计,适用于无法进行随机化的情况。第十章将涵盖地理实验,其目标是找到需要处理的地区和作为控制的地区,以及反向实验,适用于你只有很少的分析单位并希望通过开启和关闭同一单位的处理来了解处理效果。第十一章深入探讨非合规实验,并介绍了工具变量(IV)。它也简单涵盖了不连续设计。