一个额外的网络营销美元将会带来多少买家?哪些客户只有在获得折扣券时才会购买?如何建立最优的定价策略?确定我们可以利用的手段如何影响我们想要驱动的商业指标的最佳方法是通过因果推断。 在这本书中,Nubank的高级数据科学家Matheus Facure解释了因果推断用于估计影响和效果的巨大潜力。经理、数据科学家和商业分析师将学习到像随机对照试验(A/B测试)、线性回归、倾向性评分、合成控制和差异-差异等经典的因果推断方法。每种方法都伴随着一个在行业中的应用,作为一个实际的例子。 **通过这本书,你将:**学习如何使用因果推断的基本概念将一个商业问题构建为一个因果推断问题 理解偏见如何影响因果推断 了解因果效应如何在不同人之间有所不同 使用对同一客户在不同时间的反复观察来调整偏见 理解因果效应如何在不同地理位置有所不同 研究不合规偏差和效果稀释
第一部分介绍了关于因果推断的基础概念。第一章介绍了您在推理削减价格的效果时所用的因果推断的关键概念。第二章讨论了A/B测试(或随机对照试验)的重要性,不仅作为决策的工具,还作为您将用来评估其他因果推断工具的黄金标准。这也是复习一些统计概念的好机会。第三章主要是理论性的,涵盖了因果识别和图形模型,这是一种用于(字面上)绘制您对因果过程的假设并推理您需要做什么来区分关联和因果关系的强大方法。完成第一部分后,您应该具备从因果推断角度思考的基本基础。 在第二部分,您将被介绍到两个用于区分因果关系和相关性的主要工具:线性回归和倾向性加权。第四章涵盖了线性回归,但不是从大多数数据科学家熟悉的角度。相反,您将学习一种重要的偏差移除技术:正交化。第五章涵盖了倾向得分和双重稳健估计。 第三部分将第二部分的内容与机器学习和大数据结合在一起。您将研究因果推断作为个性化决策工具。通过食品配送服务的视角,您将尝试理解哪些顾客应该得到折扣券以获得他们的忠诚,哪些顾客不需要额外的激励。在第六章,您将进入异质处理效应的世界。第七章深入了解机器学习和因果推断交叉点的一些最新发展。在这一章,您将学习T-、X-和S-学习者以及双重/去偏机器学习等方法,都是在处理个性化的背景下。 第四部分为因果推断增加了时间维度。在某些情况下,您会有同一客户或市场在多个时间段的记录,这构成了所谓的面板数据集。您将学习如何利用面板来揭示付费市场营销的真正影响,即使无法随机决定谁能看到您的广告。第八章将引导您了解差分法,包括这一文献中的一些最新发展。第九章将涵盖合成控制(及其变体),也是在理解市场营销活动的影响的背景下。 最后,第五部分深入探讨了替代实验设计,用于随机化不可行时。第十章将涵盖地理实验,目标是找到待处理地区和作为对照的地区,以及切换实验,用于您的分析单位很少并且希望通过打开和关闭同一单位的处理来找出处理效果时。第十一章深入研究了不合规实验,并向您介绍了工具变量(IV)。它还简要涵盖了不连续设计。