在过去的二十年中,数字技术的进步使得在广泛领域内使用机器学习进行数据驱动的决策成为可能。最近的研究强调,使用机器学习进行决策需要因果推断。具体来说,目的是学习治疗(例如,决策、干预、行动)对感兴趣单元(例如,患者、内容和客户)的因果效应的异质性,以便能够优化治疗分配。这激发了因果机器学习的研究,它将机器学习与因果推断结合起来,以改善治疗效果估计并优化治疗分配。这篇论文开发了用于数字健康、数字媒体和数字平台领域中的个性化、推荐和目标定位的数据驱动决策相关的因果机器学习方法。 在第二章中,我们将因果树和因果森林从异质性治疗效果估计适应到个性化序列化治疗决策估计。这些方法控制了非线性和随时间变化的混杂因素,对于错误规范具有鲁棒性,并解释了哪些患者信息预测了治疗效益。我们使用模拟研究以及对重症监护病房真实世界数据的应用来评估我们的方法。我们的方法在优化长期结果方面优于最先进的基准和医疗实践。我们的工作因此展示了因果机器学习在数字医疗保健中的价值。 在第三章中,我们提出了一个政策学习框架,用于指导数字出版商如何优化其分发渠道(例如,网站首页、推特页面、电子邮件通讯)上向用户推荐的内容。我们展示了反事实政策是如何从历史数据中非参数地识别出来的,以及最优政策如何选择具有最大异质性治疗效应的内容。我们提出了一个计算效率高的估算算法和工具,用于解释哪些内容最适合推荐。通过与一家国际报纸的合作,我们展示了最优政策如何优于标准基准和编辑过去的决策。总体而言,我们的工作展示了因果机器学习如何改进内容推荐。

在第四章中,我们开发了一个框架,用于确保在针对客户目标的异质性治疗效应的机器学习预测中的公平性。受数字平台面临的现实世界约束的启发,我们将问题定义为检测机器学习模型是否存在偏见,如果存在,如何为新用户最好地缓解它。我们提供了关于检测的理论保证,并呈现了缓解的最优策略。我们使用来自全球旅行平台 Booking.com 的大规模数据,实证展示了我们的框架。我们的框架为确保因果机器学习中的公平性提供了一条前进的道路。

总结来说,这篇论文展示了因果机器学习如何在数字化转型的应用领域中进行评估和优化,以实现数据驱动的决策。我们的方法解决了实践中算法决策常见的挑战,即效率、可解释性和公平性。因此,我们旨在促进因果机器学习在实践和应用研究中的数据驱动决策的采用。

成为VIP会员查看完整内容
41

相关内容

【CMU博士论文】可解释机器学习方法与应用,127页pdf
专知会员服务
75+阅读 · 2023年6月6日
【CMU博士论文】迈向高效自动机器学习,184页pdf
专知会员服务
31+阅读 · 2023年2月24日
【MIT博士论文】机器学习中的稀疏性:理论与应用,122页pdf
【MIT博士论文】数据高效强化学习,176页pdf
国家自然科学基金
5+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
25+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
Arxiv
157+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
399+阅读 · 2023年3月31日
Arxiv
66+阅读 · 2023年3月26日
Arxiv
139+阅读 · 2023年3月24日
Arxiv
20+阅读 · 2023年3月17日
VIP会员
相关基金
国家自然科学基金
5+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
25+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员