因果性和推理因果关系的能力是决策的核心。本论文通过提出可用于支持、理解和改进决策的新机器学习方法,为因果推理领域做出了贡献,重点关注医疗保健领域。
首先,介绍了几种因果推理工具,通过从观察数据(如电子健康记录)中估计干预(治疗)的因果效应来支持决策。首先,要解决的是对连续值干预措施的反事实结果进行估计这一尚未充分探索的问题,并提出了一种基于生成对抗网络的方法,该方法性能一流,可帮助我们为每位患者选择正确的治疗方法和剂量。然后,我们将注意力转移到时间设置上,开发了一个序列到序列模型,该模型使用域对抗训练来处理随时间变化的混杂因素,可以帮助我们为每位患者确定最佳治疗序列。此外,我们还介绍了第一种可以处理时间数据中存在的多病因隐藏混杂因素的方法。通过利用随时间变化的治疗分配中的依赖性,我们的方法可以学习到可用于替代隐藏混杂因素的潜在变量。
其次,将反事实推理整合到批量反强化学习中,开发出一种方法,通过对 "假设"(反事实)结果的偏好来模拟专家的奖励函数,从而更好地理解专家的决策行为。我们的研究表明,这使我们能够获得专家决策过程的可解释参数化,进而揭示与专家行为相关的权衡和偏好。
第三,提出了一种新的批量模仿学习模型,将因果结构纳入所学的模仿政策,从而提高了决策的稳健性。通过确保模仿策略只依赖于行动的因果关系,我们学习到的决策准则能够抵御虚假的相关性,并能很好地泛化到新的环境中。
总之,本论文介绍了能够推理因果关系的机器学习在方法论上的进步,这些进步能让我们改善为患者提供的个性化医疗服务,支持临床决策,并建立更透明的临床实践报告。我们在讨论中强调了将此类方法应用于实践所面临的挑战,并对未来在这方面的工作提出了建议。