我们探索机器学习(ML)和因果推理之间的关系。通过相互借鉴,我们专注于改进每一个方面。机器学习已经成功地应用于许多问题,但由于缺乏强有力的理论保证,导致了许多意想不到的失败。当应用于不同的分布时,在训练分布上表现良好的模型往往会崩溃;微小的扰动可以“欺骗”训练好的模型,并极大地改变它的预测;训练算法中的任意选择会导致截然不同的模型;等等。另一方面,虽然因果推理方法的发展已经取得了巨大的进步,有很强的理论保证,但现有的方法通常不能应用于实践,因为它们假设有大量的数据。研究ML和因果推理的交集,我们直接解决了ML中缺乏鲁棒性的问题,并提高了因果推理技术的统计效率。
本论文工作背后的动机是改进用于指导决策的预测模型和因果模型的构建方法。自始至终,我们主要关注医疗健康上下文中的决策制定。在ML的因果关系方面,我们使用ML工具和分析技术来开发统计上有效的因果模型,可以指导临床医生在两种治疗方法之间选择。在ML的因果关系方面,我们研究如何使用产生观测数据的因果机制知识来有效地正则化预测模型,而不引入偏差。在临床环境中,我们展示了如何使用因果知识来建立稳健和准确的模型来预测传染性感染的传播。在非临床环境中,我们研究了如何使用因果知识来训练在图像分类中对分布转移具有鲁棒性的模型。
专知便捷查看
便捷下载,请关注专知公众号(点击上方蓝色专知关注)
后台回复“MLCM” 就可以获取《【MIT博士论文】机器学习与因果关系:建立高效、可靠的决策模型》专知下载链接