我们探索机器学习(ML)和因果推理之间的关系。通过相互借鉴,我们专注于改进每一个方面。机器学习已经成功地应用于许多问题,但由于缺乏强有力的理论保证,导致了许多意想不到的失败。当应用于不同的分布时,在训练分布上表现良好的模型往往会崩溃;微小的扰动可以“欺骗”训练好的模型,并极大地改变它的预测;训练算法中的任意选择会导致截然不同的模型;等等。另一方面,虽然因果推理方法的发展已经取得了巨大的进步,有很强的理论保证,但现有的方法通常不能应用于实践,因为它们假设有大量的数据。研究ML和因果推理的交集,我们直接解决了ML中缺乏鲁棒性的问题,并提高了因果推理技术的统计效率。

本论文工作背后的动机是改进用于指导决策的预测模型和因果模型的构建方法。自始至终,我们主要关注医疗健康上下文中的决策制定。在ML的因果关系方面,我们使用ML工具和分析技术来开发统计上有效的因果模型,可以指导临床医生在两种治疗方法之间选择。在ML的因果关系方面,我们研究如何使用产生观测数据的因果机制知识来有效地正则化预测模型,而不引入偏差。在临床环境中,我们展示了如何使用因果知识来建立稳健和准确的模型来预测传染性感染的传播。在非临床环境中,我们研究了如何使用因果知识来训练在图像分类中对分布转移具有鲁棒性的模型。

成为VIP会员查看完整内容
108

相关内容

“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【MIT博士论文】数据高效强化学习,176页pdf
专知会员服务
85+阅读 · 2022年7月11日
【MIT博士论文】优化理论与机器学习实践
专知会员服务
89+阅读 · 2022年6月30日
《实现稳健和弹性机器学习》243页CMU博士论文
专知会员服务
32+阅读 · 2022年5月12日
专知会员服务
41+阅读 · 2021年8月12日
【哥伦比亚大学博士论文】深度概率图建模147页pdf
专知会员服务
88+阅读 · 2021年4月27日
最新《因果推断导论》课程,102页ppt
专知会员服务
180+阅读 · 2020年9月1日
【MIT博士论文】数据高效强化学习,176页pdf
【MIT博士论文】优化理论与机器学习实践
专知
2+阅读 · 2022年6月30日
你的算法可靠吗? 神经网络不确定性度量
专知
40+阅读 · 2019年4月27日
NSR观点| 学习因果关系和基于因果性的学习
知社学术圈
17+阅读 · 2018年1月7日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
5+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
23+阅读 · 2008年12月31日
VIP会员
相关VIP内容
【MIT博士论文】数据高效强化学习,176页pdf
专知会员服务
85+阅读 · 2022年7月11日
【MIT博士论文】优化理论与机器学习实践
专知会员服务
89+阅读 · 2022年6月30日
《实现稳健和弹性机器学习》243页CMU博士论文
专知会员服务
32+阅读 · 2022年5月12日
专知会员服务
41+阅读 · 2021年8月12日
【哥伦比亚大学博士论文】深度概率图建模147页pdf
专知会员服务
88+阅读 · 2021年4月27日
最新《因果推断导论》课程,102页ppt
专知会员服务
180+阅读 · 2020年9月1日
相关基金
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
5+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
23+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员