这是一份为纽约大学数据科学中心2024年春季开设的DS-GA 3001.003课程“DS特别专题 - 机器学习中的因果推断”制作的讲义。该课程面向具有基本机器学习背景但之前未接触过因果推断或因果推理的硕士和博士生。特别是,本课程旨在帮助这些学生扩展他们的机器学习视野和知识,纳入因果推理,因为这一方面是所谓的分布外泛化(或缺乏泛化)的核心。

这份讲义不遵循传统的因果推断教学课程。它既不完全依赖潜在结果框架,也不完全依赖do-calculus框架,而是灵活地从这两个阵营中汲取概念和思想(毕竟它们看起来大同小异),以从第一原则建立因果推断的基础。为此,讲义的前半部分涵盖了各种基本主题,包括概率图模型、结构因果模型、因果量的兴趣、条件概率与干预概率、回归、随机对照试验、强盗算法、逆概率加权、匹配和工具变量。我不会深入探讨这些主题,但重点是这些主题如何相互联系(有时是等价的)。在课程的前半部分,我阅读并参考了以下书籍(仅略读)并推荐学生如果有兴趣了解更多关于因果推断的知识,可以深入阅读这些书籍:

  1. Pearl. 《因果性》,第2版,2009年。[Pearl, 2009]
  2. Imbens & Rubin. 《统计学、社会科学和生物医学中的因果推断》,2015年。[Imbens and Rubin, 2015]
  3. Cunningham. 《因果推断:混音带》,2021年。[Cunningham, 2021] 基于课程前半部分(或者更像是三分之二)建立的基础,课程转向机器学习中的泛化。特别是,我尝试论证基于因果推断的概率图模型框架可以成为指定和理解所谓分布外泛化的宝贵工具。为证明这一点,我粗略地将因果推断与以下机器学习中的概念联系起来:
  4. 分布转移
  5. 不变性原则
  6. 语言模型的基于偏好的学习 坦率地说,这是一份内容非常简薄的课程讲义。它应该被视为通往名为因果性的巨大森林的第一个路标,仅此而已。如果你想稍微扩展一点,可以参见我和我的博士生Jiwoong Daniel Im一起撰写的简短介绍材料[Im and Cho, 2023]。 最后,我对Daniel Im、Divyam Madaan和Taro Makino在准备讲义以及在2024年春季进行实验课程时给予的极大帮助表示无尽的感谢。他们准备的实验材料都可以在以下网址找到:

https://github.com/kyunghyuncho/2024-causal-inference-machine-learning。

成为VIP会员查看完整内容
27

相关内容

“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
视觉语言导航:大模型时代的综述
专知会员服务
47+阅读 · 2024年7月10日
从数据中心视角看多模态大型语言模型的综述
专知会员服务
54+阅读 · 2024年5月28日
【MICCAI 2023教程】医学图像分析中的不确定性量化
专知会员服务
25+阅读 · 2023年10月17日
大型语言模型在软件工程:调查与待解决的问题
专知会员服务
75+阅读 · 2023年10月6日
基于模型的强化学习综述
专知会员服务
144+阅读 · 2022年7月13日
专知会员服务
49+阅读 · 2021年8月4日
专知会员服务
86+阅读 · 2021年5月30日
专知会员服务
182+阅读 · 2021年1月8日
【干货书】优化算法,232页pdf
专知
26+阅读 · 2022年9月8日
基于模型的强化学习综述
专知
33+阅读 · 2022年7月13日
初学者的 Keras:实现卷积神经网络
Python程序员
24+阅读 · 2019年9月8日
层级强化学习概念简介
CreateAMind
18+阅读 · 2019年6月9日
深度学习超参数搜索实用指南
云栖社区
28+阅读 · 2018年10月14日
机器之心最干的文章:机器学习中的矩阵、向量求导
深度学习世界
12+阅读 · 2018年2月7日
迁移学习在深度学习中的应用
专知
23+阅读 · 2017年12月24日
深度学习时代的目标检测算法综述
AI前线
12+阅读 · 2017年9月22日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
A Survey of Large Language Models
Arxiv
424+阅读 · 2023年3月31日
Arxiv
69+阅读 · 2023年3月26日
Arxiv
22+阅读 · 2023年3月17日
VIP会员
相关VIP内容
视觉语言导航:大模型时代的综述
专知会员服务
47+阅读 · 2024年7月10日
从数据中心视角看多模态大型语言模型的综述
专知会员服务
54+阅读 · 2024年5月28日
【MICCAI 2023教程】医学图像分析中的不确定性量化
专知会员服务
25+阅读 · 2023年10月17日
大型语言模型在软件工程:调查与待解决的问题
专知会员服务
75+阅读 · 2023年10月6日
基于模型的强化学习综述
专知会员服务
144+阅读 · 2022年7月13日
专知会员服务
49+阅读 · 2021年8月4日
专知会员服务
86+阅读 · 2021年5月30日
专知会员服务
182+阅读 · 2021年1月8日
相关资讯
【干货书】优化算法,232页pdf
专知
26+阅读 · 2022年9月8日
基于模型的强化学习综述
专知
33+阅读 · 2022年7月13日
初学者的 Keras:实现卷积神经网络
Python程序员
24+阅读 · 2019年9月8日
层级强化学习概念简介
CreateAMind
18+阅读 · 2019年6月9日
深度学习超参数搜索实用指南
云栖社区
28+阅读 · 2018年10月14日
机器之心最干的文章:机器学习中的矩阵、向量求导
深度学习世界
12+阅读 · 2018年2月7日
迁移学习在深度学习中的应用
专知
23+阅读 · 2017年12月24日
深度学习时代的目标检测算法综述
AI前线
12+阅读 · 2017年9月22日
相关基金
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
微信扫码咨询专知VIP会员