机器学习中因果推断的简要介绍 - 专知VIP

会员服务 ·

19

机器学习 · 因果推断 ·

2024 年 6 月 3 日

机器学习中因果推断的简要介绍

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

这是一份为纽约大学数据科学中心2024年春季开设的DS-GA 3001.003课程“DS特别专题 - 机器学习中的因果推断”制作的讲义。该课程面向具有基本机器学习背景但之前未接触过因果推断或因果推理的硕士和博士生。特别是，本课程旨在帮助这些学生扩展他们的机器学习视野和知识，纳入因果推理，因为这一方面是所谓的分布外泛化（或缺乏泛化）的核心。

这份讲义不遵循传统的因果推断教学课程。它既不完全依赖潜在结果框架，也不完全依赖do-calculus框架，而是灵活地从这两个阵营中汲取概念和思想（毕竟它们看起来大同小异），以从第一原则建立因果推断的基础。为此，讲义的前半部分涵盖了各种基本主题，包括概率图模型、结构因果模型、因果量的兴趣、条件概率与干预概率、回归、随机对照试验、强盗算法、逆概率加权、匹配和工具变量。我不会深入探讨这些主题，但重点是这些主题如何相互联系（有时是等价的）。在课程的前半部分，我阅读并参考了以下书籍（仅略读）并推荐学生如果有兴趣了解更多关于因果推断的知识，可以深入阅读这些书籍：

Pearl. 《因果性》，第2版，2009年。[Pearl, 2009]
Imbens & Rubin. 《统计学、社会科学和生物医学中的因果推断》，2015年。[Imbens and Rubin, 2015]
Cunningham. 《因果推断：混音带》，2021年。[Cunningham, 2021] 基于课程前半部分（或者更像是三分之二）建立的基础，课程转向机器学习中的泛化。特别是，我尝试论证基于因果推断的概率图模型框架可以成为指定和理解所谓分布外泛化的宝贵工具。为证明这一点，我粗略地将因果推断与以下机器学习中的概念联系起来：
分布转移
不变性原则
语言模型的基于偏好的学习坦率地说，这是一份内容非常简薄的课程讲义。它应该被视为通往名为因果性的巨大森林的第一个路标，仅此而已。如果你想稍微扩展一点，可以参见我和我的博士生Jiwoong Daniel Im一起撰写的简短介绍材料[Im and Cho, 2023]。最后，我对Daniel Im、Divyam Madaan和Taro Makino在准备讲义以及在2024年春季进行实验课程时给予的极大帮助表示无尽的感谢。他们准备的实验材料都可以在以下网址找到：

https://github.com/kyunghyuncho/2024-causal-inference-machine-learning。

成为VIP会员查看完整内容

28

相关内容

机器学习

“机器学习是近20多年兴起的一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律，并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论，机器学习与统计推断学联系尤为密切，也被称为统计学习理论。算法设计方面，机器学习理论关注可以实现的，行之有效的学习算法。很多推论问题属于无程序可循难度，所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

视觉语言导航：大模型时代的综述

视觉语言导航：大模型时代的综述

专知会员服务

48+阅读 · 2024年7月10日

从数据中心视角看多模态大型语言模型的综述

从数据中心视角看多模态大型语言模型的综述

专知会员服务

57+阅读 · 2024年5月28日

视频生成、理解与流媒体的生成式人工智能和大型语言模型综述

视频生成、理解与流媒体的生成式人工智能和大型语言模型综述

专知会员服务

57+阅读 · 2024年4月27日

【MICCAI 2023教程】医学图像分析中的不确定性量化

【MICCAI 2023教程】医学图像分析中的不确定性量化

专知会员服务

27+阅读 · 2023年10月17日

大型语言模型在软件工程：调查与待解决的问题

大型语言模型在软件工程：调查与待解决的问题

专知会员服务

76+阅读 · 2023年10月6日

基于模型的强化学习综述

基于模型的强化学习综述

专知会员服务

148+阅读 · 2022年7月13日

统计物理方法中的优化和机器学习

专知会员服务

50+阅读 · 2021年8月4日

Francis Bach《第一性原理机器学习理论》干货书，233页pdf

专知会员服务

87+阅读 · 2021年5月30日

伯克利经典《机器学习数学基础》，47页pdf

专知会员服务

182+阅读 · 2021年1月8日

【经典书】计算机科学的离散结构:计数、递归和概率，404页pdf

【经典书】计算机科学的离散结构:计数、递归和概率，404页pdf

专知会员服务

40+阅读 · 2021年1月5日

【干货书】优化算法，232页pdf

【干货书】优化算法，232页pdf

专知

26+阅读 · 2022年9月8日

基于模型的强化学习综述

基于模型的强化学习综述

专知

42+阅读 · 2022年7月13日

初学者的 Keras：实现卷积神经网络

初学者的 Keras：实现卷积神经网络

Python程序员

24+阅读 · 2019年9月8日

初学者系列：基于神经网络的协同过滤（NCF）详解

初学者系列：基于神经网络的协同过滤（NCF）详解

专知

12+阅读 · 2019年9月2日

层级强化学习概念简介

层级强化学习概念简介

CreateAMind

19+阅读 · 2019年6月9日

斯坦福大学李飞飞教授新课-视觉识别的卷积神经网络

斯坦福大学李飞飞教授新课-视觉识别的卷积神经网络

专知

11+阅读 · 2019年4月10日

深度学习超参数搜索实用指南

深度学习超参数搜索实用指南

云栖社区

28+阅读 · 2018年10月14日

机器之心最干的文章：机器学习中的矩阵、向量求导

机器之心最干的文章：机器学习中的矩阵、向量求导

深度学习世界

12+阅读 · 2018年2月7日

迁移学习在深度学习中的应用

迁移学习在深度学习中的应用

专知

23+阅读 · 2017年12月24日

深度学习时代的目标检测算法综述

深度学习时代的目标检测算法综述

AI前线

12+阅读 · 2017年9月22日

基于高斯过程模型的多示例多标记学习算法研究

国家自然科学基金

13+阅读 · 2015年12月31日

面向大规模分布式一致性最优化问题的结构型一阶求解算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

高维不平衡数据的集成学习算法研究

国家自然科学基金

13+阅读 · 2015年12月31日

个性化特征大数据支持下的交互式进化计算及其应用

国家自然科学基金

1+阅读 · 2015年12月31日

复杂数据模型中的分布逼近方法

国家自然科学基金

3+阅读 · 2014年12月31日

压缩感知和稀疏优化中的非凸优化算法设计

国家自然科学基金

2+阅读 · 2014年12月31日

反问题的数学建模、计算及应用

国家自然科学基金

2+阅读 · 2014年12月31日

面向汉语文本理解的语义计算方法

国家自然科学基金

8+阅读 · 2014年12月31日

基于贝叶斯推理的模糊逻辑强化学习模型研究

国家自然科学基金

18+阅读 · 2012年12月31日

Decentralized multi-agent reinforcement learning algorithm using a cluster-synchronized laser network

Arxiv

0+阅读 · 2024年7月12日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

215+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

474+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

146+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

78+阅读 · 2023年3月26日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

A survey and taxonomy of loss functions in machine learning

Arxiv

25+阅读 · 2023年1月13日

Interpretable machine learning: definitions, methods, and applications

Interpretable machine learning: definitions, methods, and applications

Arxiv

19+阅读 · 2019年1月14日

VIP会员

相关主题

相关VIP内容

视觉语言导航：大模型时代的综述

视觉语言导航：大模型时代的综述

专知会员服务

48+阅读 · 2024年7月10日

从数据中心视角看多模态大型语言模型的综述

从数据中心视角看多模态大型语言模型的综述

专知会员服务

57+阅读 · 2024年5月28日

视频生成、理解与流媒体的生成式人工智能和大型语言模型综述

视频生成、理解与流媒体的生成式人工智能和大型语言模型综述

专知会员服务

57+阅读 · 2024年4月27日

【MICCAI 2023教程】医学图像分析中的不确定性量化

【MICCAI 2023教程】医学图像分析中的不确定性量化

专知会员服务

27+阅读 · 2023年10月17日

大型语言模型在软件工程：调查与待解决的问题

大型语言模型在软件工程：调查与待解决的问题

专知会员服务

76+阅读 · 2023年10月6日

基于模型的强化学习综述

基于模型的强化学习综述

专知会员服务

148+阅读 · 2022年7月13日

统计物理方法中的优化和机器学习

专知会员服务

50+阅读 · 2021年8月4日

Francis Bach《第一性原理机器学习理论》干货书，233页pdf

专知会员服务

87+阅读 · 2021年5月30日

伯克利经典《机器学习数学基础》，47页pdf

专知会员服务

182+阅读 · 2021年1月8日

【经典书】计算机科学的离散结构:计数、递归和概率，404页pdf

【经典书】计算机科学的离散结构:计数、递归和概率，404页pdf

专知会员服务

40+阅读 · 2021年1月5日

热门VIP内容

开通专知VIP会员享更多权益服务

未来战场：AI赋能无人作战新范式，39页ppt

【牛津博士论文】无限维空间中的广义变分推断

DeepSeek AI 从入门到付费专家·第一卷：动手实践、真实应用与可扩展 AI 解决方案全掌握

2025中国AI Agent商业应用场景洞察研究

相关资讯

【干货书】优化算法，232页pdf

【干货书】优化算法，232页pdf

专知

26+阅读 · 2022年9月8日

基于模型的强化学习综述

基于模型的强化学习综述

专知

42+阅读 · 2022年7月13日

初学者的 Keras：实现卷积神经网络

初学者的 Keras：实现卷积神经网络

Python程序员

24+阅读 · 2019年9月8日

初学者系列：基于神经网络的协同过滤（NCF）详解

初学者系列：基于神经网络的协同过滤（NCF）详解

专知

12+阅读 · 2019年9月2日

层级强化学习概念简介

层级强化学习概念简介

CreateAMind

19+阅读 · 2019年6月9日

斯坦福大学李飞飞教授新课-视觉识别的卷积神经网络

斯坦福大学李飞飞教授新课-视觉识别的卷积神经网络

专知

11+阅读 · 2019年4月10日

深度学习超参数搜索实用指南

深度学习超参数搜索实用指南

云栖社区

28+阅读 · 2018年10月14日

机器之心最干的文章：机器学习中的矩阵、向量求导

机器之心最干的文章：机器学习中的矩阵、向量求导

深度学习世界

12+阅读 · 2018年2月7日

迁移学习在深度学习中的应用

迁移学习在深度学习中的应用

专知

23+阅读 · 2017年12月24日

深度学习时代的目标检测算法综述

深度学习时代的目标检测算法综述

AI前线

12+阅读 · 2017年9月22日

相关基金

基于高斯过程模型的多示例多标记学习算法研究

国家自然科学基金

13+阅读 · 2015年12月31日

面向大规模分布式一致性最优化问题的结构型一阶求解算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

高维不平衡数据的集成学习算法研究

国家自然科学基金

13+阅读 · 2015年12月31日

个性化特征大数据支持下的交互式进化计算及其应用

国家自然科学基金

1+阅读 · 2015年12月31日

复杂数据模型中的分布逼近方法

国家自然科学基金

3+阅读 · 2014年12月31日

压缩感知和稀疏优化中的非凸优化算法设计

国家自然科学基金

2+阅读 · 2014年12月31日

反问题的数学建模、计算及应用

国家自然科学基金

2+阅读 · 2014年12月31日

面向汉语文本理解的语义计算方法

国家自然科学基金

8+阅读 · 2014年12月31日

基于贝叶斯推理的模糊逻辑强化学习模型研究

国家自然科学基金

18+阅读 · 2012年12月31日

相关论文

Decentralized multi-agent reinforcement learning algorithm using a cluster-synchronized laser network

Arxiv

0+阅读 · 2024年7月12日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

215+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

474+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

146+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

78+阅读 · 2023年3月26日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

A survey and taxonomy of loss functions in machine learning

Arxiv

25+阅读 · 2023年1月13日

Interpretable machine learning: definitions, methods, and applications

Interpretable machine learning: definitions, methods, and applications

Arxiv

19+阅读 · 2019年1月14日

微信扫码咨询专知VIP会员