机器学习模型如何分布外泛化？纽约大学Martin Arjovsky 博士论文<机器学习的分布外泛化>,106页pdf - 专知

会员服务 ·

0

机器学习模型如何分布外泛化？纽约大学Martin Arjovsky 博士论文<机器学习的分布外泛化>,106页pdf

2021 年 3 月 28 日 专知

我们为什么在这里?我们大多数人来到这里的原因很简单:我们想解决人工智能问题。那么，人工智能和这本书的书名有什么关系呢?人工智能的现代定义之一是对理性代理的研究和设计[RN09]。从这个意义上说，我们将一个系统描述为智能的，当它最大化某些预期的性能概念时。机器学习的子领域处理的是问题和算法的子集，其中代理可以获得经验(通常以某种形式的数据)，可以利用这些经验来改进性能的概念[MRT12]。大多数情况下，性能是由代理人在新的和看不见的情况下如何行动来衡量的，这些情况不构成其训练经验的一部分。例如，可以训练一名代理人将英文翻译成法文，其训练经验包括大量翻译的联合国文件。然而，在评估时，它可能会在与它所见过的文件不同的联合国新文件上进行测试。很自然地，代理在它所看到的训练经验和它所评估的新情况下的表现之间存在着差距。代理泛化的能力是通过性能上的差距有多小来衡量的。

希望前面的段落已经解释了在机器学习的背景下，以及在更大的AI背景下，什么是泛化。那么，标题中还保留着哪些“分布外”词呢?如前所述，泛化是指减少一个agent在已知训练情境下的表现与同一agent在未知测试情境下的表现之间的差距。然而，有许多不同类型的未知。统计学习通常处理的一类泛化是分布的:当从训练示例生成的数据与测试示例生成的数据无法区分时。根据定义，非分布内的泛化问题称为分布外泛化问题，这是本书的主题。

这项工作的目标很简单。我们想要回顾，分布外泛化的知识。因此，这项工作的很大一部分将致力于理解(有时是微妙的)不同方法和假设之间的差异和相似性，通常以一种孤立的方式呈现。重点将放在与人工智能或现代大规模机器学习应用等想法上。此外，我们将特别注意研究不同方法的缺点，以及下一步可能是重要的。

在第二章中，我们首先讨论如何量化分布外泛化。通过几个例子，我们研究了分布外泛化与处理不同分布外任务的几种常用方法之间的关系。本文将特别强调这些方法背后的假设，并说明这些方法何时有效，何时无效。

在第三章中，我们将关注一个特定的分布外任务类。在这些预测任务中，就像在许多实际问题中一样，在分布之外泛化的困难在于找出数据中的哪些相关性是假的和不可靠的，以及哪些相关性代表感兴趣的现象。

在第四章中，我们讨论了不同应用领域在实践中出现的分布外任务的类型，以及这些领域在过去是如何处理这些问题的。

在第五章中，我们为分布外泛化和人工智能背景下的新研究领域奠定了基础。在本章中，我们将关注在探索或强化学习环境中与世界交互的agent，以及它们如何从分布外泛化中获益。

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“ODG” 就可以获取《【纽约大学Martin Arjovsky 博士论文】机器学习的分布外泛化,106页pdf》专知下载链接

专知，专业可信的人工智能知识分发 ，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取5000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取5000+AI主题知识资源

登录查看更多

4

相关内容

分布外泛化

分布外泛化

【CVPR2021】深度稳定学习分布外泛化

专知会员服务

30+阅读 · 2021年5月20日

【纽约大学Martin Arjovsky 博士论文】机器学习的分布外泛化,106页pdf

【纽约大学Martin Arjovsky 博士论文】机器学习的分布外泛化,106页pdf

专知会员服务

61+阅读 · 2021年3月28日

【经典书】数理统计学，142页pdf

【经典书】数理统计学，142页pdf

专知会员服务

99+阅读 · 2021年3月25日

英国杜伦大学「深度生成建模」大综述论文，21页pdf

英国杜伦大学「深度生成建模」大综述论文，21页pdf

专知会员服务

49+阅读 · 2021年3月16日

机器学习模型如何泛化到未知领域？微软亚研「领域泛化 (Domain Generalization)」综述论文概述理论、算法等

机器学习模型如何泛化到未知领域？微软亚研「领域泛化 (Domain Generalization)」综述论文概述理论、算法等

专知会员服务

59+阅读 · 2021年3月13日

多伦多大学2021《机器学习》课程，讲述深度学习理论中的神经网络训练动力学

多伦多大学2021《机器学习》课程，讲述深度学习理论中的神经网络训练动力学

专知会员服务

59+阅读 · 2021年1月29日

伯克利经典《机器学习数学基础》，47页pdf

专知会员服务

183+阅读 · 2021年1月8日

【布朗大学David Abel博士论文】强化学习抽象理论，297页pdf

【布朗大学David Abel博士论文】强化学习抽象理论，297页pdf

专知会员服务

89+阅读 · 2020年12月17日

最新《深度半监督学习》综述论文，43页pdf

最新《深度半监督学习》综述论文，43页pdf

专知会员服务

156+阅读 · 2020年6月12日

【课程】纽约大学 DS-GA 1003 Machine Learning

【课程】纽约大学 DS-GA 1003 Machine Learning

专知会员服务

46+阅读 · 2019年10月29日

最新《因果推断导论: 从机器学习视角》新书稿，92页pdf

最新《因果推断导论: 从机器学习视角》新书稿，92页pdf

专知

60+阅读 · 2020年9月29日

最新《迁移学习:域自适应理论》综述论文，128页ppt讲解迁移学习与最优传输

最新《迁移学习:域自适应理论》综述论文，128页ppt讲解迁移学习与最优传输

专知

15+阅读 · 2020年4月27日

【纽约大学】贝叶斯深度学习和泛化性的概率观点，附27页PPT下载

【纽约大学】贝叶斯深度学习和泛化性的概率观点，附27页PPT下载

专知

27+阅读 · 2020年2月25日

最新《分布式机器学习》论文综述最新DML进展，33页pdf

最新《分布式机器学习》论文综述最新DML进展，33页pdf

专知

52+阅读 · 2019年12月26日

【UMD开放经典书】机器学习课程简明书，19章227页pdf，带你学习ML

【UMD开放经典书】机器学习课程简明书，19章227页pdf，带你学习ML

专知

46+阅读 · 2019年12月9日

新加坡南洋理工最新37页《零样本学习综述》论文

新加坡南洋理工最新37页《零样本学习综述》论文

专知

104+阅读 · 2019年2月27日

十年机器学习结果不可靠？伯克利&MIT研究质疑了30个经典模型

十年机器学习结果不可靠？伯克利&MIT研究质疑了30个经典模型

全球人工智能

5+阅读 · 2018年6月7日

隐私和机器学习：两个意想不到的盟友？一文了解差分隐私

隐私和机器学习：两个意想不到的盟友？一文了解差分隐私

专知

21+阅读 · 2018年5月14日

干货 | 自然语言处理(1)之聊一聊分词原理

干货 | 自然语言处理(1)之聊一聊分词原理

机器学习算法与Python学习

5+阅读 · 2017年12月7日

变量选择

Datartisan数据工匠

3+阅读 · 2017年12月7日

Learning Domain Invariant Representations by Joint Wasserstein Distance Minimization

Arxiv

0+阅读 · 2021年6月9日

Modeling Discriminative Representations for Out-of-Domain Detection with Supervised Contrastive Learning

Arxiv

1+阅读 · 2021年5月29日

A Theory of Label Propagation for Subpopulation Shift

Arxiv

7+阅读 · 2021年2月22日

Improving Few-shot Text Classification via Pretrained Language Representations

Arxiv

3+阅读 · 2019年8月22日

Multi-Task Deep Neural Networks for Natural Language Understanding

Multi-Task Deep Neural Networks for Natural Language Understanding

Arxiv

3+阅读 · 2019年1月31日

ML-Net: multi-label classification of biomedical texts with deep neural networks

ML-Net: multi-label classification of biomedical texts with deep neural networks

Arxiv

7+阅读 · 2018年11月15日

Premise selection with neural networks and distributed representation of features

Arxiv

3+阅读 · 2018年7月26日

Adversarial Reprogramming of Neural Networks

Adversarial Reprogramming of Neural Networks

Arxiv

3+阅读 · 2018年6月28日

Reproducibility Report for "Learning To Count Objects In Natural Images For Visual Question Answering"

Reproducibility Report for "Learning To Count Objects In Natural Images For Visual Question Answering"

Arxiv

4+阅读 · 2018年5月21日

Optimal Transport for Multi-source Domain Adaptation under Target Shift

Arxiv

7+阅读 · 2018年3月13日

VIP会员

相关主题

分布外泛化

机器学习模型

相关VIP内容

【CVPR2021】深度稳定学习分布外泛化

专知会员服务

30+阅读 · 2021年5月20日

【纽约大学Martin Arjovsky 博士论文】机器学习的分布外泛化,106页pdf

【纽约大学Martin Arjovsky 博士论文】机器学习的分布外泛化,106页pdf

专知会员服务

61+阅读 · 2021年3月28日

【经典书】数理统计学，142页pdf

【经典书】数理统计学，142页pdf

专知会员服务

99+阅读 · 2021年3月25日

英国杜伦大学「深度生成建模」大综述论文，21页pdf

英国杜伦大学「深度生成建模」大综述论文，21页pdf

专知会员服务

49+阅读 · 2021年3月16日

机器学习模型如何泛化到未知领域？微软亚研「领域泛化 (Domain Generalization)」综述论文概述理论、算法等

机器学习模型如何泛化到未知领域？微软亚研「领域泛化 (Domain Generalization)」综述论文概述理论、算法等

专知会员服务

59+阅读 · 2021年3月13日

多伦多大学2021《机器学习》课程，讲述深度学习理论中的神经网络训练动力学

多伦多大学2021《机器学习》课程，讲述深度学习理论中的神经网络训练动力学

专知会员服务

59+阅读 · 2021年1月29日

伯克利经典《机器学习数学基础》，47页pdf

专知会员服务

183+阅读 · 2021年1月8日

【布朗大学David Abel博士论文】强化学习抽象理论，297页pdf

【布朗大学David Abel博士论文】强化学习抽象理论，297页pdf

专知会员服务

89+阅读 · 2020年12月17日

最新《深度半监督学习》综述论文，43页pdf

最新《深度半监督学习》综述论文，43页pdf

专知会员服务

156+阅读 · 2020年6月12日

【课程】纽约大学 DS-GA 1003 Machine Learning

【课程】纽约大学 DS-GA 1003 Machine Learning

专知会员服务

46+阅读 · 2019年10月29日

热门VIP内容

开通专知VIP会员享更多权益服务

《乌克兰无人机产业：志愿者与政策在构建新兴无人机产业中的协同作用》最新报告

《人工智能辅助决策中的数据可视化：系统性综述》

人工智能驱动弹药制造现代化：美国陆军转型之路

《敏捷作战部署中枢纽-辐条基地选址优化研究》80页

相关资讯

最新《因果推断导论: 从机器学习视角》新书稿，92页pdf

最新《因果推断导论: 从机器学习视角》新书稿，92页pdf

专知

60+阅读 · 2020年9月29日

最新《迁移学习:域自适应理论》综述论文，128页ppt讲解迁移学习与最优传输

最新《迁移学习:域自适应理论》综述论文，128页ppt讲解迁移学习与最优传输

专知

15+阅读 · 2020年4月27日

【纽约大学】贝叶斯深度学习和泛化性的概率观点，附27页PPT下载

【纽约大学】贝叶斯深度学习和泛化性的概率观点，附27页PPT下载

专知

27+阅读 · 2020年2月25日

最新《分布式机器学习》论文综述最新DML进展，33页pdf

最新《分布式机器学习》论文综述最新DML进展，33页pdf

专知

52+阅读 · 2019年12月26日

【UMD开放经典书】机器学习课程简明书，19章227页pdf，带你学习ML

【UMD开放经典书】机器学习课程简明书，19章227页pdf，带你学习ML

专知

46+阅读 · 2019年12月9日

新加坡南洋理工最新37页《零样本学习综述》论文

新加坡南洋理工最新37页《零样本学习综述》论文

专知

104+阅读 · 2019年2月27日

十年机器学习结果不可靠？伯克利&MIT研究质疑了30个经典模型

十年机器学习结果不可靠？伯克利&MIT研究质疑了30个经典模型

全球人工智能

5+阅读 · 2018年6月7日

隐私和机器学习：两个意想不到的盟友？一文了解差分隐私

隐私和机器学习：两个意想不到的盟友？一文了解差分隐私

专知

21+阅读 · 2018年5月14日

干货 | 自然语言处理(1)之聊一聊分词原理

干货 | 自然语言处理(1)之聊一聊分词原理

机器学习算法与Python学习

5+阅读 · 2017年12月7日

变量选择

Datartisan数据工匠

3+阅读 · 2017年12月7日

相关论文

Learning Domain Invariant Representations by Joint Wasserstein Distance Minimization

Arxiv

0+阅读 · 2021年6月9日

Modeling Discriminative Representations for Out-of-Domain Detection with Supervised Contrastive Learning

Arxiv

1+阅读 · 2021年5月29日

A Theory of Label Propagation for Subpopulation Shift

Arxiv

7+阅读 · 2021年2月22日

Improving Few-shot Text Classification via Pretrained Language Representations

Arxiv

3+阅读 · 2019年8月22日

Multi-Task Deep Neural Networks for Natural Language Understanding

Multi-Task Deep Neural Networks for Natural Language Understanding

Arxiv

3+阅读 · 2019年1月31日

ML-Net: multi-label classification of biomedical texts with deep neural networks

ML-Net: multi-label classification of biomedical texts with deep neural networks

Arxiv

7+阅读 · 2018年11月15日

Premise selection with neural networks and distributed representation of features

Arxiv

3+阅读 · 2018年7月26日

Adversarial Reprogramming of Neural Networks

Adversarial Reprogramming of Neural Networks

Arxiv

3+阅读 · 2018年6月28日

Reproducibility Report for "Learning To Count Objects In Natural Images For Visual Question Answering"

Reproducibility Report for "Learning To Count Objects In Natural Images For Visual Question Answering"

Arxiv

4+阅读 · 2018年5月21日

Optimal Transport for Multi-source Domain Adaptation under Target Shift

Arxiv

7+阅读 · 2018年3月13日

大家都在搜

软件无线电

CMU博士论文

无人机集群

久别重逢话双塔

再见，TD-SCDMA！

微信扫码咨询专知VIP会员