NeurIPS2021 | 领域自适应的循环自训练方法与理论 - 专知

会员服务 ·

0

NeurIPS2021 | 领域自适应的循环自训练方法与理论

2021 年 11 月 13 日 专知

领域自适应(Domain Adaptation, DA)解决从有监督数据集到无监督数据集的知识迁移问题。在深度学习时代，不变表征学习(Invariant Representation Learning)是领域自适应(Domain Adaptation)中的主流方法。不变表征学习减少了源领域(Source Domain)和目标领域(Target Domain)之间的表征分布距离，从而学习到不变表征(Invariant Representation)。不变表征学习构成了领域自适应方法的核心，获得了很大成功，但不可能定理(Impossibility Theorem)揭示出在标签偏移(Label Shift)和领域支撑集偏移(Shift in the Support of Domains)两种困难情况下，不变表征学习具有泛化误差下界，因而具有明显的局限性，是领域自适应的开放性难题。

https://www.zhuanzhi.ai/paper/a264f8364523f5f70bde4936c677a5d4

最近，自训练(Self-training)方法开始被应用到领域自适应问题中。自训练作为半监督学习(Semi-supervised Learning)中的主要方法，先在有监督数据上训练模型，再生成无监督数据的伪标签(Pseudo-labels)，最后用真标签和伪标签来共同训练模型。然而在领域自适应问题中，自训练的伪标签会因为源领域和目标领域的分布偏移而变得更加不准确，直接使用全部伪标签将造成误差累积。之前的工作采用可信度阈值(Confidence Threshold)来筛选可靠的伪标签或者给可靠的伪标签更大的权重，然而这类方法不但需要对不同的任务大量调节阈值，而且仍然无法保证分布偏移条件下伪标签的可靠性。

在本文中，我们首先研究了标准自训练在分布偏移条件下的技术挑战及根因。我们发现在无分布偏移条件下，伪标签分布和真标签分布几乎相同，然而在有分布偏移条件下，两者差异很大。即使采用置信度、信息熵等不确定性阈值来筛选，筛选机制的可靠性仍将因为分布偏移而显著下降，最终使得标准自训练在领域自适应问题中失效。为此，本文首次对这一问题开展了深入研究，形成了简单通用有效的循环自训练算法(Cycle Self-Training, CST)，并建立了全新的基于扩张假设(Expansion Assumption)的领域自适应泛化理论。

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“CST” 就可以获取《NeurIPS2021 | Cycle Self-Training：领域自适应的循环自训练方法与理论》专知下载链接

专知，专业可信的人工智能知识分发 ，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取5000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取5000+AI主题知识资源

登录查看更多

3

相关内容

领域自适应

领域自适应

领域自适应是与机器学习和转移学习相关的领域。当我们的目标是从源数据分布中学习在不同（但相关）的目标数据分布上的良好性能模型时，就会出现这种情况。例如，常见垃圾邮件过滤问题的任务之一在于使模型从一个用户（源分发）适应到接收显着不同的电子邮件（目标分发）的新模型。注意，当有多个源分发可用时，该问题被称为多源域自适应。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

视觉识别的无监督域适应研究综述

视觉识别的无监督域适应研究综述

专知会员服务

32+阅读 · 2021年12月17日

【NeurIPS2021】学习用于分布外预测的因果语义表示

【NeurIPS2021】学习用于分布外预测的因果语义表示

专知会员服务

18+阅读 · 2021年11月19日

NeurIPS2021 | Cycle Self-Training：领域自适应的循环自训练方法与理论

NeurIPS2021 | Cycle Self-Training：领域自适应的循环自训练方法与理论

专知会员服务

20+阅读 · 2021年11月13日

【CVPR2021】深度稳定学习分布外泛化

专知会员服务

30+阅读 · 2021年5月20日

【CVPR2021】基于跨领域自适应聚类的半监督领域自适应算法

专知会员服务

58+阅读 · 2021年5月19日

领域自适应研究综述

领域自适应研究综述

专知会员服务

55+阅读 · 2021年5月5日

【CVPR2021】现实世界域泛化的自适应方法

【CVPR2021】现实世界域泛化的自适应方法

专知会员服务

58+阅读 · 2021年3月31日

机器学习模型如何泛化到未知领域？微软亚研「领域泛化 (Domain Generalization)」综述论文概述理论、算法等

机器学习模型如何泛化到未知领域？微软亚研「领域泛化 (Domain Generalization)」综述论文概述理论、算法等

专知会员服务

59+阅读 · 2021年3月13日

【ICLR2021】对未标记数据进行深度网络自训练的理论分析

【ICLR2021】对未标记数据进行深度网络自训练的理论分析

专知会员服务

26+阅读 · 2021年2月22日

【IJCAI2020】通过双向对抗训练生成中间域样本提升半监督域自适应效果

【IJCAI2020】通过双向对抗训练生成中间域样本提升半监督域自适应效果

专知会员服务

35+阅读 · 2020年9月17日

【CVPR2021】面向通用领域自适应的领域共识聚类

【CVPR2021】面向通用领域自适应的领域共识聚类

专知

24+阅读 · 2021年5月6日

【CVPR2021】基于反事实推断的视觉问答框架

【CVPR2021】基于反事实推断的视觉问答框架

专知

38+阅读 · 2021年3月4日

TPAMI 2020 | 无监督多类域适应：理论，算法与实践

TPAMI 2020 | 无监督多类域适应：理论，算法与实践

PaperWeekly

5+阅读 · 2021年1月21日

【ICML 2020 】小样本学习即领域迁移

【ICML 2020 】小样本学习即领域迁移

专知

5+阅读 · 2020年6月26日

【CVPR2020】从领域适应的角度重新思考长尾视觉识别的类平衡方法

【CVPR2020】从领域适应的角度重新思考长尾视觉识别的类平衡方法

专知

5+阅读 · 2020年4月12日

融合零样本学习和小样本学习的弱监督机器学习方法综述

融合零样本学习和小样本学习的弱监督机器学习方法综述

专知

4+阅读 · 2020年3月20日

大数据时代小样本如何学习？看这篇最新《小样本学习方法综述》论文

大数据时代小样本如何学习？看这篇最新《小样本学习方法综述》论文

专知

127+阅读 · 2019年3月31日

NIPS 2018论文解读 | 基于条件对抗网络的领域自适应方法

NIPS 2018论文解读 | 基于条件对抗网络的领域自适应方法

PaperWeekly

4+阅读 · 2018年11月26日

【干货】ACL 2018 鲁棒、无偏的NLP训练方法

【干货】ACL 2018 鲁棒、无偏的NLP训练方法

专知

4+阅读 · 2018年7月25日

CVPR 2018 | ETH Zurich提出利用对抗策略，解决目标检测的域适配问题

CVPR 2018 | ETH Zurich提出利用对抗策略，解决目标检测的域适配问题

极市平台

5+阅读 · 2018年6月13日

A nonparametric doubly robust test for a continuous treatment effect

Arxiv

0+阅读 · 2022年2月7日

Cycle Self-Training for Domain Adaptation

Arxiv

8+阅读 · 2021年10月28日

Recursively Conditional Gaussian for Ordinal Unsupervised Domain Adaptation

Arxiv

5+阅读 · 2021年7月28日

A Theory of Label Propagation for Subpopulation Shift

Arxiv

7+阅读 · 2021年2月22日

Theoretical Analysis of Self-Training with Deep Networks on Unlabeled Data

Arxiv

9+阅读 · 2021年2月8日

Causality for Machine Learning

Arxiv

25+阅读 · 2019年11月24日

Hierarchical Meta Learning

Arxiv

9+阅读 · 2019年4月19日

Transfer Adaptation Learning: A Decade Survey

Transfer Adaptation Learning: A Decade Survey

Arxiv

37+阅读 · 2019年3月12日

FIGR: Few-shot Image Generation with Reptile

FIGR: Few-shot Image Generation with Reptile

Arxiv

5+阅读 · 2019年1月8日

Variational Inference: A Unified Framework of Generative Models and Some Revelations

Variational Inference: A Unified Framework of Generative Models and Some Revelations

Arxiv

6+阅读 · 2018年7月16日

VIP会员

相关主题

领域自适应

相关VIP内容

视觉识别的无监督域适应研究综述

视觉识别的无监督域适应研究综述

专知会员服务

32+阅读 · 2021年12月17日

【NeurIPS2021】学习用于分布外预测的因果语义表示

【NeurIPS2021】学习用于分布外预测的因果语义表示

专知会员服务

18+阅读 · 2021年11月19日

NeurIPS2021 | Cycle Self-Training：领域自适应的循环自训练方法与理论

NeurIPS2021 | Cycle Self-Training：领域自适应的循环自训练方法与理论

专知会员服务

20+阅读 · 2021年11月13日

【CVPR2021】深度稳定学习分布外泛化

专知会员服务

30+阅读 · 2021年5月20日

【CVPR2021】基于跨领域自适应聚类的半监督领域自适应算法

专知会员服务

58+阅读 · 2021年5月19日

领域自适应研究综述

领域自适应研究综述

专知会员服务

55+阅读 · 2021年5月5日

【CVPR2021】现实世界域泛化的自适应方法

【CVPR2021】现实世界域泛化的自适应方法

专知会员服务

58+阅读 · 2021年3月31日

机器学习模型如何泛化到未知领域？微软亚研「领域泛化 (Domain Generalization)」综述论文概述理论、算法等

机器学习模型如何泛化到未知领域？微软亚研「领域泛化 (Domain Generalization)」综述论文概述理论、算法等

专知会员服务

59+阅读 · 2021年3月13日

【ICLR2021】对未标记数据进行深度网络自训练的理论分析

【ICLR2021】对未标记数据进行深度网络自训练的理论分析

专知会员服务

26+阅读 · 2021年2月22日

【IJCAI2020】通过双向对抗训练生成中间域样本提升半监督域自适应效果

【IJCAI2020】通过双向对抗训练生成中间域样本提升半监督域自适应效果

专知会员服务

35+阅读 · 2020年9月17日

热门VIP内容

开通专知VIP会员享更多权益服务

《战区安全决策课程体系》最新244页

《"无人机航母"原型平台》

任务规划与地形分析：现代复杂环境作战导航体系

《攻击场景描述形式化模型研究》

相关资讯

【CVPR2021】面向通用领域自适应的领域共识聚类

【CVPR2021】面向通用领域自适应的领域共识聚类

专知

24+阅读 · 2021年5月6日

【CVPR2021】基于反事实推断的视觉问答框架

【CVPR2021】基于反事实推断的视觉问答框架

专知

38+阅读 · 2021年3月4日

TPAMI 2020 | 无监督多类域适应：理论，算法与实践

TPAMI 2020 | 无监督多类域适应：理论，算法与实践

PaperWeekly

5+阅读 · 2021年1月21日

【ICML 2020 】小样本学习即领域迁移

【ICML 2020 】小样本学习即领域迁移

专知

5+阅读 · 2020年6月26日

【CVPR2020】从领域适应的角度重新思考长尾视觉识别的类平衡方法

【CVPR2020】从领域适应的角度重新思考长尾视觉识别的类平衡方法

专知

5+阅读 · 2020年4月12日

融合零样本学习和小样本学习的弱监督机器学习方法综述

融合零样本学习和小样本学习的弱监督机器学习方法综述

专知

4+阅读 · 2020年3月20日

大数据时代小样本如何学习？看这篇最新《小样本学习方法综述》论文

大数据时代小样本如何学习？看这篇最新《小样本学习方法综述》论文

专知

127+阅读 · 2019年3月31日

NIPS 2018论文解读 | 基于条件对抗网络的领域自适应方法

NIPS 2018论文解读 | 基于条件对抗网络的领域自适应方法

PaperWeekly

4+阅读 · 2018年11月26日

【干货】ACL 2018 鲁棒、无偏的NLP训练方法

【干货】ACL 2018 鲁棒、无偏的NLP训练方法

专知

4+阅读 · 2018年7月25日

CVPR 2018 | ETH Zurich提出利用对抗策略，解决目标检测的域适配问题

CVPR 2018 | ETH Zurich提出利用对抗策略，解决目标检测的域适配问题

极市平台

5+阅读 · 2018年6月13日

相关论文

A nonparametric doubly robust test for a continuous treatment effect

Arxiv

0+阅读 · 2022年2月7日

Cycle Self-Training for Domain Adaptation

Arxiv

8+阅读 · 2021年10月28日

Recursively Conditional Gaussian for Ordinal Unsupervised Domain Adaptation

Arxiv

5+阅读 · 2021年7月28日

A Theory of Label Propagation for Subpopulation Shift

Arxiv

7+阅读 · 2021年2月22日

Theoretical Analysis of Self-Training with Deep Networks on Unlabeled Data

Arxiv

9+阅读 · 2021年2月8日

Causality for Machine Learning

Arxiv

25+阅读 · 2019年11月24日

Hierarchical Meta Learning

Arxiv

9+阅读 · 2019年4月19日

Transfer Adaptation Learning: A Decade Survey

Transfer Adaptation Learning: A Decade Survey

Arxiv

37+阅读 · 2019年3月12日

FIGR: Few-shot Image Generation with Reptile

FIGR: Few-shot Image Generation with Reptile

Arxiv

5+阅读 · 2019年1月8日

Variational Inference: A Unified Framework of Generative Models and Some Revelations

Variational Inference: A Unified Framework of Generative Models and Some Revelations

Arxiv

6+阅读 · 2018年7月16日

大家都在搜

无人机集群

国防科技创新

软件无线电

OpenKG开源系列 | 海洋鱼类百科知识图谱（浙江大学）

微信扫码咨询专知VIP会员