【ICLR2021】对未标记数据进行深度网络自训练的理论分析 - 专知VIP

会员服务 ·

0

自训练算法 · ICLR 2021 ·

2021 年 2 月 22 日

【ICLR2021】对未标记数据进行深度网络自训练的理论分析

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

自训练算法训练模型以适应另一个先前学习的模型预测的伪标签，对于使用神经网络对未标记的数据进行学习非常成功。但是，当前对自训练的理论理解仅适用于线性模型。这项工作为半监督学习，无监督领域适应和无监督学习提供了深度网络自训练的统一理论分析。我们分析的核心是一个简单但现实的“扩展”假设，该假设指出，数据的低概率子集必须扩展到相对于子集而言具有较大概率的邻域。我们还假设不同类别中的示例邻域具有最小的重叠。我们证明在这些假设下，基于自训练和输入一致性正则化的人口目标最小化方法将在地面真相标签方面实现高精度。通过使用现成的泛化边界，我们立即将此结果转换为在边际和Lipschitzness中为多项式的神经网络的样本复杂度保证。我们的结果有助于解释最近提出的使用输入一致性正则化的自训练算法的经验成功。

https://www.zhuanzhi.ai/paper/dd480967a4f15984429301bca4c6cc92

成为VIP会员查看完整内容

26

相关内容

自训练算法

自训练算法

【CVPR2021】在类别不平衡的数据上施展半监督学习

专知会员服务

38+阅读 · 2021年3月29日

【CVPR2021】用随机标签的神经架构搜索

专知会员服务

12+阅读 · 2021年3月21日

「深度学习:一种统计视角」，伯克利&斯坦福89页pdf综述论文

专知会员服务

73+阅读 · 2021年3月20日

【ICLR2021】IEPT:用于少样本学习的实例级和片段级代理任务

【ICLR2021】IEPT:用于少样本学习的实例级和片段级代理任务

专知会员服务

15+阅读 · 2021年2月15日

【ICLR2021】基于动态正则化的联邦学习

专知会员服务

42+阅读 · 2021年1月18日

最新《非凸优化理论》进展书册，79页pdf

最新《非凸优化理论》进展书册，79页pdf

专知会员服务

110+阅读 · 2020年12月18日

【NeurIPS 2020-Hinton论文】大型自监督模型是强有力的半监督学习器

【NeurIPS 2020-Hinton论文】大型自监督模型是强有力的半监督学习器

专知会员服务

25+阅读 · 2020年11月4日

【NeurIPS2020】梯度增强的转导优化和泛化分析及在多尺度图神经网络中的应用

专知会员服务

14+阅读 · 2020年9月27日

【ICML2020】最小化验证损失代理来搜索最佳神经网络结构

专知会员服务

24+阅读 · 2020年7月13日

【CVPR2020】从领域适应的角度重新思考长尾视觉识别的类平衡方法

【CVPR2020】从领域适应的角度重新思考长尾视觉识别的类平衡方法

专知会员服务

24+阅读 · 2020年4月12日

【CVPR2021】半监督迁移学习的自适应一致性正则化

【CVPR2021】半监督迁移学习的自适应一致性正则化

专知

41+阅读 · 2021年3月7日

目标检测数据标注成本高怎么破？主动学习的自适应监督框架

目标检测数据标注成本高怎么破？主动学习的自适应监督框架

AI科技评论

9+阅读 · 2019年10月11日

10亿级数据规模的半监督图像分类模型，Imagenet测试精度高达81.2％ | 技术头条

10亿级数据规模的半监督图像分类模型，Imagenet测试精度高达81.2％ | 技术头条

AI100

7+阅读 · 2019年5月7日

深度思考 | 从BERT看大规模数据的无监督利用

深度思考 | 从BERT看大规模数据的无监督利用

PaperWeekly

11+阅读 · 2019年2月18日

半监督深度学习小结：类协同训练和一致性正则化

半监督深度学习小结：类协同训练和一致性正则化

PaperWeekly

15+阅读 · 2018年12月24日

通过时空模型迁移学习的无监督的跨数据集行人重新识别

通过时空模型迁移学习的无监督的跨数据集行人重新识别

统计学习与视觉计算组

8+阅读 · 2018年10月23日

学界 | 伯克利、OpenAI等提出基于模型的元策略优化强化学习

学界 | 伯克利、OpenAI等提出基于模型的元策略优化强化学习

机器之心

15+阅读 · 2018年10月21日

数据增强：数据有限时如何使用深度学习？（续）

数据增强：数据有限时如何使用深度学习？（续）

AI研习社

14+阅读 · 2018年5月6日

学界 | 精准防御对抗性攻击，清华大学提出对抗正则化训练方法DeepDefense

学界 | 精准防御对抗性攻击，清华大学提出对抗正则化训练方法DeepDefense

机器之心

9+阅读 · 2018年3月7日

AAAI 2018 | 南京大学提出SSWL：从半监督弱标注数据中学习多标签学习问题

AAAI 2018 | 南京大学提出SSWL：从半监督弱标注数据中学习多标签学习问题

机器之心

21+阅读 · 2018年1月7日

Semi-Supervised Learning of Classifiers from a Statistical Perspective: A Brief Review

Arxiv

0+阅读 · 2021年4月13日

Dynamic Weights in Gaussian Mixture Models: A Bayesian Approach

Arxiv

0+阅读 · 2021年4月10日

Model Complexity of Deep Learning: A Survey

Arxiv

32+阅读 · 2021年3月8日

Theoretical Analysis of Self-Training with Deep Networks on Unlabeled Data

Arxiv

9+阅读 · 2021年2月8日

The Importance of Modeling Data Missingness in Algorithmic Fairness: A Causal Perspective

Arxiv

5+阅读 · 2020年12月21日

Improving Few-shot Text Classification via Pretrained Language Representations

Arxiv

3+阅读 · 2019年8月22日

Discovery and recognition of motion primitives in human activities

Discovery and recognition of motion primitives in human activities

Arxiv

4+阅读 · 2019年2月4日

One-Shot Unsupervised Cross Domain Translation

Arxiv

5+阅读 · 2018年10月23日

YOLOv3: An Incremental Improvement

Arxiv

8+阅读 · 2018年4月8日

Unsupervised Cipher Cracking Using Discrete GANs

Arxiv

11+阅读 · 2018年1月15日

VIP会员

相关主题

自训练算法

相关VIP内容

【CVPR2021】在类别不平衡的数据上施展半监督学习

专知会员服务

38+阅读 · 2021年3月29日

【CVPR2021】用随机标签的神经架构搜索

专知会员服务

12+阅读 · 2021年3月21日

「深度学习:一种统计视角」，伯克利&斯坦福89页pdf综述论文

专知会员服务

73+阅读 · 2021年3月20日

【ICLR2021】IEPT:用于少样本学习的实例级和片段级代理任务

【ICLR2021】IEPT:用于少样本学习的实例级和片段级代理任务

专知会员服务

15+阅读 · 2021年2月15日

【ICLR2021】基于动态正则化的联邦学习

专知会员服务

42+阅读 · 2021年1月18日

最新《非凸优化理论》进展书册，79页pdf

最新《非凸优化理论》进展书册，79页pdf

专知会员服务

110+阅读 · 2020年12月18日

【NeurIPS 2020-Hinton论文】大型自监督模型是强有力的半监督学习器

【NeurIPS 2020-Hinton论文】大型自监督模型是强有力的半监督学习器

专知会员服务

25+阅读 · 2020年11月4日

【NeurIPS2020】梯度增强的转导优化和泛化分析及在多尺度图神经网络中的应用

专知会员服务

14+阅读 · 2020年9月27日

【ICML2020】最小化验证损失代理来搜索最佳神经网络结构

专知会员服务

24+阅读 · 2020年7月13日

【CVPR2020】从领域适应的角度重新思考长尾视觉识别的类平衡方法

【CVPR2020】从领域适应的角度重新思考长尾视觉识别的类平衡方法

专知会员服务

24+阅读 · 2020年4月12日

热门VIP内容

开通专知VIP会员享更多权益服务

操作系统智能体：基于多模态大模型（MLLM）的通用计算设备智能体综述

《美国太空军系统全生命周期建模、仿真与分析效能提升方案》最新84页报告

【博士论文】推进数据高效的深度学习：非参数 Transformer、主动测试与上下文学习

自主人工智能：未来战争是否将是自主化的？

相关资讯

【CVPR2021】半监督迁移学习的自适应一致性正则化

【CVPR2021】半监督迁移学习的自适应一致性正则化

专知

41+阅读 · 2021年3月7日

目标检测数据标注成本高怎么破？主动学习的自适应监督框架

目标检测数据标注成本高怎么破？主动学习的自适应监督框架

AI科技评论

9+阅读 · 2019年10月11日

10亿级数据规模的半监督图像分类模型，Imagenet测试精度高达81.2％ | 技术头条

10亿级数据规模的半监督图像分类模型，Imagenet测试精度高达81.2％ | 技术头条

AI100

7+阅读 · 2019年5月7日

深度思考 | 从BERT看大规模数据的无监督利用

深度思考 | 从BERT看大规模数据的无监督利用

PaperWeekly

11+阅读 · 2019年2月18日

半监督深度学习小结：类协同训练和一致性正则化

半监督深度学习小结：类协同训练和一致性正则化

PaperWeekly

15+阅读 · 2018年12月24日

通过时空模型迁移学习的无监督的跨数据集行人重新识别

通过时空模型迁移学习的无监督的跨数据集行人重新识别

统计学习与视觉计算组

8+阅读 · 2018年10月23日

学界 | 伯克利、OpenAI等提出基于模型的元策略优化强化学习

学界 | 伯克利、OpenAI等提出基于模型的元策略优化强化学习

机器之心

15+阅读 · 2018年10月21日

数据增强：数据有限时如何使用深度学习？（续）

数据增强：数据有限时如何使用深度学习？（续）

AI研习社

14+阅读 · 2018年5月6日

学界 | 精准防御对抗性攻击，清华大学提出对抗正则化训练方法DeepDefense

学界 | 精准防御对抗性攻击，清华大学提出对抗正则化训练方法DeepDefense

机器之心

9+阅读 · 2018年3月7日

AAAI 2018 | 南京大学提出SSWL：从半监督弱标注数据中学习多标签学习问题

AAAI 2018 | 南京大学提出SSWL：从半监督弱标注数据中学习多标签学习问题

机器之心

21+阅读 · 2018年1月7日

相关论文

Semi-Supervised Learning of Classifiers from a Statistical Perspective: A Brief Review

Arxiv

0+阅读 · 2021年4月13日

Dynamic Weights in Gaussian Mixture Models: A Bayesian Approach

Arxiv

0+阅读 · 2021年4月10日

Model Complexity of Deep Learning: A Survey

Arxiv

32+阅读 · 2021年3月8日

Theoretical Analysis of Self-Training with Deep Networks on Unlabeled Data

Arxiv

9+阅读 · 2021年2月8日

The Importance of Modeling Data Missingness in Algorithmic Fairness: A Causal Perspective

Arxiv

5+阅读 · 2020年12月21日

Improving Few-shot Text Classification via Pretrained Language Representations

Arxiv

3+阅读 · 2019年8月22日

Discovery and recognition of motion primitives in human activities

Discovery and recognition of motion primitives in human activities

Arxiv

4+阅读 · 2019年2月4日

One-Shot Unsupervised Cross Domain Translation

Arxiv

5+阅读 · 2018年10月23日

YOLOv3: An Incremental Improvement

Arxiv

8+阅读 · 2018年4月8日

Unsupervised Cipher Cracking Using Discrete GANs

Arxiv

11+阅读 · 2018年1月15日

微信扫码咨询专知VIP会员