论文题目: Self-training with Noisy Student improves ImageNet classification

论文摘要: 我们提出了一种简单的自我训练方法,在ImageNet上达到87.4%的top-1精度,比目前最先进的需要3.5B弱标记Instagram图像的模型好1.0%。在稳健性测试集上,它将imagnet-A的最高精度从16.6%提高到74.2%,将imagnet-C的平均损坏误差从45.7降低到31.2,并将imagnet-P的平均翻转率从27.8降低到16.1。为了达到这一目的,我们首先在标注的ImageNet图像上训练了一个EfficientNet模型,然后用这个模型作为老师在3亿无标签图像上生成伪标签。然后又训练了一个更大的EfficientNet作为学生student模型,使用的数据则是正确标注图像和伪标注图像的混合数据。这一过程不断迭代,每个新的学生模型作为下一轮的老师模型。在伪标签的生成过程中,老师模型不受噪声干扰,所以生成的伪标注会尽可能逼真。但是在学生模型的学习过程中,我们对数据加入了噪声,使用了诸如数据增强、dropout、随机深度等方法,使得学生模型在从伪标签训练的过程中更加艰难。

作者简介:

Quoc V. Le,谷歌研究科学家,斯坦福大学计算机科学系人工智能实验室博士生。 Qizhe Xie,卡内基梅隆大学机器学习系博士研究生,感兴趣的方向:深度学习、自然语言处理、计算机视觉。等

成为VIP会员查看完整内容
23

相关内容

一家美国的跨国科技企业,致力于互联网搜索、云计算、广告技术等领域,由当时在斯坦福大学攻读理学博士的拉里·佩奇和谢尔盖·布林共同创建。创始之初,Google 官方的公司使命为「整合全球范围的信息,使人人皆可访问并从中受益」。 Google 开发并提供了大量基于互联网的产品与服务,其主要利润来自于 AdWords 等广告服务。

2004 年 8 月 19 日, 公司以「GOOG」为代码正式登陆纳斯达克交易所。
【Google】平滑对抗训练,Smooth Adversarial Training
专知会员服务
46+阅读 · 2020年7月4日
【Google】监督对比学习,Supervised Contrastive Learning
专知会员服务
72+阅读 · 2020年4月24日
【Google AI】开源NoisyStudent:自监督图像分类
专知会员服务
54+阅读 · 2020年2月18日
如何优化你的图像分类模型效果?
AI研习社
4+阅读 · 2019年5月26日
【干货】Yann Lecun自监督学习指南(附114页Slides全文)
GAN生成式对抗网络
93+阅读 · 2018年12月19日
Arxiv
8+阅读 · 2018年11月21日
Few Shot Learning with Simplex
Arxiv
5+阅读 · 2018年7月27日
Arxiv
6+阅读 · 2018年6月21日
VIP会员
相关VIP内容
【Google】平滑对抗训练,Smooth Adversarial Training
专知会员服务
46+阅读 · 2020年7月4日
【Google】监督对比学习,Supervised Contrastive Learning
专知会员服务
72+阅读 · 2020年4月24日
【Google AI】开源NoisyStudent:自监督图像分类
专知会员服务
54+阅读 · 2020年2月18日
微信扫码咨询专知VIP会员