Google研究院提出FixMatch,简单粗暴却极其有效的半监督学习方法,附14页PDF下载

2020 年 1 月 25 日 CVer

点击上方“CVer”,选择加"星标"或“置顶”

重磅干货,第一时间送达

本文转载自: 专知


【导读】半监督学习旨在利用未标记数据改进模型的性能,它可以一定程度上减少模型训练对大量人工标注的依赖。近期,Google研究院提出了一个简单粗暴地半监督学习方法FixMatch,它在各种标准的半监督学习基准测试中都取得了最先进的性能。


半监督学习(Semi-supervised Learning, SSL)提供了一种利用未标记数据改进模型性能的有效方法。Google研究院近期在论文《FixMatch: Simplifying Semi-Supervised Learning with Consistency and Confidence》中提出了一种简单粗暴却极其有效的半监督学习方法FixMatch。


论文展示了将两种常见半监督学习方法(一致性正则化和伪标签)简单结合后产生的威力。论文提出的FixMatch方法首先利用模型为经过弱增强的无标签图像生成伪标签。对于给定的图像,只有在模型产生高可信预测时,才保留伪标签。然后,该模型被训练来预测当输入同一图像的强增强版本时的伪标签。

尽管这个模型很简单,但论文展示了FixMatch在各种标准的半监督学习基准测试中都取得了最先进的性能,包括在CIFAR-10上使用250个标签获得94.93%的准确率,使用40个标签(相当于每个类只有4个标签)获得88.61%的准确率。由于FixMatch与现有的性能更差的半监督学习方法有许多相似之处,论文中进行了大量的消去测试,以梳理出对FixMatch成功最重要的实验因素。


论文开源了代码:

  • https: //github.com/google-research/fixmatch


简单介绍一下上面提到的两种常见半监督学习方法:

  • 一致性正则化(Consistency Regularization):它是当前许多最先进的半监督学习算法的重要组成部分。一致性正则化依赖以下假设来利用未标注数据:当输入扰动版本的图像时,模型应该输出相似的预测。

  • 伪标签(Pseudo-labeling): 它的核心思想是利用模型自身来为未标注数据生成标签。该方法几十年前就被提出。伪标签特别指使用“硬”标签(模型输出中概率最高的标签)并且只保留概率大于指定阈值的标签。


FixMatch通过将这两种已有的方法进行简单的组合,取得了惊人的效果:


更多详细内容可以参考论文原文《FixMatch: Simplifying Semi-Supervised Learning with Consistency and Confidence》:

  • https://arxiv.org/pdf/2001.07685.pdf


完整PDF下载


请关注 CVer公众号(点击上方蓝色  CVer  关注
  • 后台回复“20200125” 就可以获取完整PDF的下载链接~ 


论文截图如下所示:

完整PDF下载


请关注 CVer公众号(点击上方蓝色  CVer  关注
  • 后台回复“20200125” 就可以获取完整PDF的下载链接~ 

参考链接:

  • https://arxiv.org/pdf/2001.07685.pdf


重磅!CVer-学术交流群已成立


扫码可添加CVer助手,可申请加入CVer大群和细分方向群,细分方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索等群。


一定要备注:研究方向+地点+学校/公司+昵称(如目标检测+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群

▲长按加群


▲长按关注我们

麻烦给我一个在看!

登录查看更多
2

相关内容

专知会员服务
98+阅读 · 2020年7月20日
【CVPR2020】跨模态哈希的无监督知识蒸馏
专知会员服务
59+阅读 · 2020年6月25日
【CVPR2020-北京大学】自适应间隔损失的提升小样本学习
专知会员服务
83+阅读 · 2020年6月9日
【Google AI】开源NoisyStudent:自监督图像分类
专知会员服务
54+阅读 · 2020年2月18日
超强半监督学习 MixMatch
极市平台
8+阅读 · 2019年5月22日
一种小目标检测中有效的数据增强方法
极市平台
119+阅读 · 2019年3月23日
该如何对「半监督学习算法」实际性应用进行评估?
炼数成金订阅号
7+阅读 · 2018年4月27日
简单有效的多标准中文分词
全球人工智能
6+阅读 · 2018年1月1日
入门 | 半监督学习在图像分类上的基本工作方式
机器之心
3+阅读 · 2017年12月23日
Arxiv
5+阅读 · 2020年3月26日
Arxiv
5+阅读 · 2018年10月23日
VIP会员
Top
微信扫码咨询专知VIP会员