类不平衡数据的半监督学习虽然是一个现实的问题,但已经得到了研究。虽然现有的半监督学习(SSL)方法在少数类上表现不佳,但我们发现它们仍然在少数类上生成高精度的伪标签。通过利用这一特性,在这项工作中,我们提出了类再平衡自我训练(CReST),这是一个简单而有效的框架,用于改进现有的对类不平衡数据的SSL方法。CReST通过从一个未标记集中添加伪标记样本扩展了一个标记集,迭代地重新训练一个基线SSL模型,在该模型中,根据估计的类分布,从少数类中更频繁地选择伪标记样本。我们还提出了一种渐进式分布对齐,以适应调整CReST+的再平衡强度。我们展示了CReST和CReST+在各种类不平衡的数据集上改进了最先进的SSL算法,并始终优于其他流行的再平衡方法。

https://www.zhuanzhi.ai/paper/fdb3245caf8bded4d2ba340c2a9c64cc

成为VIP会员查看完整内容
38

相关内容

【CVPR2021】多实例主动学习目标检测
专知会员服务
43+阅读 · 2021年4月18日
【CVPR2021】现实世界域泛化的自适应方法
专知会员服务
56+阅读 · 2021年3月31日
专知会员服务
39+阅读 · 2021年3月29日
专知会员服务
33+阅读 · 2021年3月7日
【AAAI2021】协同挖掘:用于稀疏注释目标检测的自监督学习
【NeurIPS2020 】 数据扩充的图对比学习
专知会员服务
49+阅读 · 2020年11月9日
最新《深度半监督学习》综述论文,43页pdf
专知会员服务
154+阅读 · 2020年6月12日
非平衡数据集 focal loss 多类分类
AI研习社
33+阅读 · 2019年4月23日
基于样本选择的安全图半监督学习方法
样本不平衡数据集防坑骗指南
人工智能前沿讲习班
8+阅读 · 2018年6月7日
开发 | 如何解决机器学习中的数据不平衡问题?
AI科技评论
5+阅读 · 2017年6月13日
Fast AutoAugment
Arxiv
5+阅读 · 2019年5月1日
Arxiv
3+阅读 · 2018年11月19日
Arxiv
6+阅读 · 2018年2月6日
Arxiv
5+阅读 · 2016年12月29日
VIP会员
相关VIP内容
【CVPR2021】多实例主动学习目标检测
专知会员服务
43+阅读 · 2021年4月18日
【CVPR2021】现实世界域泛化的自适应方法
专知会员服务
56+阅读 · 2021年3月31日
专知会员服务
39+阅读 · 2021年3月29日
专知会员服务
33+阅读 · 2021年3月7日
【AAAI2021】协同挖掘:用于稀疏注释目标检测的自监督学习
【NeurIPS2020 】 数据扩充的图对比学习
专知会员服务
49+阅读 · 2020年11月9日
最新《深度半监督学习》综述论文,43页pdf
专知会员服务
154+阅读 · 2020年6月12日
微信扫码咨询专知VIP会员