主动学习是一种标记高效的方法,通过交互式地选择一小部分未标记数据进行标记和训练,从而训练出高效的模型。在“开放世界”设置中,感兴趣的类只占整个数据集的一小部分——大多数数据可能被视为非分布或无关类。这导致了极端的类别不平衡,我们的理论和方法都集中在这个核心问题上。我们提出了一种新的主动学习策略,称为GALAXY (Graph-based active learning At the eXtrEme),它融合了基于图的主动学习和深度学习的思想。与大多数主动学习方法相比,GALAXY能够自动自适应地选择更多类别平衡的样本进行标记。我们的理论表明,GALAXY执行了一种精细的不确定性抽样,它比普通的不确定性抽样收集了更类平衡的数据集。通过实验,我们证明了在从流行数据集生成的不平衡视觉分类设置中,GALAXY优于现有的先进深度主动学习算法。
专知便捷查看
便捷下载,请关注专知公众号(点击上方蓝色专知关注)
后台回复“GBALE” 就可以获取《【ICML2022】GALAXY:极化图主动学习》专知下载链接