现实世界中的对象频率通常遵循幂次定律,导致机器学习模型所看到的具有长尾类分布的数据集与我们对模型在所有类上表现良好的期望之间的不匹配。我们从领域适应的角度来分析这种不匹配。首先,我们将现有的长尾分类的类平衡方法与目标移位相联系,这是一个在领域适应方面得到充分研究的场景。这种联系表明,这些方法隐含地假设训练数据和测试数据共享相同的类条件分布,这种分布在一般情况下不成立,尤其是尾部类。虽然头类可以包含丰富多样的训练示例,很好地表示推断时的预期数据,但尾部类通常缺乏代表性的训练数据。为此,我们建议通过元学习方法显式地估计类条件分布之间的差异来扩充经典的类平衡学习。我们用6个基准数据集和3个损失函数验证了我们的方法。
https://arxiv.org/abs/2003.10780
专知便捷查看
便捷下载,请关注专知公众号(点击上方蓝色专知关注)
后台回复“CBM” 就可以获取《【CVPR2020】从领域适应的角度重新思考长尾视觉识别的类平衡方法》专知下载链接