ECCV 2020 | 针对长尾分布问题的特征空间增广

2020 年 11 月 6 日 CVer

点击上方“CVer”,选择加"星标"置顶

重磅干货,第一时间送达

本文者:LeoFerguson

https://zhuanlan.zhihu.com/p/203799008

本文已由原作者授权,不得擅自二次转载

题目:Feature Space Augmentation for Long-Tailed Data

这篇文章收录于ECCV2020,针对的是分类任务中的长尾分布问题。

论文地址:https://arxiv.org/abs/2008.03673

现实世界的数据通常遵循长尾分布,也就是说每个类的数量通常是不同的。例如,数据集头部类中样本数很多,而尾部类中样本数很少。然而我们希望模型是能够公平的表示整个数据集,而不是偏向某些样本多的类。解决长尾问题的各种方法中,类平衡损失、重采样和数据增广是比较常见的方法。但是对于尾部类来说,我们不得不考虑一些其他知识来弥补丢失的信息。在本文中,作者提出了一种新的方法来解决长尾问题-在特征空间中将头部类的特征增广到尾部类特征上。具体来说是将每个类的特征解耦成类特有和类共有特征,将尾部类的类特有特征和头部类的类共有特征进行融合,从而实现特征空间的增广。该方法在iNaturalist, ImageNet-LT, Places-LT 和长尾的CIFAR集四个数据集上都取得了不错的效果。

简介

长尾分布广泛存在于视觉任务中。如图所示在分类和检测任务中存在长尾分布问题。


长尾分布带来的主要问题是在训练时,因为尾部类数据量少,统计信息不够丰富,因而模型并不能很好的表达尾部类。现有的方法主要有数据增广,下采样,过采样,和平衡损失函数的构建等。但是这些方法当尾部类数量极少时,性能并不理想。如下图所示。

本文提出了在特征空间中,将头部类的信息迁移到尾部类上,具体方法如下。

本文方法

本文首先用CAM方法提取注意力区域,得到每个类的类特有特征和类共有特征。之后将尾部类的类特有特征和头部类的类共有特征进行融合。

首先来介绍一下CAM(Class Activation Map)。

M是我们得到的高亮图。c是类别,x,y是像素位置,k是通道,w是权重,f是特征向量。当M越大,意味着x,y处的特征对于c这一类别来说越发重要。之后我们将M归一化到0-1,给一个阈值

,通过下面的公式,我们就能得到类特有特征(s代表specific)和类共有特征(g代表generic)。

 代表Hadamard乘积,而当x大于等于0时,sgn(x)=1,小于0时,sgn(x)=0。

之后我们来看整体的训练流程。第一步是进行全部数据的训练,得到提取特征的子网络和基础分类器,用于之后的步骤中。第二步是根据刚刚得到的提取特征网络和分类器,以及之前的CAM,进行尾部类的增广。可以看到,第二步进去一张尾部类图片和一张头部类图片,选取头部类图片时是选取的与尾部类距离较近,容易混淆的头部类(根据置信度排序得到)。

第三步则是微调。注意第三步和第二步是同步进行的,统称为第二阶段。第二阶段整体算法流程如下。

实验与结果

数据集: Long-tailed CIFAR-10 and CIFAR-100, ImageNet-LT and Places-LT Dataset,iNaturalist 2017 and 2018.

对比实验:


消融实验

结果分析



更多细节可参考论文原文。

下载1


在CVer公众号后台回复:PRML,即可下载758页《模式识别和机器学习》PRML电子书和源码该书是机器学习领域中的第一本教科书,全面涵盖了该领域重要的知识点。本书适用于机器学习、计算机视觉、自然语言处理、统计学、计算机科学、信号处理等方向。


PRML

下载2:CVPR /  ECCV 2020开源代码


在CVer公众号后台回复:CVPR2020,即可下载CVPR 2020代码开源的论文合集

在CVer公众号后台回复:ECCV2020,即可下载ECCV 2020代码开源的论文合集


重磅!CVer-论文写作与投稿交流群成立


扫码添加CVer助手,可申请加入CVer-论文写作与投稿 微信交流群,目前已满2400+人,旨在交流顶会(CVPR/ICCV/ECCV/NIPS/ICML/ICLR/AAAI等)、顶刊(IJCV/TPAMI/TIP等)、SCI、EI、中文核心等写作与投稿事宜。


同时也可申请加入CVer大群和细分方向技术群,细分方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch和TensorFlow等群。


一定要备注:研究方向+地点+学校/公司+昵称(如论文写作+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群


▲长按加微信群


▲长按关注CVer公众号

整理不易,请给CVer点赞和在看

登录查看更多
1

相关内容

【AAAI2021】小样本学习多标签意图检测
专知会员服务
54+阅读 · 2020年12月8日
专知会员服务
28+阅读 · 2020年10月24日
专知会员服务
45+阅读 · 2020年10月5日
专知会员服务
50+阅读 · 2020年7月16日
【KDD2020】自适应多通道图卷积神经网络
专知会员服务
119+阅读 · 2020年7月9日
【CVPR2020-北京大学】自适应间隔损失的提升小样本学习
专知会员服务
84+阅读 · 2020年6月9日
TPAMI 2019 | 鲁棒RGB-D人脸识别
计算机视觉life
11+阅读 · 2019年6月8日
CVPR 2019 Oral 论文解读 | 无监督域适应语义分割
AI科技评论
49+阅读 · 2019年5月29日
一种小目标检测中有效的数据增强方法
极市平台
119+阅读 · 2019年3月23日
Arxiv
1+阅读 · 2021年2月4日
Learning Embedding Adaptation for Few-Shot Learning
Arxiv
16+阅读 · 2018年12月10日
Arxiv
5+阅读 · 2018年10月4日
VIP会员
相关VIP内容
【AAAI2021】小样本学习多标签意图检测
专知会员服务
54+阅读 · 2020年12月8日
专知会员服务
28+阅读 · 2020年10月24日
专知会员服务
45+阅读 · 2020年10月5日
专知会员服务
50+阅读 · 2020年7月16日
【KDD2020】自适应多通道图卷积神经网络
专知会员服务
119+阅读 · 2020年7月9日
【CVPR2020-北京大学】自适应间隔损失的提升小样本学习
专知会员服务
84+阅读 · 2020年6月9日
Top
微信扫码咨询专知VIP会员