阿里巴巴提出 DR Loss：解决目标检测的样本不平衡问题 - 专知

会员服务 ·

0

阿里巴巴提出 DR Loss：解决目标检测的样本不平衡问题

2019 年 8 月 3 日 CVer

点击上方“CVer”，选择加"星标"或“置顶”

重磅干货，第一时间送达

作者：张凯

https://zhuanlan.zhihu.com/p/75896297

本文已由作者授权，未经允许，不得二次转载

背景

《DR Loss: Improving Object Detection by Distributional Ranking》作者来自于阿里巴巴。该论文主要是修改损失函数来处理样本不平衡问题的，之前最出名的应该是2017 ICCV最佳学生论文RetinaNet中的focal loss。2019 AAAI的GHM，2019 CVPR的AP loss也分别讨论了样本不平衡的问题。

因为这类方法只会影响训练，不会影响推理速度，对现有产品影响不会很大，所以还是很值得尝试的。

arXiv：https://arxiv.org/abs/1907.10156

代码未开源，基于detectron开发。

一、研究动机

样本不平衡问题是one-stage目标检测算法中一直存在的问题，负样本（背景）的数目远大于正样本，简单样本远大于难例，从而导致训练无法收敛到很好的解。2017 ICCV RetinaNet是通过focal loss来处理该问题，主要是抑制大量简单的负样本，给难例更大的权重。而本篇论文则提出了另外一种解决思路（2019 CVPR AP loss 也是这个思路）：将分类问题转换为排序问题，从而避免了正负样本不平衡的问题。同时针对排序，提出了排序的损失函数DR loss，并给出了可求导的解。最终性能较RetinaNet有近2个点的提升，提升还是比较明显的。

二、具体方法

整体思路的话，如图所示，主要是将正样本的分布和负样本的分布尽可能区别开，具体结合公式来讲下，比较简单。

首先是对原有分类问题的定义

对于所有的样本，寻找一个分类器，使得分类损失最小，一般采用cross entropy loss，i, j, k 分别代表图像、样本、类别。

进一步地，把正负样本拆开写

把上述问题转换为排序问题：

上述公式的含义是，对于所有样本对（一个正样本和一个负样本构成一对）的损失最小，每一个样本对排序都要正确，r 代表margin。

进一步，对于每幅图像可以写成

如果按照上述公式来做，会存在两个问题，一是负样本之间本身就是不平衡的，二是样本对太多了，具体是 n+ x n- 。

所以一种解决方案是改求正负样本分布的min和max：

成功地将量级转换为了1。但上述同样存在一个问题，就是该公式对outliers太敏感了，训练肯定不稳定。

为了解决上述问题，本文的思路是选取正负样本中最具代表性的样本来参与排序，具体地，作者定义了正样本分布和负样本分布的分数：

其中q代表的是分布，并有

可以看到，如果q服从均匀分布，实际上求得就是正负样本的期望。（当然这样肯定不行，因为负样本中难易样本是不均衡的）

所以作者希望求解这个分布，使得分布的分数最小化或者最大化

如果分布没有约束的话，那么产生的解一定是最大值对应的q为1，其余值为0，这样就又退化了之前直接求max和min了。

所以作者在此处加入了对分布的约束：

进一步，转换为以下次优问题：

利用对偶法转换：

再用KKT条件，可以求得：

最后，代入公式，求得分布的分数

最终为了平滑整个曲线，作者加入了hinge loss：

最终分类的loss为：

并且为了确保正样本和负样本能够分开，需要

即可保证：

对于回归loss，作者也做了改进：

主要是在训练中对其进行衰减：

目的是为了减少L1和L2之间的gap。

三、实验结果

作者首先做了一些消融实验，例如对于hingle loss中的L:

L对最后的结果影响不大。

其他关于正则项h等消融实验详情见论文。

最终结果的性能提升还是非常明显的，比baseline高了2个点左右。

四、总结分析

优点：借鉴了排序loss引入到目标检测中，并且给出了可行的优化过程，性能提升也很明显，对于现有的检测框架，只需要修改损失函数，后续会考虑尝试下。

缺点：超参还是蛮多的，虽然在COCO上似乎影响不大，换个数据集和检测框架（例如anchor-free的）不知道是不是很稳定。之前在FCOS上尝试了GHM的方法，直接用默认参数可以掉10个点，不过可以通过调参调回来。

重磅！CVer-目标检测交流群成立啦

扫码添加CVer助手，可申请加入CVer-目标检测学术交流群。一定要备注：研究方向+地点+学校/公司+昵称（如目标检测+上海+上交+卡卡）

▲长按加群

▲长按关注我们

麻烦给我一个在看！

登录查看更多

5

相关内容

DR Loss

克服小样本学习中灾难性遗忘方法研究

专知会员服务

51+阅读 · 2020年7月16日

【CVPR2020】跨模态哈希的无监督知识蒸馏

【CVPR2020】跨模态哈希的无监督知识蒸馏

专知会员服务

61+阅读 · 2020年6月25日

生成式对抗网络(GANs)最新2020综述，41页pdf阐述GAN训练、挑战、解决方案和未来方向

生成式对抗网络(GANs)最新2020综述，41页pdf阐述GAN训练、挑战、解决方案和未来方向

专知会员服务

196+阅读 · 2020年5月14日

【西安交大】深度学习目标检测方法综述

专知会员服务

164+阅读 · 2020年4月21日

【CVPR2020】实例感知、上下文聚焦和内存有效的弱监督目标检测，Instance-aware, Context-focused, and Memory-efficient Weakly Supervised Object Detection

【CVPR2020】实例感知、上下文聚焦和内存有效的弱监督目标检测，Instance-aware, Context-focused, and Memory-efficient Weakly Supervised Object Detection

专知会员服务

34+阅读 · 2020年4月11日

【WWW2020】解决推荐系统中目标客户失真问题，Addressing the Target Customer Distortion Problem in Recommender Systems

【WWW2020】解决推荐系统中目标客户失真问题，Addressing the Target Customer Distortion Problem in Recommender Systems

专知会员服务

10+阅读 · 2020年4月4日

【TPAMI2020】目标检测中的不平衡问题:综述论文，34页pdf

专知会员服务

55+阅读 · 2020年3月16日

【何恺明团队新论文】PointRend:将图像分割视作渲染问题，性能显著提升！

【何恺明团队新论文】PointRend:将图像分割视作渲染问题，性能显著提升！

专知会员服务

28+阅读 · 2019年12月19日

【目标检测 | 2019最新综述】目标检测中的不平衡问题，附31页PDF， Imbalance Problems in Object Detection: A Review

【目标检测 | 2019最新综述】目标检测中的不平衡问题，附31页PDF， Imbalance Problems in Object Detection: A Review

专知会员服务

46+阅读 · 2019年11月15日

【CCF优秀博士学位论文奖-2019】机器学习算法的分布式梯度优化研究，北京大学江佳伟

【CCF优秀博士学位论文奖-2019】机器学习算法的分布式梯度优化研究，北京大学江佳伟

专知会员服务

57+阅读 · 2019年11月8日

2019 DR loss（样本不平衡问题）目标检测论文阅读

2019 DR loss（样本不平衡问题）目标检测论文阅读

极市平台

11+阅读 · 2019年10月28日

2019 AAAI GHM（解决one-stage样本不平衡问题）目标检测算法论文阅读笔记

2019 AAAI GHM（解决one-stage样本不平衡问题）目标检测算法论文阅读笔记

极市平台

13+阅读 · 2019年6月30日

样本贡献不均：Focal Loss和 Gradient Harmonizing Mechanism

样本贡献不均：Focal Loss和 Gradient Harmonizing Mechanism

极市平台

25+阅读 · 2019年4月25日

非平衡数据集 focal loss 多类分类

非平衡数据集 focal loss 多类分类

AI研习社

33+阅读 · 2019年4月23日

被忽略的Focal Loss变种

被忽略的Focal Loss变种

极市平台

29+阅读 · 2019年4月19日

CVPR2019 | 斯坦福学者提出GIoU，目标检测任务的新Loss

CVPR2019 | 斯坦福学者提出GIoU，目标检测任务的新Loss

AI100

12+阅读 · 2019年3月10日

【VALSE前沿选介2018-05期】谈谈深度学习目标检测中的遮挡问题

【VALSE前沿选介2018-05期】谈谈深度学习目标检测中的遮挡问题

VALSE

6+阅读 · 2018年9月4日

Focal Loss for Dense Object Detection

Focal Loss for Dense Object Detection

统计学习与视觉计算组

12+阅读 · 2018年3月15日

论文 | 用于密集对象检测的 Focal Loss 函数

论文 | 用于密集对象检测的 Focal Loss 函数

七月在线实验室

9+阅读 · 2018年1月4日

何恺明大神的「Focal Loss」，如何更好地理解？

何恺明大神的「Focal Loss」，如何更好地理解？

PaperWeekly

10+阅读 · 2017年12月28日

Gaussian YOLOv3: An Accurate and Fast Object Detector Using Localization Uncertainty for Autonomous Driving

Arxiv

6+阅读 · 2019年4月9日

Libra R-CNN: Towards Balanced Learning for Object Detection

Arxiv

7+阅读 · 2019年4月4日

Strong-Weak Distribution Alignment for Adaptive Object Detection

Arxiv

6+阅读 · 2018年12月12日

Polarity Loss for Zero-shot Object Detection

Polarity Loss for Zero-shot Object Detection

Arxiv

3+阅读 · 2018年11月22日

A General and Adaptive Robust Loss Function

A General and Adaptive Robust Loss Function

Arxiv

8+阅读 · 2018年11月5日

The Lovász-Softmax loss: A tractable surrogate for the optimization of the intersection-over-union measure in neural networks

Arxiv

4+阅读 · 2018年4月9日

Domain Adaptive Faster R-CNN for Object Detection in the Wild

Arxiv

10+阅读 · 2018年3月8日

Weakly Supervised Object Detection with Pointwise Mutual Information

Arxiv

5+阅读 · 2018年1月26日

Arxiv

7+阅读 · 2018年1月24日

Joint Optic Disc and Cup Segmentation Based on Multi-label Deep Network and Polar Transformation

Arxiv

6+阅读 · 2018年1月11日

VIP会员

相关主题

样本不平衡

相关VIP内容

克服小样本学习中灾难性遗忘方法研究

专知会员服务

51+阅读 · 2020年7月16日

【CVPR2020】跨模态哈希的无监督知识蒸馏

【CVPR2020】跨模态哈希的无监督知识蒸馏

专知会员服务

61+阅读 · 2020年6月25日

生成式对抗网络(GANs)最新2020综述，41页pdf阐述GAN训练、挑战、解决方案和未来方向

生成式对抗网络(GANs)最新2020综述，41页pdf阐述GAN训练、挑战、解决方案和未来方向

专知会员服务

196+阅读 · 2020年5月14日

【西安交大】深度学习目标检测方法综述

专知会员服务

164+阅读 · 2020年4月21日

【CVPR2020】实例感知、上下文聚焦和内存有效的弱监督目标检测，Instance-aware, Context-focused, and Memory-efficient Weakly Supervised Object Detection

【CVPR2020】实例感知、上下文聚焦和内存有效的弱监督目标检测，Instance-aware, Context-focused, and Memory-efficient Weakly Supervised Object Detection

专知会员服务

34+阅读 · 2020年4月11日

【WWW2020】解决推荐系统中目标客户失真问题，Addressing the Target Customer Distortion Problem in Recommender Systems

【WWW2020】解决推荐系统中目标客户失真问题，Addressing the Target Customer Distortion Problem in Recommender Systems

专知会员服务

10+阅读 · 2020年4月4日

【TPAMI2020】目标检测中的不平衡问题:综述论文，34页pdf

专知会员服务

55+阅读 · 2020年3月16日

【何恺明团队新论文】PointRend:将图像分割视作渲染问题，性能显著提升！

【何恺明团队新论文】PointRend:将图像分割视作渲染问题，性能显著提升！

专知会员服务

28+阅读 · 2019年12月19日

【目标检测 | 2019最新综述】目标检测中的不平衡问题，附31页PDF， Imbalance Problems in Object Detection: A Review

【目标检测 | 2019最新综述】目标检测中的不平衡问题，附31页PDF， Imbalance Problems in Object Detection: A Review

专知会员服务

46+阅读 · 2019年11月15日

【CCF优秀博士学位论文奖-2019】机器学习算法的分布式梯度优化研究，北京大学江佳伟

【CCF优秀博士学位论文奖-2019】机器学习算法的分布式梯度优化研究，北京大学江佳伟

专知会员服务

57+阅读 · 2019年11月8日

热门VIP内容

开通专知VIP会员享更多权益服务

《复杂工程系统模型驱动设计决策支持系统：早期设计阶段挑战》最新138页

《日本陆上自卫队2040年作战方式与未来作战研究》最新23页slides

人工智能作为战争武器

《后勤保障》最新23页

相关资讯

2019 DR loss（样本不平衡问题）目标检测论文阅读

2019 DR loss（样本不平衡问题）目标检测论文阅读

极市平台

11+阅读 · 2019年10月28日

2019 AAAI GHM（解决one-stage样本不平衡问题）目标检测算法论文阅读笔记

2019 AAAI GHM（解决one-stage样本不平衡问题）目标检测算法论文阅读笔记

极市平台

13+阅读 · 2019年6月30日

样本贡献不均：Focal Loss和 Gradient Harmonizing Mechanism

样本贡献不均：Focal Loss和 Gradient Harmonizing Mechanism

极市平台

25+阅读 · 2019年4月25日

非平衡数据集 focal loss 多类分类

非平衡数据集 focal loss 多类分类

AI研习社

33+阅读 · 2019年4月23日

被忽略的Focal Loss变种

被忽略的Focal Loss变种

极市平台

29+阅读 · 2019年4月19日

CVPR2019 | 斯坦福学者提出GIoU，目标检测任务的新Loss

CVPR2019 | 斯坦福学者提出GIoU，目标检测任务的新Loss

AI100

12+阅读 · 2019年3月10日

【VALSE前沿选介2018-05期】谈谈深度学习目标检测中的遮挡问题

【VALSE前沿选介2018-05期】谈谈深度学习目标检测中的遮挡问题

VALSE

6+阅读 · 2018年9月4日

Focal Loss for Dense Object Detection

Focal Loss for Dense Object Detection

统计学习与视觉计算组

12+阅读 · 2018年3月15日

论文 | 用于密集对象检测的 Focal Loss 函数

论文 | 用于密集对象检测的 Focal Loss 函数

七月在线实验室

9+阅读 · 2018年1月4日

何恺明大神的「Focal Loss」，如何更好地理解？

何恺明大神的「Focal Loss」，如何更好地理解？

PaperWeekly

10+阅读 · 2017年12月28日

相关论文

Gaussian YOLOv3: An Accurate and Fast Object Detector Using Localization Uncertainty for Autonomous Driving

Arxiv

6+阅读 · 2019年4月9日

Libra R-CNN: Towards Balanced Learning for Object Detection

Arxiv

7+阅读 · 2019年4月4日

Strong-Weak Distribution Alignment for Adaptive Object Detection

Arxiv

6+阅读 · 2018年12月12日

Polarity Loss for Zero-shot Object Detection

Polarity Loss for Zero-shot Object Detection

Arxiv

3+阅读 · 2018年11月22日

A General and Adaptive Robust Loss Function

A General and Adaptive Robust Loss Function

Arxiv

8+阅读 · 2018年11月5日

The Lovász-Softmax loss: A tractable surrogate for the optimization of the intersection-over-union measure in neural networks

Arxiv

4+阅读 · 2018年4月9日

Domain Adaptive Faster R-CNN for Object Detection in the Wild

Arxiv

10+阅读 · 2018年3月8日

Weakly Supervised Object Detection with Pointwise Mutual Information

Arxiv

5+阅读 · 2018年1月26日

Arxiv

7+阅读 · 2018年1月24日

Joint Optic Disc and Cup Segmentation Based on Multi-label Deep Network and Polar Transformation

Arxiv

6+阅读 · 2018年1月11日

大家都在搜

久别重逢话双塔

CMU博士论文

无人机集群

无人机测控通信自组网技术综述

微信扫码咨询专知VIP会员