论文 | 用于密集对象检测的 Focal Loss 函数

会员服务 ·

论文 | 用于密集对象检测的 Focal Loss 函数

2018 年 1 月 4 日 七月在线实验室

论文：Focal Loss for Dense Object Detection

原文链接：https://arxiv.org/abs/1708.02002

背景介绍

　　目前最先进的目标检测系统是基于两个阶段的机制。第一个阶段生成一个稀疏的候选区域集合，第二个阶段使用卷积神经网络对候选区域进行分类处理。最典型的例子例如R-CNN系列框架。

　　另一种目标检测系统的解决思路是在一个阶段完成目标检测的任务。例如YOLO，SSD。这些系统的比两阶段的要快，但是在准确度方面有所下降。

　　本文进一步推进了上述的研究，提出了一种一阶段的目标检测系统。首次在COCO数据集上达到了最先进两阶段目标检测系统（例如FPN，Faster R-CNN）的性能。为了达到这个目的，我们把训练阶段的类别不平衡性视为一阶目标检测系统精度的瓶颈，并提出了了解决这个瓶颈的全新的损失函数。在此基础上，我们设计了一个名为RetinaNet的一阶目标检测模型。

Focal Loss

2.1 Cross entropy

　　二分类问题中loss的定义如下：

　　上式中代表样本属于1的概率。y代表标签。为了表示方便，我们定义如下：

　　CE loss 如下图中的蓝色曲线所示，这个loss的一个显著特征是，即使是很容易的分类情况下，也会产生较大的loss。当把这些大量的loss加起来的时候，将会产生较大的影响。

2.2 Balanced Cross Entropy

　　常用的解决类别不平衡的方法是引入一个额外的参数。用来设置为相反类别的概率或者作为交叉验证的一个超参数。为了表示方便，我们重写了带参数的CE loss：

2.3 Focal Loss Definition

　　正如实验所示，在密集目标检测系统中，训练过程中，遇到的类别失衡将会对交叉熵损失函数产生较大影响。容易分类的负样本将会占据主要的损失以及梯度。尽管平衡了正负样本的重要性，但是无法对容易分类的样本和难以分类的样本产生影响。因此我们提出了一种全新的loss function（focal loss），以此来降低容易分类样本的重要性，从而把训练集中在难以分类的负样本上。 Focal loss 的形式如下：

　　Focal loss 在 cross entropy 的基础上增加了一个调节因子，。Focal loss 如下图所示，的取值在[0, 5] 之间。从图中我们可以看出两点：

当一个样本被错分类，值很小的时候，调节因子，的值很小，因此不会对loss产生影响。当值很大，趋近于1的时候，调节因子的值趋近于0，因此对于正确分类的样本的loss值被缩小了。
的时候，FL 等于 CE。当增加时候，调节因子的影响相应的增加，实验中取得了最好的实验效果。

　　在实验中，我们使用了变种的focal loss ，形式如下：

RetinaNet Detector

　　为了验证使用的Focal Loss function，作者设计了一种RetinaNet，如下图所示：

　　RetinaNet 网络架构包含一个backbone 网络和两个subnetwork。Backbone网络在底层使用了ResNet，用来生成卷机特征，在此之上有一个Feature Pyramid Network（FPN）。Backbone外接两个subnetwork，一个用来分类，一个用来生成目标位置信息。

实验验证

　　我们在COCO数据集上进行了目标检测的实验，并将测试结果与近期最先进的方法进行比较。其中包括一阶模型和二阶模型。下表列出了测试结果：

　　这是Retina-101-800模型的测试结果，训练过程中采用scale filter ，训练时间是之前模型的1.5倍，但是AP值提升了1.3。对比当前最先进的一阶模型，我们的模型AP值提升了5.9%（39.1 vs 33.2）。对比当前最先进的二阶模型，Faster R-CNN w TDM，我们的模型也取得了2.3%的优势（39.1 vs 36.8）。

总结

　　本文中，我们将类别不平衡视为一阶目标检测系统的性能瓶颈，为了解决这个问题我们对CE（交叉熵损失）提出了改进，提出了focal loss。实验结果显示，基于focal loss 的RetinaNet ，相对比与之前的目标检测系统，有较大改进。

这里有免费AI课程

登录查看更多

相关内容

RetinaNet

关注 7

RetinaNet是2018年Facebook AI团队在目标检测领域新的贡献。它的重要作者名单中Ross Girshick与Kaiming He赫然在列。来自Microsoft的Sun Jian团队与现在Facebook的Ross/Kaiming团队在当前视觉目标分类、检测领域有着北乔峰、南慕容一般的独特地位。这两个实验室的文章多是行业里前进方向的提示牌。 RetinaNet只是原来FPN网络与FCN网络的组合应用，因此在目标网络检测框架上它并无特别亮眼创新。文章中最大的创新来自于Focal loss的提出及在单阶段目标检测网络RetinaNet（实质为Resnet + FPN + FCN）的成功应用。Focal loss是一种改进了的交叉熵(cross-entropy, CE)loss，它通过在原有的CE loss上乘了个使易检测目标对模型训练贡献削弱的指数式，从而使得Focal loss成功地解决了在目标检测时，正负样本区域极不平衡而目标检测loss易被大批量负样本所左右的问题。此问题是单阶段目标检测框架（如SSD/Yolo系列）与双阶段目标检测框架（如Faster-RCNN/R-FCN等）accuracy gap的最大原因。在Focal loss提出之前，已有的目标检测网络都是通过像Boot strapping/Hard example mining等方法来解决此问题的。作者通过后续实验成功表明Focal loss可在单阶段目标检测网络中成功使用，并最终能以更快的速率实现与双阶段目标检测网络近似或更优的效果。

【SIGIR2020】一个统一的双视图模型，用于具有不一致性损失的评论总结和情绪分类，A Unified Dual-view Model for Review Summarization and Sentiment Classification with Inconsistency Loss

专知会员服务

22+阅读 · 2020年6月3日

【CVPR2020-Oral】用于深度网络的任务感知超参数

专知会员服务

28+阅读 · 2020年5月25日

少标签数据学习，54页ppt

专知会员服务

203+阅读 · 2020年5月22日

YOLOv4 重磅来袭！俄罗斯小哥带来新一代快速高效检测器

专知会员服务

32+阅读 · 2020年4月24日