会员服务 ·

FCOS官方改进版来了！小修小改，性能高达50.4 AP！收录到顶刊TPAMI

2020 年 10 月 28 日 CVer

点击上方“CVer”，选择加"星标"置顶

重磅干货，第一时间送达

本文转载自：晓飞的算法工程笔记

本文是对FCOS的小修小改，最终性能达到了50.4AP，可谓相当强劲了，大家在工程上可以参考其中的改进以及提升方法

论文: FCOS: A Simple and Strong Anchor-freeObject Detector

论文地址：https://arxiv.org/abs/2006.09214
论文代码：https://github.com/aim-uofa/AdelaiDet

Introduction

论文由FCOS原团队重新修改后发表，作者管这篇为FCOS的扩展版本而不是FCOSv2，但为了好分辨，我们就管他叫FCOSv2吧。FCOSv2的整体思想基本与FCOS一致，但性能出色很多。对比FCOS，基础主干ResNet-101-FPN上的性能从41.5AP提升了43.2AP，而最高版本的性能则是达到了50.4AP。
本文主要探讨FCOSv2其中的一些改进与提升方法，具体的其它实现可参考之前的FCOS文章。

FCOSv2

FCOS

FCOSv2在思想上与FCOS基本一致，在特征图的每个位置预测目标的类别、尺寸信息以及Center-ness，Center-ness用来表示当前位置与目标中心点的距离，目标的最终分数由分类分数和Center-ness分数结合所得。尺寸信息跟以往的bbox回归方法不同，预测的是特征位置到目标的四个边界的距离。

图2为FCOSv2中的主干网络结构，主干网络依然采用FPN，每层特征使用共同的head预测类别信息、尺寸信息以及Center-ness，具体的可以看看之前的文章。

Change

下面列举了一些FCOSv2相对于FCOS的修改，由于论文没有与原版进行对比，所以不知道各部分带来的收益具体是多少：

正样本点指定的修改，FCOS要求该特征点位于目标内部，以及该特征点到目标边界的距离满足所处的FPN层的约束，而FCOSv2则要求特征点位于目标的中心区域，为当前层的stride，为超参数。
回归目标修改，FCOS的回归目标直接是特征点到目标边界的距离，由于Head是共用的，所以在预测时为每个level预设一个可学习的scale因子，而FCOSv2则加入stride，变得更适应FPN的尺寸，可学习的scale因子依然使用。

center-ness预测的位置，FCOS的center-ness预测与分类预测放到了一起，而FCOSv2则将其与回归预测放到了一起。
回归损失函数修改，FCOS使用IoU损失进行回归的学习，而FCOSv2则采用了GIoU损失进行回归的学习。
最终分数的计算，FCOS采用分类分数以及center-ness之积，FCOSv2则采用分类分数以及center-ness之积的平方根：

Improvement

为了获得更好的性能，除了更换更强的主干网络外，论文还将FCOSv2进行了如下扩展：

使用BiFPN代替普通FPN，注意没有采用深度分离卷积，这部分能带来约2AP提升。
测试阶段的数据增强，将图片依次缩放至，每次步长为100，每个尺寸使用原图以及垂直翻转图片进行推理，这部分能带来约2.5AP提升。
增加可变形卷积，分别替换主干网络的第三和第四阶段的卷积，以及Head的两个分支的前四个卷积，这部分带来约1.5AP提升。

Experiment

与SOTA方法对比。

推理性能对比。

Conclusion

本文是对FCOS的小修小改，最终性能达到了50.4AP，可谓相当强劲了，大家在工程上可以参考其中的改进以及提升方法。

FCOS改进版论文下载

后台回复：FCOS改进版，即可下载论文PDF！

目标检测综述下载

后台回复：目标检测二十年，即可下载39页的目标检测最全综述，共计411篇参考文献。

下载2

后台回复：CVPR2020，即可下载代码开源的论文合集

后台回复：ECCV2020，即可下载代码开源的论文合集

后台回复：YOLO，即可下载YOLOv4论文和代码

重磅！CVer-目标检测 微信交流群已成立

扫码添加CVer助手，可申请加入CVer-目标检测 微信交流群，目前已汇集4000人！涵盖2D/3D目标检测、小目标检测、遥感目标检测等。互相交流，一起进步！

同时也可申请加入CVer大群和细分方向技术群，细分方向已涵盖：目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch和TensorFlow等群。

一定要备注：研究方向+地点+学校/公司+昵称（如目标检测+上海+上交+卡卡），根据格式备注，可更快被通过且邀请进群

▲长按加群

▲长按关注我们

麻烦给我一个在看

登录查看更多

相关内容

TPAMI

关注 3096

IEEE模式分析和机器智能期刊TPAMI（IEEE Trans on Pattern Analysis and Machine Intelligence）出版了有关计算机视觉和图像理解的所有传统领域，模式分析和识别的所有传统领域以及机器智能的选定领域的文章，其中特别强调了用于模式分析的机器学习。还涵盖了诸如可视搜索，文档和手写分析，医学图像分析，视频和图像序列分析，基于内容的图像和视频检索，面部和手势识别以及相关的专用硬件和/或软件体系结构等技术领域。官网地址：http://dblp.uni-trier.de/db/journals/pami/

【AAAI2021】协同挖掘:用于稀疏注释目标检测的自监督学习

专知会员服务

27+阅读 · 2020年12月6日

图像分割二十年，盘点影响力最大的10篇论文

专知会员服务

84+阅读 · 2020年9月27日

【快讯】NeurIPS2020结果出炉，1900篇上榜，你的paper中了吗？

专知会员服务

54+阅读 · 2020年9月26日

【ECCV2020-旷视】利用边界特征做检测的BorderDet

专知会员服务

13+阅读 · 2020年9月19日