来源丨https://zhuanlan.zhihu.com/p/259314634
本文仅用于学术分享,如有侵权,请联系后台作删文处理。
我个人的观点,FCOS 应该算入门检测最合适的文章。
一茬茬同学第一次读 Faster R-CNN 时估计大多数都没有搞明白 anchor 的作用,FCOS 是 anchor free 的方法,可以先绕过 anchor 的概念。Paper 中用的 FPN 结构示意图上画得也比较清楚,如果看 FPN 原文,还要涉及到 RPN 和 Fast R-CNN 的不同处理,知道 top-down 和 bottom-up 的思想应该足够了。
简单总结 FCOS 无 cost 涨点 trick,大部分参考了 mmdetection 的
源码
。源自我面试时候最喜欢问的问题:这篇 paper 有什么不足,后续有哪些改进。
原始论文:centerness 分支与 cls 分支共享前面几个卷积
改进 trick:centerness 分支挪到 reg 分支,参考
https://github.com/tianzhi0549/FCOS/issues/89#issuecomment-516877042
原始论文:GT bbox 内的点,分类时均作为正样本(下图上面小图的所有黄色区域)。
改进 trick:只有 GT bbox 中心附近的 radius * stride 内的小 bbox(可以叫 center bbox)内的点,分类时才作为正样本(下图下面小图的黄色和绿色区域)。
原始论文:假设 FPN 某个 stride feature map 上某个点的回归预测值为 x,则对应的值
,其中 s_i 为 stride。
改进 trick:假设 FPN 某个 stride feature map 上某个点的回归预测值为 x,则对应的值为
。加入 ReLU 可以保证结果非负。注意训练时需要将与 GT 边界的距离,除以 FPN 对应 feature map 的 stride 作为目标值。
改进 trick:将样本点对应的 centerness 作为权重,离 GT 中心越近,权重越大。
改进 trick:GIoU,参考 https://giou.stanford.edu/GIoU.pdf
原始论文:利用 l,t,r,b 计算 centerness。
改进 trick:直接用 IoU,参考 GFL 中的Why is IoU-branch always superior than centerness-branch?(
https://arxiv.org/pdf/2006.04388.pdf)
小目标的 centerness 值比较小,最终 cls 分数很容易被阈值卡掉,另外 GFL 中改进了 cls 和 reg loss。
打个广告,欢迎大家找我内推。https://zhuanlan.zhihu.com/p/260428511
推荐阅读
ACCV 2020国际细粒度网络图像识别竞赛正式开赛!
添加极市小助手微信(ID : cvmart2),备注:姓名-学校/公司-研究方向-城市(如:小极-北大-目标检测-深圳),即可申请加入极市目标检测/图像分割/工业检测/人脸/医学影像/3D/SLAM/自动驾驶/超分辨率/姿态估计/ReID/GAN/图像增强/OCR/视频理解等技术交流群:每月大咖直播分享、真实项目需求对接、求职内推、算法竞赛、干货资讯汇总、与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企视觉开发者互动交流~
觉得有用麻烦给个在看啦~