CVPR 2022 | 针对目标检测的重点与全局知识蒸馏(FGD)

会员服务 ·

CVPR 2022 | 针对目标检测的重点与全局知识蒸馏(FGD)

2022 年 3 月 10 日 极市平台

↑ 点击蓝字关注极市平台

作者丨美索不达米亚平原@知乎（已授权）

来源丨https://zhuanlan.zhihu.com/p/477707304

编辑丨极市平台

极市导读

本文介绍一篇CVPR2022关于目标检测的知识蒸馏工作: Focal and Global Knowledge Distillation for Detectors，只需要30行代码就可以在anchor-base, anchor-free的单阶段、两阶段各种检测器上稳定涨点，现在代码已经开源 >>加入极市CV技术交流群，走在计算机视觉的最前沿

本文介绍我们CVPR2022关于目标检测的知识蒸馏工作: Focal and Global Knowledge Distillation for Detectors，只需要30行代码就可以在anchor-base, anchor-free的单阶段、两阶段各种检测器上稳定涨点，现在代码已经开源，欢迎大家试用～

文章链接：https://arxiv.org/abs/2111.11837

代码链接：https://github.com/yzd-v/FGD

一、针对问题

1. 目标检测中前背景不平衡问题

前背景的不平衡对于目标检测而言是一个重要的问题，这个问题同样影响着知识蒸馏。

知识蒸馏旨在使学生学习教师的知识，以获得相似的输出从而提升性能。为了探索学生与教师在特征层面的差异，我们首先对二者的特征图进行了可视化。可以看到在空间与通道注意力上，教师与学生均存在较大的差异。其中在空间注意力上，二者在前景中的差异较大，在背景中的差异较小，这会给蒸馏中的学生带来不同的学习难度。

为了进一步探索前背景对于知识蒸馏的影响，我们分离出前背景进行了蒸馏实验，全图一起蒸馏会导致蒸馏性能的下降，将前景与背景分开学生能够获得更好的表现。

针对学生与教师注意力的差异，前景与背景的差异，我们提出了重点蒸馏Focal Distillation：分离前背景，并利用教师的空间与通道注意力作为权重，指导学生进行知识蒸馏，计算重点蒸馏损失。

2.全局信息的丢失

如前所述，Focal Distillation将前景与背景分开进行蒸馏，割断了前背景的联系，缺乏了特征的全局信息的蒸馏。为此，我们提出了全局蒸馏Global Distillation：利用GcBlock分别提取学生与教师的全局信息，并进行全局蒸馏损失的计算。

二、整体框架

FGD仅需要获取学生与教师的特征图，便可完成重点蒸馏损失与全局蒸馏损失的计算，可以很方便的应用到各种类型的检测器上。

三、实验结果

我们对anchor-based与anchor-free的单阶段与二阶段检测器进行了实验，在COCO2017上学生检测器均获得了大幅的AP和AR提升。

我们采用了具有更强的检测器对学生进行蒸馏，发现当使用更强的模型作为教师进行蒸馏时，FGD为模型能带来更大的性能的提升。例如RetinaNet-R50在ResNet-101和ResNeXt-101的老师蒸馏下，分别可达到39.7和40.7的mAP。

对于使用FGD蒸馏完成后的学生模型，我们再次进行了注意力的可视化。可以看到，经过FGD训练后的学生，空间注意力和通道注意力的分布与教师都非常相似，这表明学生通过蒸馏学到了教师的知识并获得了更好的特征，由此实现了性能的提升。

四、更多蒸馏设置

我们已将代码开源：https://github.com/yzd-v/FGD
代码基于MMDetection实现，易于复现，且已添加更多的教师与学生蒸馏设置，相关结果也在代码中给出，欢迎大家使用。

公众号后台回复“数据集”获取50+深度学习数据集下载～

△点击卡片关注极市平台，获取最新CV干货

极市干货

数据集资源汇总： 10个开源工业检测数据集汇总｜ 21个深度学习开源数据集分类汇总｜开源真实场景图像检测数据集汇总

算法trick ：目标检测比赛中的tricks集锦｜从39个kaggle竞赛中总结出来的图像分割的Tips和Tricks

技术综述：一文弄懂各种loss function ｜工业图像异常检测最新研究总结（2019-2020）

# CV技术社群邀请函 #

△长按添加极市小助手

添加极市小助手微信（ID : cvmart4）

备注：姓名-学校/公司-研究方向-城市（如：小极-北大-目标检测-深圳）

即可申请加入极市目标检测/图像分割/工业检测/人脸/医学影像/3D/SLAM/自动驾驶/超分辨率/姿态估计/ReID/GAN/图像增强/OCR/视频理解等技术交流群

每月大咖直播分享、真实项目需求对接、求职内推、算法竞赛、干货资讯汇总、与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企视觉开发者互动交流~

觉得有用麻烦给个在看啦~

登录查看更多

相关内容

FGD

关注 0

【TNNLS2022】SGCPNet: 面向实时语义分割的空间细节引导上下文传播网络

专知会员服务

24+阅读 · 2022年4月8日

【AAAI2022】锚框排序知识蒸馏的目标检测

专知会员服务

26+阅读 · 2022年2月10日

【AAAI2022】基于交互式transformer和暹罗网络的视频目标分割

专知会员服务

24+阅读 · 2022年2月6日

【AAAI2022】基于秩模仿和预测引导特征模仿的目标检测知识蒸馏

专知会员服务

24+阅读 · 2021年12月12日

【NeurIPS2021】用于物体检测的实例条件知识蒸馏

专知会员服务

20+阅读 · 2021年11月10日

（CVPR2021）基于结构保持的弱监督目标定位

专知会员服务

21+阅读 · 2021年5月1日

【CVPR2021】用于目标检测的通用实例蒸馏

专知会员服务

24+阅读 · 2021年3月22日

【CVPR2021】面向视频动作分割的高效网络结构搜索

专知会员服务

14+阅读 · 2021年3月14日

【CVPR2021】坐标注意力的高效移动网络设计

专知会员服务

23+阅读 · 2021年3月9日

【综述】面向视觉智能的知识蒸馏和Student-Teacher方法，附37页pdf下载

专知会员服务

68+阅读 · 2020年4月16日

CVPR 2022｜解耦知识蒸馏！旷视提出DKD：让Hinton在7年前提出的方法重回SOTA行列！

CVer

0+阅读 · 2022年4月12日

CVPR 2022｜Self-Attention和CNN的优雅集成！清华大学等提出ACmix，性能速度全面提升！

极市平台

1+阅读 · 2022年4月11日

CVPR 2022｜解耦知识蒸馏，让Hinton在7年前提出的方法重回SOTA行列

PaperWeekly

0+阅读 · 2022年4月11日

CVPR 2022 | 清华开源ACmix：自注意力和CNN的融合！性能速度全面提升！

CVer

0+阅读 · 2022年4月10日

直播预告 | AAAI 2022论文解读：基于锚框排序的目标检测知识蒸馏

PaperWeekly

0+阅读 · 2022年3月23日

CVPR 2022 | 清华&字节提出FGD：针对目标检测的重点与全局知识蒸馏

CVer

0+阅读 · 2022年3月9日

CVPR 2022｜南开程明明团队和天大提出LD：目标检测的定位蒸馏

极市平台

1+阅读 · 2022年3月3日

IJCAI 2021 | 中科院计算所：自监督增强的知识蒸馏方法

PaperWeekly

1+阅读 · 2022年2月22日

【AAAI2022】锚框排序知识蒸馏的目标检测

专知

0+阅读 · 2022年2月10日

做目标检测，这6篇就够了：CVPR 2020目标检测论文盘点

机器之心

23+阅读 · 2020年7月27日

面向在线检索的医学影像多特征降维方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

云端融合计算环境下QoS敏感的任务调度机制研究

国家自然科学基金

7+阅读 · 2015年12月31日

融合稀疏表示与深度学习的图像分类技术研究

国家自然科学基金

7+阅读 · 2013年12月31日

基于相似性的图像特征逆向学习算法与应用

国家自然科学基金

0+阅读 · 2013年12月31日

视觉关注区域保持的医学影像重建问题研究

国家自然科学基金

1+阅读 · 2013年12月31日

网络多媒体流QoS特征稀疏表示及柔性跨域映射方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

视觉注意模型及其在显著目标检测中的应用研究

国家自然科学基金

3+阅读 · 2013年12月31日

面向图像检索的互补哈希表构造方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于蚁群算法面向对象的遥感图像分类方法研究

国家自然科学基金

2+阅读 · 2013年12月31日

声纳图像匹配与融合的关键问题研究

国家自然科学基金

1+阅读 · 2012年12月31日

Simple and Effective Unsupervised Speech Synthesis

Arxiv

2+阅读 · 2022年4月20日

Temporally Efficient Vision Transformer for Video Instance Segmentation

Arxiv

0+阅读 · 2022年4月18日

CenterNet++ for Object Detection

Arxiv

0+阅读 · 2022年4月18日

Dense Learning based Semi-Supervised Object Detection

Arxiv

9+阅读 · 2022年4月15日

Transformers in Medical Image Analysis: A Review

Arxiv

40+阅读 · 2022年2月24日

Deep Learning for Weakly-Supervised Object Detection and Object Localization: A Survey

Arxiv

16+阅读 · 2021年5月26日

UP-DETR: Unsupervised Pre-training for Object Detection with Transformers

Arxiv

19+阅读 · 2020年11月18日

Object Detection in 20 Years: A Survey

Arxiv

48+阅读 · 2019年5月13日

Detect-to-Retrieve: Efficient Regional Aggregation for Image Search

Arxiv

15+阅读 · 2018年12月4日

Distance-based Self-Attention Network for Natural Language Inference

Arxiv

10+阅读 · 2017年12月6日

VIP会员