论文链接:
https://www.zhuanzhi.ai/paper/1be5e8813d7c800455a5177e6005f10a
代码链接(已开源):https://github.com/MCG-NJU/AdaMixer
本文介绍南京大学研究团队在目标检测的新工作AdaMixer。传统的目标检测模型采用密集扫描的模式识别图像中目标的位置和尺度。近期,基于查询的对象检测器通过使用一组可学习的查询解码图像特征打破了这一常规思路。然而,这种范式仍然存在收敛速度慢、性能有限以及骨干网络和解码器之间额外模块设计复杂性的问题。为解决这一问题,本文作者通过增强检测器的自适应建模能力来加速query-based检测器(类DETR检测器和Sparse RCNN)的收敛和最终的表现效果,并且使模型架构维持在一个相对简单的结构上。本文提出了一系列技术来增强query-based检测器的decoder解码部分,包括3D特征空间采样和动态MLP-Mixer检测头,免于引入设计繁重、计算量大的各种注意力编码器(attentional encoder),或者特征金字塔式的多尺度交互网络,在保持效果的同时,进一步简化了基于query的检测器的结构。
专知便捷查看
便捷下载,请关注专知公众号(点击上方蓝色专知关注)
后台回复“AMXE” 就可以获取《CVPR 2022 Oral | 南京大学AdaMixer:基于快速收敛查询的目标检测器》专知下载链接