目标检测一直以来都是计算机视觉领域的研究热点之一,其任务是返回给定图像中的单个或多个特定目 标的类别与矩形包围框坐标.随着神经网络研究的飞速进展,R-CNN 检测器的诞生标志着目标检测正式进入深度学习时代,速度和精度相较于传统算法均有了极大的提升.但是,目标检测的尺度问题对于深度学习算法而言也始终是 一个难题,即检测器对于尺度极大或极小目标的检测精度会显著下降,因此,近年来有不少学者在研究如何才能更好 地实现多尺度目标检测.虽然已有一系列的综述文章从算法流程、网络结构、训练方式和数据集等方面对基于深度 学习的目标检测算法进行了总结与分析,但对多尺度目标检测的归纳和整理却鲜有人涉足.因此,首先对基于深度学 习的目标检测的两个主要算法流派的奠基过程进行了回顾,包括以 R-CNN 系列为代表的两阶段算法和以 YOLO、 SSD 为代表的一阶段算法;然后,以多尺度目标检测的实现为核心,重点诠释了图像金字塔、构建网络内的特征金字 塔等典型策略;最后,对多尺度目标检测的现状进行总结,并针对未来的研究方向进行展望。
http://www.jos.org.cn/jos/ch/reader/create_pdf.aspx?file_no=6166&journal_id=jos