目标检测是计算机视觉领域中最基础且最重要的任务之一,是行为识别与人机交互等高层视觉任务的基础.随着深度学习技术的发展,目标检测模型的准确率和效率得到了大幅提升.与传统的目标检测算法相比,深度学习利用强大的分层特征提取和学习能力使得目标检测算法性能取得了突破性进展.与此同时,大规模数据集的出现及显卡计算能力的极大提高也促成了这一领域的蓬勃发展.本文对基于深度学习的目标检测现有研究成果进行了详细综述.首先回顾传统目标检测算法及其存在的问题,其次总结深度学习下区域提案和单阶段基准检测模型.之后从特征图、上下文模型、边框优化、区域提案、类别不平衡处理、训练策略、弱监督学习和无监督学习这八个角度分类总结当前主流的目标检测模型,最后对目标检测算法中待解决的问题和未来研究方向做出展望.

目标检测是计算机视觉领域中最基础且最具挑战性的任务之一,其包含物体分类和定位[1].与此同时,目标检测作为图像理解和计算机视觉的基石,它为实例分割、图像捕获、视频跟踪等任务提供了强有力的特征分类基础,因此探索高效实时的目标检测模型是近年来研究的热点.

传统的目标检测方法包括预处理、区域提案、特征提取、特征选择、特征分类和后处理六个阶段.大多数检测模型关注于物体特征的提取和区域分类算法的选择,在PASCAL VOC数据集[2]上的检测准确率以较小步幅增长.Deformable Part‑based Model(DPM)[3] 算法三次在PASCAL VOC目标检测竞赛上获得冠军,是传统目标检测方法的巅峰之作.然而在2008年至2012年期间,目标检测模型在PASCAL VOC数据集上的检测准确率逐渐达到瓶颈.传统方法的弊端也展现出来,主要包括:(1)算法在区域提案生成阶段产生大量冗余的候选框且正负样本失衡;(2)特征提取器如HOG[4]、SIFT[5]等未能充分捕捉图像的高级语义特征和上下文内容;(3)传统检测算法分阶段进行,整体缺乏一种全局优化策略.

最近,深度学习经历了一段前所未有的发展热浪,AlexNet[6]在图像分类任务中的优异表现让人们重新燃起研究卷积神经网络的兴趣.相比于传统算法,深度学习利用自动学习数据中的特征表达和学习能力加速了目标检测的发展,在检测速度和准确率方面均有显著提升.正是由于目标检测技术的快速发展,如今其已广泛应用于智能视频监控、机器人视觉、基于内容的图像检索、自动驾驶[7,8]等领域.

本文首先介绍目标检测数据集及其评估指标,之后总结基于深度学习的目标检测基准模型,再从特征图、上下文模型、边框优化、区域提案、类别不平衡处理、训练策略、弱监督学习和无监督学习这八个方面归纳总结当前主流的目标检测模型,最后讨论目标检测技术的未来发展趋势与总结全文.

成为VIP会员查看完整内容
0
28

相关内容

计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

视频目标检测是为了解决每一个视频帧中出现的目标如何进行定位和识别的问题。相比于图像目标检测,视频具有高冗余度的特性,其中包含了大量的时空局部信息。随着深度卷积神经网络在静态图像目标检测领域的迅速普及,在性能上相较于传统方法显示出了非常大的优越性,并逐步在基于视频的目标检测任务上也发挥了应有的作用。但现有的视频目标检测算法仍然面临改进与优化主流目标检测算法的性能、保持视频序列的时空一致性、检测模型轻量化等关键技术的挑战。针对上述问题和挑战,在调研大量文献的基础上系统地对基于深度学习的视频目标检测算法进行了总结。从基于光流、检测等基础方法对这些算法进行了分类,从骨干网络、算法结构、数据集等角度细致探究了这些方法。结合在ImageNet VID等数据集上的实验结果,分析了该领域具有代表性算法的性能优势和劣势,以及算法之间存在的联系。对视频目标检测中待解决的问题与未来研究方向进行了阐述和展望。视频目标检测已成为众多的计算机视觉领域学者追逐的热点,将来会有更加高效、精度更高的算法被相继提出,其发展方向也会越来越好。

http://fcst.ceaj.org/CN/abstract/abstract2872.shtml

成为VIP会员查看完整内容
0
5

随着卷积神经网络(Convolutional Neural Network,CNN)的不断发展,目标检测作为计算机视觉中最基本的技术,已取得了令人瞩目的进展。介绍了强监督目标检测算法对数据集标注精度要求高的现状。对基于弱监督学习的目标检测算法进行研究,按照不同的特征处理方法将该算法归为四类,并分析比较了各类算法的优缺点。通过实验比

较了各类基于弱监督学习的目标检测算法的检测精度,并将其与主流的强监督目标检测算法进行了比较。展望了基于弱监督学习的目标检测算法未来的研究热点。

http://cea.ceaj.org/CN/abstract/abstract39825.shtml

成为VIP会员查看完整内容
0
10

目标检测一直以来都是计算机视觉领域的研究热点之一,其任务是返回给定图像中的单个或多个特定目 标的类别与矩形包围框坐标.随着神经网络研究的飞速进展,R-CNN 检测器的诞生标志着目标检测正式进入深度学习时代,速度和精度相较于传统算法均有了极大的提升.但是,目标检测的尺度问题对于深度学习算法而言也始终是 一个难题,即检测器对于尺度极大或极小目标的检测精度会显著下降,因此,近年来有不少学者在研究如何才能更好 地实现多尺度目标检测.虽然已有一系列的综述文章从算法流程、网络结构、训练方式和数据集等方面对基于深度 学习的目标检测算法进行了总结与分析,但对多尺度目标检测的归纳和整理却鲜有人涉足.因此,首先对基于深度学 习的目标检测的两个主要算法流派的奠基过程进行了回顾,包括以 R-CNN 系列为代表的两阶段算法和以 YOLO、 SSD 为代表的一阶段算法;然后,以多尺度目标检测的实现为核心,重点诠释了图像金字塔、构建网络内的特征金字 塔等典型策略;最后,对多尺度目标检测的现状进行总结,并针对未来的研究方向进行展望。

http://www.jos.org.cn/jos/ch/reader/create_pdf.aspx?file_no=6166&journal_id=jos

成为VIP会员查看完整内容
0
26

目标检测的任务是从图像中精确且高效地识别、定位出大量预定义类别的物体实例。随着深度学习的广泛应用,目标检测的精确度和效率都得到了较大提升,但基于深度学习的目标检测仍面临改进与优化主流目标检测算法的性能、提高小目标物体检测精度、实现多类别物体检测、轻量化检测模型等关键技术的挑战。针对上述挑战,本文在广泛文献调研的基础上,从双阶段、单阶段目标检测算法的改进与结合的角度分析了改进与优化主流目标检测算法的方法,从骨干网络、增加视觉感受野、特征融合、级联卷积神经网络和模型的训练方式的角度分析了提升小目标检测精度的方法,从训练方式和网络结构的角度分析了用于多类别物体检测的方法,从网络结构的角度分析了用于轻量化检测模型的方法。此外,对目标检测的通用数据集进行了详细介绍,从4个方面对该领域代表性算法的性能表现进行了对比分析,对目标检测中待解决的问题与未来研究方向做出预测和展望。目标检测研究是计算机视觉和模式识别中备受青睐的热点,仍然有更多高精度和高效的算法相继提出,未来将朝着更多的研究方向发展。

成为VIP会员查看完整内容
0
113

简介: 目标检测作为机器视觉中重要任务之一,是人工智能体系中一个具有重要研究价值的技术分支. 对于卷积神经网络框架、 anchor-based模型和anchor-free模型三个主流的目标检测模型进行梳理. 首先,综述了主流卷积神 经网络框架的网络结构、优缺点以及相关的改进方法;其次从one-stage和two-stage两个分支对anchor-based类模型进行深入分析, 总结了不同目标检测方法的研究进展; 从早期探索、关键点和密集预测三部分分析anchor-free类模型. 最后对该领域的未来发展趋势进行了思考与展望.

成为VIP会员查看完整内容
深度学习目标检测方法及其主流框架综述.pdf
0
70

目标检测的任务是从图像中精确且高效地识别、定位出大量预定义类别的物体实例。随着深度学习的广泛应用,目标检测的精确度和效率都得到了较大提升,但基于深度学习的目标检测仍面临改进与优化主流目标检测算法的性能、提高小目标物体检测精度、实现多类别物体检测、轻量化检测模型等关键技术的挑战。针对上述挑战,本文在广泛文献调研的基础上,从双阶段、单阶段目标检测算法的改进与结合的角度分析了改进与优化主流目标检测算法的方法,从骨干网络、增加视觉感受野、特征融合、级联卷积神经网络和模型的训练方式的角度分析了提升小目标检测精度的方法,从训练方式和网络结构的角度分析了用于多类别物体检测的方法,从网络结构的角度分析了用于轻量化检测模型的方法。此外,对目标检测的通用数据集进行了详细介绍,从4个方面对该领域代表性算法的性能表现进行了对比分析,对目标检测中待解决的问题与未来研究方向做出预测和展望。目标检测研究是计算机视觉和模式识别中备受青睐的热点,仍然有更多高精度和高效的算法相继提出,未来将朝着更多的研究方向发展。

成为VIP会员查看完整内容
0
100
小贴士
相关VIP内容
专知会员服务
5+阅读 · 9月13日
专知会员服务
10+阅读 · 8月24日
专知会员服务
15+阅读 · 6月18日
专知会员服务
26+阅读 · 5月11日
专知会员服务
36+阅读 · 4月29日
专知会员服务
24+阅读 · 4月14日
专知会员服务
113+阅读 · 2020年8月1日
【文献综述】深度学习目标检测方法及其主流框架综述
专知会员服务
70+阅读 · 2020年6月26日
专知会员服务
93+阅读 · 2020年4月25日
专知会员服务
100+阅读 · 2020年4月21日
相关资讯
最全综述 | 图像目标检测
计算机视觉life
21+阅读 · 2019年6月24日
基于深度学习的视频目标检测综述
CVer
5+阅读 · 2019年6月9日
综述 | 近5年基于深度学习的目标检测算法
计算机视觉life
18+阅读 · 2019年4月18日
计算机视觉方向简介 | 目标检测最新进展总结与展望
计算机视觉life
6+阅读 · 2018年10月28日
干货 | 基于深度学习的目标检测算法综述
AI科技评论
14+阅读 · 2018年9月1日
博客 | 基于深度学习的目标检测算法综述(二)
干货 | 基于深度学习的目标检测算法综述(二)
AI科技评论
12+阅读 · 2018年8月20日
综述:深度学习时代的目标检测算法
极市平台
25+阅读 · 2018年3月17日
深度学习时代的目标检测算法综述
AI前线
6+阅读 · 2017年9月22日
相关论文
One-Class Classification: A Survey
Pramuditha Perera,Poojan Oza,Vishal M. Patel
6+阅读 · 1月8日
Few-shot Scene-adaptive Anomaly Detection
Yiwei Lu,Frank Yu,Mahesh Kumar Krishna Reddy,Yang Wang
8+阅读 · 2020年7月15日
SlowFast Networks for Video Recognition
Christoph Feichtenhofer,Haoqi Fan,Jitendra Malik,Kaiming He
4+阅读 · 2019年4月18日
Applying Faster R-CNN for Object Detection on Malaria Images
Jane Hung,Deepali Ravel,Stefanie C. P. Lopes,Gabriel Rangel,Odailton Amaral Nery,Benoit Malleret,Francois Nosten,Marcus V. G. Lacerda,Marcelo U. Ferreira,Laurent Rénia,Manoj T. Duraisingh,Fabio T. M. Costa,Matthias Marti,Anne E. Carpenter
4+阅读 · 2019年3月11日
Scale-Aware Trident Networks for Object Detection
Yanghao Li,Yuntao Chen,Naiyan Wang,Zhaoxiang Zhang
4+阅读 · 2019年1月7日
Fast and Accurate 3D Medical Image Segmentation with Data-swapping Method
Haruki Imai,Samuel Matzek,Tung D. Le,Yasushi Negishi,Kiyokuni Kawachiya
4+阅读 · 2018年12月19日
Jian Liu,Naveed Akhtar,Ajmal Mian
3+阅读 · 2018年5月1日
Alexis Conneau,Guillaume Lample,Marc'Aurelio Ranzato,Ludovic Denoyer,Hervé Jégou
7+阅读 · 2018年1月30日
Kaiming He,Georgia Gkioxari,Piotr Dollár,Ross Girshick
7+阅读 · 2018年1月24日
Top