论文主题: Recent Advances in Deep Learning for Object Detection

论文摘要: 目标检测是计算机视觉中的基本视觉识别问题,并且在过去的几十年中已得到广泛研究。目标检测指的是在给定图像中找到具有精确定位的特定目标,并为每个目标分配一个对应的类标签。由于基于深度学习的图像分类取得了巨大的成功,因此近年来已经积极研究了使用深度学习的对象检测技术。在本文中,我们对深度学习中视觉对象检测的最新进展进行了全面的调查。通过复习文献中最近的大量相关工作,我们系统地分析了现有的目标检测框架并将调查分为三个主要部分:(i)检测组件,(ii)学习策略(iii)应用程序和基准。在调查中,我们详细介绍了影响检测性能的各种因素,例如检测器体系结构,功能学习,建议生成,采样策略等。最后,我们讨论了一些未来的方向,以促进和刺激未来的视觉对象检测研究。与深度学习。

成为VIP会员查看完整内容
0
67

相关内容

机器学习的一个分支,它基于试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

尽管在深度学习方面取得了最近的进展,但大多数方法仍然采用类似“筒仓”的解决方案,专注于孤立地学习每个任务:为每个单独的任务训练一个单独的神经网络。然而,许多现实问题需要多模态方法,因此需要多任务模型。多任务学习(MTL)旨在利用跨任务的有用信息来提高模型的泛化能力。在这个综述中,我们提供了一个最先进的在深度神经网络的背景下MTL技术的全面观点。我们的贡献涉及以下方面。首先,我们从网络架构的角度来考虑MTL。我们包括了一个广泛的概述,并讨论了最近流行的MTL模型的优缺点。其次,我们研究了解决多任务联合学习的各种优化方法。我们总结了这些工作的定性要素,并探讨了它们的共性和差异。最后,我们在各种数据集上提供了广泛的实验评估,以检查不同方法的优缺点,包括基于架构和优化的策略。

https://arxiv.org/abs/2004.13379

概述

在过去的十年中,神经网络在许多任务中都显示了令人印象深刻的结果,例如语义分割[1],实例分割[2]和单目深度估计[3]。传统上,这些任务是单独处理的,即为每个任务训练一个单独的神经网络。然而,许多现实世界的问题本质上是多模态的。例如,一辆自动驾驶汽车应该能够检测场景中的所有物体,定位它们,了解它们是什么,估计它们的距离和轨迹,等等,以便在它的周围安全导航。同样的,一个智能广告系统应该能够在它的视点上检测到人们的存在,了解他们的性别和年龄,分析他们的外貌,跟踪他们正在看的地方,等等,从而提供个性化的内容。与此同时,人类非常擅长同时解决许多任务。生物数据处理似乎也遵循多任务处理策略: 不同的处理过程似乎共享大脑中相同的早期处理层,而不是将任务分开单独处理。上述观察结果促使研究人员开发了多任务学习(MTL)模型,即给定一个输入图像可以推断出所有所需的任务输出。

在深度学习时代之前,MTL工作试图对任务之间的共同信息进行建模,希望通过联合任务学习获得更好的泛化性能。为了实现这一点,他们在任务参数空间上放置了假设,例如:任务参数应该彼此靠近w.r.t.一些距离度量[5],[6],[16]0,[16]2,共享一个共同的概率先验[16]1,[10],[11],[12],[13],或驻留在一个低维子空间[14],[15],[16]或流形[17]。当所有任务都是相关的[5]、[14]、[18]、[19]时,这些假设可以很好地工作,但是如果在不相关的任务之间发生信息共享,则可能导致性能下降。后者是MTL中已知的问题,称为负转移。为了缓解这一问题,其中一些研究人员选择根据先前对任务的相似性或相关性的认识将任务分组。

在深度学习时代,MTL转化为能够从多任务监控信号中学习共享表示的网络设计。与单任务情况下,每个单独的任务由自己的网络单独解决相比,这种多任务网络理论上给表带来了几个优点。首先,由于它们固有的层共享,结果内存占用大大减少。其次,由于他们明确地避免重复计算共享层中的特征,每次都要计算一次,因此他们的推理速度有所提高。最重要的是,如果相关的任务能够分享互补的信息,或者互相调节,它们就有可能提高绩效。对于前者,文献已经为某些对任务提供了证据,如检测和分类[20],[21],检测和分割[2],[22],分割和深度估计[23],[24],而对于后者,最近的努力指向了那个方向[25]。这些工作导致了第一个深度多任务网络的发展,历史上分为软或硬参数共享技术。

在本文中,我们回顾了在深度神经网络范围内的MTL的最新方法。首先,我们对MTL基于架构和优化的策略进行了广泛的概述。对于每种方法,我们描述了其关键方面,讨论了与相关工作的共性和差异,并提出了可能的优点或缺点。最后,我们对所描述的方法进行了广泛的实验分析,得出了几个关键的发现。我们在下面总结了我们的一些结论,并提出了未来工作的一些可能性。

  • 首先,MTL的性能在很大程度上取决于任务字典。它的大小、任务类型、标签源等等,都影响最终的结果。因此,最好根据每个案例选择合适的架构和优化策略。尽管我们提供了具体的观察结果,说明为什么某些方法在特定设置中工作得更好,但是MTL通常可以从更深的理论理解中获益,从而在每种情况下最大化预期收益。例如,这些收益似乎取决于多种因素,例如数据量、任务关系、噪音等。未来的工作应该尝试分离和分析这些不同因素的影响。

  • 其次,当使用单一MTL模型处理多个密集预测任务时,基于解码器的架构目前在多任务性能方面提供了更多优势,与基于编码器的架构相比,其计算开销有限。如前所述,这是由于基于解码器的体系结构促进了常见的跨任务模式的对齐,这自然很适合密集的预测任务。基于编码器的架构在密集预测任务设置中仍然具有一定的优势,但其固有的层共享似乎更适合处理多个分类任务。

  • 最后,我们分析了多种任务均衡策略,并分离出对任务均衡学习最有效的要素,如降低噪声任务的权重、平衡任务梯度等。然而,许多优化方面仍然缺乏了解。与最近的研究相反,我们的分析表明避免任务之间的梯度竞争会损害性能。此外,我们的研究显示,一些任务平衡策略仍然存在不足,突出了现有方法之间的一些差异。我们希望这项工作能促进对这一问题的进一步研究。

成为VIP会员查看完整内容
0
72

题目: The Creation and Detection of Deepfakes: A Survey

摘要: 本文综述了元学习在图像分类、自然语言处理和机器人等领域的应用。与深度学习不同,元学习使用小样本数据集,并考虑进一步改进模型泛化以获得更高的预测精度。我们将元学习模型归纳为三类:黑箱适应模型、基于相似度的方法模型和元学习过程模型。最近的应用集中在将元学习与贝叶斯深度学习和强化学习相结合,以提供可行的集成问题解决方案。介绍了元学习方法的性能比较,并讨论了今后的研究方向。

成为VIP会员查看完整内容
0
43

题目: Anomalous Instance Detection in Deep Learning: A Survey

摘要:

深度学习(DL)容易受到分布不均匀和对抗性示例的影响,从而导致不正确的输出。为了使DL更具有鲁棒性,最近提出了几种方法:异常检测技术来检测(并丢弃)这些异常样本。本研究试图为基于DL的应用程序异常检测的研究提供一个结构化的、全面的概述。我们根据现有技术的基本假设和采用的方法为它们提供了一个分类。我们讨论了每个类别中的各种技术,并提供了这些方法的相对优势和劣势。我们在这次调查中的目标是提供一个更容易并且更好理解的技术,这项技术是在这方面已经做过研究的,且属于不同的类别的。最后,我们强调了在DL系统中应用异常检测技术所面临的未解决的研究挑战,并提出了一些具有重要影响的未来研究方向。

成为VIP会员查看完整内容
0
68

深度学习(DL)容易受到分布外出和对抗性样本的影响,从而导致不正确的输出。为了使DL更健壮,最近提出了几种后方法异常检测技术来检测(并丢弃)这些异常样本。本研究试图为基于DL的应用程序异常检测的研究提供一个结构化的、全面的综述。我们根据现有技术的基本假设和采用的方法为它们提供了一个分类。我们讨论了每个类别中的各种技术,并提供了这些方法的相对优势和劣势。我们在这次调查中的目标是提供一个更容易,但更好地理解技术属于不同的类别,在这方面的研究已经做了。最后,我们强调了在DL系统中应用异常检测技术所面临的未解决的研究挑战,并提出了一些具有重要影响的未来研究方向。

成为VIP会员查看完整内容
0
64

题目: A Survey of the Recent Architectures of Deep Convolutional Neural Networks

摘要:

深度卷积神经网络(CNNs)是一种特殊类型的神经网络,在计算机视觉和图像处理等领域的多项竞赛中均有出色的表现。CNN有趣的应用领域包括图像分类与分割、目标检测、视频处理、自然语言处理、语音识别等。深度卷积神经网络强大的学习能力很大程度上是由于它使用了多个特征提取阶段,可以从数据中自动学习表示。大量数据的可用性和硬件技术的改进加速了CNNs的研究,最近出现了非常有趣的深度卷积神经网络架构。事实上,人们已经探索了几个有趣的想法来促进CNNs的发展,比如使用不同的激活和丢失函数、参数优化、正则化和架构创新。然而,深度卷积神经网络的代表性能力的主要提升是通过架构上的创新实现的。特别是利用空间和信道信息、建筑的深度和宽度以及多路径信息处理的思想得到了广泛的关注。同样,使用一组层作为结构单元的想法也越来越流行。因此,本次调查的重点是最近报道的深度CNN架构的内在分类,因此,将CNN架构的最新创新分为七个不同的类别。这七个类别分别基于空间开发、深度、多路径、宽度、特征图开发、通道提升和注意力。对CNN的组成部分、当前CNN面临的挑战和应用进行了初步的了解。

成为VIP会员查看完整内容
0
37

论文题目: Salient Object Detection in the Deep Learning Era: An In-Depth Survey

论文摘要: 作为计算机视觉中的一个重要问题,图像中的显著目标检测(SOD)近年来得到了越来越多的研究。最近在超氧化物歧化酶方面的进展主要是基于深度学习的解决方案(称为深超氧化物歧化酶)。为了便于深入理解深层SODs,本文提供了一个全面的综述,涵盖了从算法分类到未解决的开放问题的各个方面。特别是,我们首先从网络结构、监控级别、学习范式和对象/实例级别检测等不同角度对深度超氧化物歧化酶算法进行了综述。在此基础上,总结了现有的SOD评价数据集和指标体系。然后,在前人工作的基础上,认真编写了一个完整的SOD方法的基准测试结果,并对对比结果进行了详细的分析。另外,通过构造一个新的具有丰富属性标注的SOD数据集,研究了不同属性下的SOD算法的性能,这在以前的研究中是很少的。我们首次在现场进一步分析了deep-SOD模型的鲁棒性和可转移性。我们还研究了输入扰动的影响,以及现有SOD数据集的通用性和硬度。最后,讨论了超氧化物歧化酶存在的问题和挑战,并指出了未来可能的研究方向。

成为VIP会员查看完整内容
Salient Object Detection in the Deep Learning Era An In-Depth Survey.pdf
0
33

论文主题: Deep Learning for Image Super-resolution: A Survey

论文摘要: 图像超分辨率(SR)是提高图像分辨率的一类重要的图像处理技术以及计算机视觉中的视频。近年来,基于深度学习的图像超分辨率研究取得了显著进展技术。在这项调查中,我们旨在介绍利用深度学习的图像超分辨率技术的最新进展系统的方法。一般来说,我们可以粗略地将现有的SR技术研究分为三大类:监督SR、非监督SR和领域特定SR。此外,我们还讨论了一些其他重要问题,如公开可用的基准数据集和性能评估指标。最后,我们通过强调几个未来来结束这项调查未来社区应进一步解决的方向和公开问题.

成为VIP会员查看完整内容
0
42

论文题目: Deep Learning in Video Multi-Object Tracking: A Survey

论文摘要: 多目标跟踪(MOT)的问题在于遵循序列中不同对象(通常是视频)的轨迹。 近年来,随着深度学习的兴起,提供解决此问题的算法得益于深度模型的表示能力。 本文对采用深度学习模型解决单摄像机视频中的MOT任务的作品进行了全面的调查。 确定了MOT算法的四个主要步骤,并对这些阶段的每个阶段如何使用深度学习进行了深入的回顾。 还提供了对三个MOT数据集上提出的作品的完整实验比较,确定了表现最好的方法之间的许多相似之处,并提出了一些可能的未来研究方向。

成为VIP会员查看完整内容
0
65

论文题目: Object Detection in 20 Years: A Survey

论文简介:
目标检测作为计算机视觉中最基本和最具挑战性的问题之一,近年来受到了极大的关注。它在过去二十年的发展可以看作是计算机视觉历史的缩影。如果我们将当今的物体检测视为在深度学习的力量下的技术美学,那么将时光倒流到20年前,我们将见证冷武器时代的智慧。鉴于目标检测技术的技术发展,本文跨越了四分之一世纪的时间(从1990年代到2019年)广泛地审查了400多篇论文。本文涵盖了许多主题,包括历史上的里程碑检测器,检测数据集,度量,检测系统的基本构建块,加速技术以及最新的检测技术水平。本文还回顾了一些重要的检测应用程序,例如行人检测,面部检测,文本检测等,并对它们的挑战以及近年来的技术改进进行了深入分析。

成为VIP会员查看完整内容
0
46

论文题目: A Survey of Deep Learning-based Object Detection

论文摘要: 目标检测是计算机视觉中最重要和最具挑战性的分支之一,它已广泛应用于人们的生活中,例如监视安全性,自动驾驶等。随着用于检测任务的深度学习网络的迅速发展,对象检测器的性能得到了极大的提高。为了深入地了解目标检测的主要发展状况,在本次调查中,我们首先分析了现有典型检测模型的方法并描述了基准数据集。之后,我们以系统的方式全面概述了各种目标检测方法,涵盖了一级和二级检测器。此外,我们列出了传统和新的应用程序。还分析了对象检测的一些代表性分支。最后,我们讨论了利用这些对象检测方法来构建有效且高效的系统的体系结构,并指出了一组发展趋势,以更好地遵循最新的算法和进一步的研究。

作者介绍: Licheng Jiao 1982年获得中国上海交通大学博士学位,并分别于1984年和1990年获得西安交通大学的博士学位。 1990年至1991年,他是西安电子科技大学雷达信号处理国家重点实验室的博士后研究员。自1992年以来,焦博士一直是中国西安电子科技大学电子工程学院的教授,目前是电子工程学院的院长,也是智能感知与图像理解重点实验室的主任。 西安电子科技大学中国教育部 1992年,焦博士获得了青年科学技术奖。 1996年,他获得了中国教育部跨世纪专家基金的资助。 从1996年起,他被选为“中国第一级人才计划”的成员。2006年,他被霍英东教育基金会授予高中青年教师奖一等奖。 从2006年起,他被选为陕西省特别贡献专家。

成为VIP会员查看完整内容
0
39
小贴士
相关VIP内容
相关资讯
从锚点到关键点:目标检测方法最新进展(2019)
GAN生成式对抗网络
13+阅读 · 2019年8月22日
从锚点到关键点,最新的目标检测方法发展趋势
计算机视觉life
17+阅读 · 2019年8月20日
最全综述 | 图像目标检测
计算机视觉life
22+阅读 · 2019年6月24日
综述 | CVPR2019目标检测方法进展
计算机视觉life
12+阅读 · 2019年4月3日
CVPR2019目标检测方法进展综述
极市平台
45+阅读 · 2019年3月20日
深度学习目标检测算法综述
AI研习社
15+阅读 · 2019年2月1日
Image Captioning 36页最新综述, 161篇参考文献
专知
74+阅读 · 2018年10月23日
斯坦福:「目标检测」深度学习全面指南
人工智能学家
7+阅读 · 2017年10月11日
深度学习目标检测模型全面综述:Faster R-CNN、R-FCN和SSD
深度学习世界
10+阅读 · 2017年9月18日
相关论文
Anomalous Instance Detection in Deep Learning: A Survey
Saikiran Bulusu,Bhavya Kailkhura,Bo Li,Pramod K. Varshney,Dawn Song
22+阅读 · 2020年3月16日
Object Detection in 20 Years: A Survey
Zhengxia Zou,Zhenwei Shi,Yuhong Guo,Jieping Ye
38+阅读 · 2019年5月13日
Jiangmiao Pang,Kai Chen,Jianping Shi,Huajun Feng,Wanli Ouyang,Dahua Lin
5+阅读 · 2019年4月4日
Deep Learning for Generic Object Detection: A Survey
Li Liu,Wanli Ouyang,Xiaogang Wang,Paul Fieguth,Jie Chen,Xinwang Liu,Matti Pietikäinen
8+阅读 · 2018年9月6日
Speeding-up Object Detection Training for Robotics with FALKON
Elisa Maiettini,Giulia Pasquale,Lorenzo Rosasco,Lorenzo Natale
6+阅读 · 2018年8月27日
Han Hu,Jiayuan Gu,Zheng Zhang,Jifeng Dai,Yichen Wei
3+阅读 · 2018年6月14日
Ankan Bansal,Karan Sikka,Gaurav Sharma,Rama Chellappa,Ajay Divakaran
6+阅读 · 2018年4月12日
Jiayuan Gu,Han Hu,Liwei Wang,Yichen Wei,Jifeng Dai
4+阅读 · 2018年3月19日
Thanh-Toan Do,Anh Nguyen,Ian Reid
3+阅读 · 2018年3月4日
Top