一文读懂目标检测模型（附论文资源）

会员服务 ·

一文读懂目标检测模型（附论文资源）

2018 年 5 月 27 日 数据派THU

来源：大数据文摘

本文共1443字，建议阅读5分钟。

本文为你详细介绍目标检测，并分享资源大礼包，为你的目标检测入门打下基础。

这是一份详细介绍了目标检测的相关经典论文、学习笔记、和代码示例的清单，想要入坑目标检测的同学可以收藏了！

后台回复“目标检测”可打包下载全部论文~

1. R-CNN

R-CNN是2014年出现的。它是将CNN用于对象检测的起源，能够基于丰富的特征层次结构进行目标精确检测和语义分割来源。

如何确定这些边界框的大小和位置呢？R-CNN网络是这样做的：在图像中提出了多个边框，并判断其中的任何一个是否对应着一个具体对象。

要想进一步了解，可以查看以下PPT和笔记：

http://www.image-net.org/challenges/LSVRC/2013/slides/r-cnn-ilsvrc2013-workshop.pdf

http://www.cs.berkeley.edu/~rbg/slides/rcnn-cvpr14-slides.pdf

http://zhangliliang.com/2014/07/23/paper-note-rcnn/

2. Fast R-CNN

2015年，R-CNN的作者Ross Girshick解决了R-CNN训练慢的问题，发明了新的网络Fast R-CNN。主要突破是引入感兴趣区域池化（ROI Pooling），以及将所有模型整合到一个网络中。

你可以通过以下GitHub链接查看模型的各种实现代码：

https://github.com/rbgirshick/fast-rcnn

https://github.com/precedenceguo/mx-rcnn

https://github.com/mahyarnajibi/fast-rcnn-torch

https://github.com/apple2373/chainer-simple-fast-rnn

https://github.com/zplizzi/tensorflow-fast-rcnn

这里还有一个利用对抗学习改进目标检测结果的应用：

http://abhinavsh.info/papers/pdfs/adversarial_object_detection.pdf

https://github.com/xiaolonw/adversarial-frcnn

3. Faster R-CNN

2015年，一个来自微软的团队（任少卿，何恺明，Ross Girshick和孙剑）发现了一种叫做“Faster R-CNN”的网络结构，基于区域建议网络进行实时目标检测，重复利用多个区域建议中相同的CNN结果，几乎把边框生成过程的运算量降为0。

你可以在这里看到关于Faster R-CNN的更多介绍，包括PPT和GitHub代码实现：

http://web.cs.hacettepe.edu.tr/~aykut/classes/spring2016/bil722/slides/w05-FasterR-CNN.pdf

Matlab

https://github.com/ShaoqingRen/faster_rcnn

Caffe

https://github.com/rbgirshick/py-faster-rcnn

MXNet

https://github.com/msracver/Deformable-ConvNets/tree/master/faster_rcnn

PyTorch

https://github.com//jwyang/faster-rcnn.pytorch

TensorFlow

https://github.com/smallcorgi/Faster-RCNN_TF

Keras

https://github.com/yhenon/keras-frcnn

C++

https://github.com/D-X-Y/caffe-faster-rcnn/tree/dev

4. SPP-Net（空间金字塔池化网络）

SPP-Net是基于空间金字塔池化后的深度学习网络进行视觉识别。它和R-CNN的区别是，输入不需要放缩到指定大小，同时增加了一个空间金字塔池化层，每幅图片只需要提取一次特征。

相关内容

R-CNN

关注 26

R-CNN的全称是Region-CNN，它可以说是是第一个成功将深度学习应用到目标检测上的算法。传统的目标检测方法大多以图像识别为基础。一般可以在图片上使用穷举法选出所所有物体可能出现的区域框，对这些区域框提取特征并使用图像识别方法分类，得到所有分类成功的区域后,通过非极大值抑制(Non-maximumsuppression)输出结果。

【西安交大】深度学习目标检测方法综述

专知会员服务

164+阅读 · 2020年4月21日

【干货书】深度学习计算机视觉，332页pdf，手把手教你Python学习CV

专知会员服务

202+阅读 · 2020年3月31日

图像分类技巧集，17页ppt《Bag of Tricks for Image Classification》

专知会员服务

96+阅读 · 2020年3月12日

【ICCV2019教程】物体检测的R-CNN通用框架，The Generalized R-CNN Framework for Object Detection，180页ppt，Facebook 人工智能研究院Ross Girshick大神

专知会员服务

25+阅读 · 2019年11月16日