Although YOLOv2 approach is extremely fast on object detection; its backbone network has the low ability on feature extraction and fails to make full use of multi-scale local region features, which restricts the improvement of object detection accuracy. Therefore, this paper proposed a DC-SPP-YOLO (Dense Connection and Spatial Pyramid Pooling Based YOLO) approach for ameliorating the object detection accuracy of YOLOv2. Specifically, the dense connection of convolution layers is employed in the backbone network of YOLOv2 to strengthen the feature extraction and alleviate the vanishing-gradient problem. Moreover, an improved spatial pyramid pooling is introduced to pool and concatenate the multi-scale local region features, so that the network can learn the object features more comprehensively. The DC-SPP-YOLO model is established and trained based on a new loss function composed of mean square error and cross entropy, and the object detection is realized. Experiments demonstrate that the mAP (mean Average Precision) of DC-SPP-YOLO proposed on PASCAL VOC datasets and UA-DETRAC datasets is higher than that of YOLOv2; the object detection accuracy of DC-SPP-YOLO is superior to YOLOv2 by strengthening feature extraction and using the multi-scale local region features.


翻译:虽然 YOLOv2 方法在物体探测方面极为迅速;其主干网在特征提取方面能力低,未能充分利用多规模的局部区域特征,从而限制了提高物体探测准确性,因此,本文件提议采用DC-SPP-YOLO(Nense Connect and Space Pyramid Pooling Based YOLO) 方法来改善YOLOv2 的物体探测精确性,具体来说,在YOLOv2 的主干网中采用了凝聚层的密集连接,以加强特征提取并缓解消失的渐变问题。此外,还引进了改进的空间金字塔集合,以汇集和凝结多规模的局部局部区域特征,使网络能够更全面地了解物体探测特性。 DC-SPP-YOL-YOLO模型是根据由中位差差差差差差差和交叉星体探测而成的新损失函数建立和培训的,具体来说,在PPP-YOL VOC 上提议的DC-SP-YOL-OL 目标的 mAP(平均精度) 和UA-DA-TRA-TRAS-S-S-S-S-S-S-S-S-S-S-S-S-S-S-Servicleg-S-S-regleg-S-S-S-S-S-S-S-S-S-S-S-S-S-S-S-S-S-S-S-laglegleglegleglegleglegleglegleglection-S-S-S-S-traction-traction-S-S-S-traction-traction-S-S-S-S-S-S-S-S-S-S-S-S-S-S-S-S-S-S-S-S-tra disal-regal-laction-ladaldal-ladal-ladisal-lad-lad-ladal-lad-lad-lad-lad-ladisal-ladis-lad-lad-lad-lad-lad-lad-ladal-lad-lad-

3
下载
关闭预览

相关内容

Pyramid is a small, fast, down-to-earth Python web application development framework.
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
YOLO简史
计算机视觉life
27+阅读 · 2019年3月7日
哇~这么Deep且又轻量的Network,实时目标检测
计算机视觉战队
7+阅读 · 2018年8月15日
Faster R-CNN
数据挖掘入门与实战
4+阅读 · 2018年4月20日
Fast R-CNN
数据挖掘入门与实战
3+阅读 · 2018年4月20日
ResNet, AlexNet, VGG, Inception:各种卷积网络架构的理解
全球人工智能
19+阅读 · 2017年12月17日
【推荐】ResNet, AlexNet, VGG, Inception:各种卷积网络架构的理解
机器学习研究会
20+阅读 · 2017年12月17日
从R-CNN到Mask R-CNN!
全球人工智能
17+阅读 · 2017年11月13日
【推荐】YOLO实时目标检测(6fps)
机器学习研究会
20+阅读 · 2017年11月5日
Clustered Object Detection in Aerial Images
Arxiv
5+阅读 · 2019年8月27日
Arxiv
11+阅读 · 2019年4月15日
Arxiv
12+阅读 · 2019年1月24日
Arxiv
6+阅读 · 2018年7月9日
Arxiv
5+阅读 · 2018年5月16日
Arxiv
5+阅读 · 2018年4月17日
Arxiv
4+阅读 · 2016年12月29日
VIP会员
相关VIP内容
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
相关资讯
YOLO简史
计算机视觉life
27+阅读 · 2019年3月7日
哇~这么Deep且又轻量的Network,实时目标检测
计算机视觉战队
7+阅读 · 2018年8月15日
Faster R-CNN
数据挖掘入门与实战
4+阅读 · 2018年4月20日
Fast R-CNN
数据挖掘入门与实战
3+阅读 · 2018年4月20日
ResNet, AlexNet, VGG, Inception:各种卷积网络架构的理解
全球人工智能
19+阅读 · 2017年12月17日
【推荐】ResNet, AlexNet, VGG, Inception:各种卷积网络架构的理解
机器学习研究会
20+阅读 · 2017年12月17日
从R-CNN到Mask R-CNN!
全球人工智能
17+阅读 · 2017年11月13日
【推荐】YOLO实时目标检测(6fps)
机器学习研究会
20+阅读 · 2017年11月5日
相关论文
Clustered Object Detection in Aerial Images
Arxiv
5+阅读 · 2019年8月27日
Arxiv
11+阅读 · 2019年4月15日
Arxiv
12+阅读 · 2019年1月24日
Arxiv
6+阅读 · 2018年7月9日
Arxiv
5+阅读 · 2018年5月16日
Arxiv
5+阅读 · 2018年4月17日
Arxiv
4+阅读 · 2016年12月29日
Top
微信扫码咨询专知VIP会员