超越YOLOv4!PP-YOLO:更快更好的目标检测网络

2020 年 7 月 24 日 CVer

点击上方“CVer”,选择加"星标"置顶

重磅干货,第一时间送达

前言


Tricks大法好!PP-YOLO可达45.2% mAP,速度高达72.9 FPS!FPS和mAP均超越YOLOv4,FPS也远超过EfficientDet!


Amusi 认为YOLO系列让大家钟情的原因之一并不是超高的mAP指标,而且其又快又好的效果,其让 mAP 和 FPS达到很好的权衡。记得18年YOLOv3一出,这幅图风靡一时:



吐槽一句,17年入坑检测的时候,那时候很多人默认one-stage的优势之一是速度,特别是YOLO和SSD为首的实时检测器(>30 FPS)。如今看看19年和20年的论文,很多都不对比速度了,只管mAP怼多高,这个本身没有任何问题,但很多网络的速度数据都不给了,我想没有人不在乎这个指标吧。


今年4月,YOLOv4一出,引起相当大的热议,比如其是否称得上"接棒者";后来还有所谓"YOLOv5"的开源项目出现。其实很高兴看到YOLO社区这么活跃,这不超越YOLOv4的网络就来了:PP-YOLO。


PP-YOLO



先上结果图,感受一下PP-YOLO的性能。越靠右上角,性能越给力!很明显PP-YOLO在mAP和FPS的权衡要优于YOLOv4和EfficientDet。


作者团队:百度

论文:https://arxiv.org/abs/2007.12099

代码(刚刚开源):

https://github.com/PaddlePaddle/PaddleDetection


PP-YOLO的命名规则很简单,因为作者团队是百度,而PaddlePaddle就是百度开源的深度学习框架,所以其全称是PaddlePaddle-YOLO,简称即PP-YOLO。


先定性:


  • PP-YOLO的目的是实现一种可以在实际应用场景中直接应用的具有相对平衡的有效性和效率的目标检测器,而不是提出一种新颖的检测模型

  • PP-YOLO:一种基于YOLOv3的新型目标检测器。

  • PP-YOLO:尝试结合各种几乎不增加模型参数和FLOPs数量的技巧,以实现在确保速度几乎不变的情况下尽可能提高检测器精度的目标。


请你反复阅读上面几句话,你应该就知道不要带着"硬啃创新点"的眼光看待这篇检测论文。这篇论文是一篇经验+实战技巧的检测论文,对落地、实际上手应用或者打比赛友好度较高。


在介绍PP-YOLO之前,还要说一下:PP-YOLO并没有在backbone、数据增广和NAS方面做更多的实验,所以如果你想基于PP-YOLO来改进,那么其空间蛮大的。



PP-YOLO网络如上图,部分主要模块如下所述:


  • Backbone:ResNet50-vd-dcn

  • Detection Neck:FPN

  • Detection Head:YOLOv3


重磅技巧(tricks)来了:


  • Larger Batch Size:196

  • EMA 

  • DropBlock 

  • IoU Loss

  • IoU Aware

  • Grid Sensitive 

  • Matrix NMS

  • CoordConv

  • SPP

  • Better Pretrain Model


上面模块和技巧有点多,那么怎么组合才最有效,分别涨点多少呢?看下图便知详情!



最终PP-YOLO在COCO test-dev 2017上的性能表现如下:

45.2% mAP,72.9 FPS!这数据很舒服了!



侃侃


其实YOLOv4 在不同框架下实现,性能也是不同的,据我了解的YOLOv4 PyTorch版本可以达到48.5% mAP。但PP-YOLO的出发点是相当好的,特别对于目标检测入坑小白,所以我推荐大家阅读YOLOv4和PP-YOLO,里面的实验做的都相当棒!


再说一下:PP-YOLO并没有在backbone、数据增广和NAS方面做更多的实验,所以如果你想基于PP-YOLO来改进,那么其空间蛮大的。


百度团队给出了 PP-YOLO的github链接,我查了一下相关代码,现已开源!

https://github.com/PaddlePaddle/PaddleDetection


下载


在CVer后台回复PP-YOLO,即可下载本论文!

后台回复CVPR2020,即可下载CVPR2020 2020代码开源的论文合集

后台回复:ECCV2020,即可下载ECCV 2020代码开源的论文合集


重磅!CVer-目标检测 微信交流群已成立


扫码添加CVer助手,可申请加入CVer-目标检测 微信交流群,目前已汇集4100人!涵盖2D/3D目标检测、小目标检测、遥感目标检测等。互相交流,一起进步!


同时也可申请加入CVer大群和细分方向技术群,细分方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch和TensorFlow等群。


一定要备注:研究方向+地点+学校/公司+昵称(如目标检测+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群

▲长按加群


▲长按关注我们

整理不易,请给CVer点赞和在看

登录查看更多
0

相关内容

Yolo算法,其全称是You Only Look Once: Unified, Real-Time Object Detection,You Only Look Once说的是只需要一次CNN运算,Unified指的是这是一个统一的框架,提供end-to-end的预测,而Real-Time体现是Yolo算法速度快。
深度学习目标检测方法综述
专知会员服务
273+阅读 · 2020年8月1日
深度学习目标检测方法及其主流框架综述
专知会员服务
147+阅读 · 2020年6月26日
【文献综述】深度学习目标检测方法及其主流框架综述
专知会员服务
118+阅读 · 2020年6月26日
专知会员服务
31+阅读 · 2020年4月24日
专知会员服务
160+阅读 · 2020年4月21日
CVPR2020 | 商汤-港中文等提出PV-RCNN:3D目标检测新网络
专知会员服务
43+阅读 · 2020年4月17日
【新加坡国立大学】深度学习时代数据库:挑战与机会
专知会员服务
33+阅读 · 2020年3月6日
密歇根大学《20年目标检测综述》
专知会员服务
97+阅读 · 2019年10月13日
47.4mAP!最强Anchor-free目标检测网络:SAPD
极市平台
13+阅读 · 2019年12月16日
大盘点 | 性能最强的目标检测算法
极市平台
9+阅读 · 2019年7月8日
CenterNet:目标即点(代码已开源)
极市平台
25+阅读 · 2019年5月24日
目标检测:Anchor-Free时代
极市平台
42+阅读 · 2019年4月17日
三分支网络——目前目标检测性能最佳网络框架
人工智能前沿讲习班
6+阅读 · 2019年3月5日
SSD多盒实时目标检测教程
论智
13+阅读 · 2018年4月5日
EfficientDet: Scalable and Efficient Object Detection
Arxiv
6+阅读 · 2019年11月20日
Arxiv
5+阅读 · 2019年4月8日
Scale-Aware Trident Networks for Object Detection
Arxiv
4+阅读 · 2019年1月7日
Arxiv
6+阅读 · 2018年7月9日
Arxiv
7+阅读 · 2018年1月24日
Arxiv
4+阅读 · 2017年7月25日
VIP会员
相关VIP内容
深度学习目标检测方法综述
专知会员服务
273+阅读 · 2020年8月1日
深度学习目标检测方法及其主流框架综述
专知会员服务
147+阅读 · 2020年6月26日
【文献综述】深度学习目标检测方法及其主流框架综述
专知会员服务
118+阅读 · 2020年6月26日
专知会员服务
31+阅读 · 2020年4月24日
专知会员服务
160+阅读 · 2020年4月21日
CVPR2020 | 商汤-港中文等提出PV-RCNN:3D目标检测新网络
专知会员服务
43+阅读 · 2020年4月17日
【新加坡国立大学】深度学习时代数据库:挑战与机会
专知会员服务
33+阅读 · 2020年3月6日
密歇根大学《20年目标检测综述》
专知会员服务
97+阅读 · 2019年10月13日
相关资讯
47.4mAP!最强Anchor-free目标检测网络:SAPD
极市平台
13+阅读 · 2019年12月16日
大盘点 | 性能最强的目标检测算法
极市平台
9+阅读 · 2019年7月8日
CenterNet:目标即点(代码已开源)
极市平台
25+阅读 · 2019年5月24日
目标检测:Anchor-Free时代
极市平台
42+阅读 · 2019年4月17日
三分支网络——目前目标检测性能最佳网络框架
人工智能前沿讲习班
6+阅读 · 2019年3月5日
SSD多盒实时目标检测教程
论智
13+阅读 · 2018年4月5日
相关论文
Top
微信扫码咨询专知VIP会员