The better accuracy and efficiency trade-off has been a challenging problem in object detection. In this work, we are dedicated to studying key optimizations and neural network architecture choices for object detection to improve accuracy and efficiency. We investigate the applicability of the anchor-free strategy on lightweight object detection models. We enhance the backbone structure and design the lightweight structure of the neck, which improves the feature extraction ability of the network. We improve label assignment strategy and loss function to make training more stable and efficient. Through these optimizations, we create a new family of real-time object detectors, named PP-PicoDet, which achieves superior performance on object detection for mobile devices. Our models achieve better trade-offs between accuracy and latency compared to other popular models. PicoDet-S with only 0.99M parameters achieves 30.6% mAP, which is an absolute 4.8% improvement in mAP while reducing mobile CPU inference latency by 55% compared to YOLOX-Nano, and is an absolute 7.1% improvement in mAP compared to NanoDet. It reaches 123 FPS (150 FPS using Paddle Lite) on mobile ARM CPU when the input size is 320. PicoDet-L with only 3.3M parameters achieves 40.9% mAP, which is an absolute 3.7% improvement in mAP and 44% faster than YOLOv5s. As shown in Figure 1, our models far outperform the state-of-the-art results for lightweight object detection. Code and pre-trained models are available at https://github.com/PaddlePaddle/PaddleDetection.


翻译:更准确、更高效的交换是物体探测方面一个具有挑战性的问题。 在这项工作中, 我们致力于研究关键优化和神经网络结构选择, 以便进行物体探测, 以提高精确度和效率。 我们调查轻量物体探测模型是否适用无锚战略; 我们增强主干结构, 设计颈部轻量结构, 提高网络的特征提取能力。 我们改进标签分配战略和损失功能, 使培训更加稳定和高效。 通过这些优化, 我们创建了一套名为 PP- PicoDet 的实时物体探测器新系列, 在移动装置的物体探测方面达到优异性性性能。 我们的模型比 NanoDevision (150 FPS- Lant) 的精确度和延度之间, 与其他流行模型相比, 我们的精确度和延缓性战略, 我们的移动 CPPS- S(150 FPS-PS) 的精确度和延缓度之间的折价值比 NanoDespal- mPO 1, 的移动数据显示为3.AMA 的绝对值。

0
下载
关闭预览

相关内容

专知会员服务
17+阅读 · 2021年4月24日
专知会员服务
109+阅读 · 2020年3月12日
Relation Networks for Object Detection 论文笔记
统计学习与视觉计算组
16+阅读 · 2018年4月18日
Soft-NMS – Improving Object Detection With One Line of Code
统计学习与视觉计算组
6+阅读 · 2018年3月30日
【推荐】(TensorFlow)SSD实时手部检测与追踪(附代码)
机器学习研究会
11+阅读 · 2017年12月5日
【推荐】YOLO实时目标检测(6fps)
机器学习研究会
20+阅读 · 2017年11月5日
【推荐】树莓派/OpenCV/dlib人脸定位/瞌睡检测
机器学习研究会
9+阅读 · 2017年10月24日
Arxiv
8+阅读 · 2021年4月21日
EfficientDet: Scalable and Efficient Object Detection
Arxiv
6+阅读 · 2019年11月20日
Arxiv
12+阅读 · 2019年4月9日
Arxiv
5+阅读 · 2018年5月16日
Arxiv
5+阅读 · 2018年4月17日
VIP会员
相关VIP内容
专知会员服务
17+阅读 · 2021年4月24日
专知会员服务
109+阅读 · 2020年3月12日
Top
微信扫码咨询专知VIP会员