CVPR2019 | 行人检测新思路：高级语义特征检测取得精度新突破

2019 年 4 月 10 日 极市平台

加入极市专业CV交流群，与6000+来自腾讯，华为，百度，北大，清华，中科院等名企名校视觉开发者互动交流！更有机会与李开复老师等大牛群内互动！

同时提供每月大咖直播分享、真实项目需求对接、干货资讯汇总，行业技术交流。点击文末“阅读原文”立刻申请入群~

CVPR2019 accepted list ID已经放出，极市已将目前收集到的公开论文总结到github上（目前已收集395篇），后续会不断更新，欢迎关注，也欢迎大家提交自己的论文：

https://github.com/extreme-assistant/cvpr2019

本文授权转载自我爱计算机视觉，请勿二次转载

今天跟大家分享一篇新出的CVPR 2019论文《High-level Semantic Feature Detection:A New Perspective for Pedestrian Detection》,作者将行人检测问题转化为高级语义特征检测的问题，刷新了行人检测精度的新高度！而且作者称代码将开源。

论文作者信息：

作者分别来自国防科技大学、中科院自动化所、阿联酋起源人工智能研究院和地平线机器人公司。

算法思想

特征检测是计算机视觉中常用算法，比如我们所熟知的边缘检测、Blob检测，简单点说就是检测图像中的感兴趣部分。在传统的计算机视觉视觉中，这往往被认为是low-level的操作。

随着深度学习技术的发展，一般认为深度学习提取的特征具有高级语义特性。

作者认为行人检测中行人的中心点（x，y坐标）和尺度（宽高）是一种高级语义特征，行人检测完全可以转化为这些语义特征的检测。

如下图所示：

输入图像经过卷积网络，然后分成Center Heatmap计算和Scale Map 计算，得到的中心点坐标和宽高大小，即检测出了行人。

看起来很简单，但却是很有效！

下图是更详细的网络架构图：

该算法最主要的两部分为特征提取模块和Detection Head模块。

特征提取模块对4个Stage的特征图进行了串联，以增强特征的多尺度表达能力。

Detection Head模块，由256个3*3卷积和分支开来的两个1*1卷积组成，然后分别成为最终的Center heatmap 和Scale Map。

将现有标注好的行人检测数据集转化为中心点和尺度标注的方法是显而易见的，如下图（图中作者使用log（高度）作为行人尺度）：

在Point Prediction 这一端，作者实际上尝试了中心点、顶部顶点、底部顶点等三种方式，实验结果如下图上半部分，发现使用中心点效果最好，而且是远好于另外两者。

同样在Scale Prediction这一端，作者尝试了预测高度、宽度和二者都预测。发现只预测高度的效果最好（此时设置固定宽高比0.41）。

实验结果

下面三张图是在Caltech数据集上的实验结果，该文提出的算法CSP均取得了最高的精度。

下图为在CityPersons数据集上的实验结果，CSP同样取得了最好的结果。

另外，值得一提的是，该算法不仅仅适用于行人检测！在作者的Github工程主页上放出了使用该文算法在人脸检测数据集WiderFace上的实验结果，在验证集和测试集上均取得了最高精度或者媲美最高精度的结果。

如下图所示：（请点击大图查看）

读完此文，CV君在想，人脸和行人的宽高比相对变化较小，该文提出的算法取得了很不错的结果。那么对于通用目标检测，宽高比变化比较大，该算法结果会如何呢？希望有进一步实验结果出来。

希望该文对你有帮助！

论文地址：

https://arxiv.org/abs/1904.02948v1

代码地址：

https://github.com/liuwei16/CSP

*延伸阅读

ECCV 2018 | Bi-box行人检测：‘行人遮挡’为几何？

CVPR2019| 04-08更新19篇论文及代码（1篇oral、目标检测、行人检测、视频超分辨等）

点击左下角“阅读原文”，即可申请加入极市目标跟踪、目标检测、工业检测、人脸方向、视觉竞赛等技术交流群，更有每月大咖直播分享、真实项目需求对接、干货资讯汇总，行业技术交流，一起来让思想之光照的更远吧~

觉得有用麻烦给个好看啦~

登录查看更多

相关内容

行人检测

关注 5

行人检测( Pedestrian Detection)是利用计算机视觉技术判断图像或者视频序列中是否存在行人并给予精确定位。该技术可与行人跟踪，行人重识别等技术结合，应用于人工智能系统、车辆辅助驾驶系统、智能机器人、智能视频监控、人体行为分析、智能交通等领域。

【CVPR2020】通过获取高质量的关键点对来提升目标检测性能

专知会员服务

44+阅读 · 2020年6月30日

深度学习目标检测方法及其主流框架综述

专知会员服务

148+阅读 · 2020年6月26日

【文献综述】深度学习目标检测方法及其主流框架综述

专知会员服务

119+阅读 · 2020年6月26日

【CMU】基于图神经网络的联合检测与多目标跟踪

专知会员服务

58+阅读 · 2020年6月24日

轻量级神经网络架构综述

专知会员服务

97+阅读 · 2020年4月29日

CVPR2020 | 商汤-港中文等提出PV-RCNN：3D目标检测新网络

专知会员服务

45+阅读 · 2020年4月17日

【CVPR2020-中科院计算所】弱监督语义分割的自监督等价注意力机制，Self-supervised Equivariant Attention Mechanism for Weakly Supervised Semantic Segmentation

专知会员服务

76+阅读 · 2020年4月10日

【CVPR2020-港科大-腾讯】基于注意力机制及多关系检测器的小样本物体检测

专知会员服务

39+阅读 · 2020年4月6日

CVPR 2020 | MetaFuse：用于人体姿态估计的预训练信息融合模型

专知会员服务

25+阅读 · 2020年4月2日

基于深度网络的自监督视觉特征学习综述，附24页论文下载

专知会员服务

66+阅读 · 2020年1月15日

BASNet，一种能关注边缘的显著性检测算法

极市平台

15+阅读 · 2019年7月19日

重磅！商汤开源Grid R-CNN Plus：相比Grid RCNN，速度更快，精度更高

极市平台

8+阅读 · 2019年6月21日

【学界】CVPR2019 | 快、好、实现简单并且开源的显著性检测方法

GAN生成式对抗网络

7+阅读 · 2019年5月25日

CVPR2019 | 快、好、实现简单并且开源的显著性检测方法

极市平台

21+阅读 · 2019年5月23日

CVPR 2019 | 行人检测新思路：高级语义特征检测取得精度新突破

计算机视觉life

32+阅读 · 2019年4月23日

CVPR 2019 | CSP行人检测：无锚点框的检测新思路

机器之心

3+阅读 · 2019年4月13日

综述 | CVPR2019目标检测方法进展

计算机视觉life

15+阅读 · 2019年4月3日

CVPR2019无人驾驶相关论文

极市平台

21+阅读 · 2019年3月20日

CVPR2019目标检测方法进展综述

极市平台

45+阅读 · 2019年3月20日

CVPR2019 | FSAF：来自CMU的Single-Shot目标检测算法

极市平台

41+阅读 · 2019年3月8日

Mesh R-CNN

Arxiv

4+阅读 · 2019年6月6日

3D Hand Shape and Pose Estimation from a Single RGB Image

Arxiv

17+阅读 · 2019年3月3日

Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression

Arxiv

6+阅读 · 2019年2月25日

Panoptic Feature Pyramid Networks

Arxiv

3+阅读 · 2019年1月8日

R-VQA: Learning Visual Relation Facts with Semantic Attention for Visual Question Answering

Arxiv

7+阅读 · 2018年5月24日

Attention-Aware Compositional Network for Person Re-identification

Arxiv

8+阅读 · 2018年5月16日

Convolutional CRFs for Semantic Segmentation

Arxiv

8+阅读 · 2018年5月15日

Fast Feature Extraction with CNNs with Pooling Layers

Arxiv

5+阅读 · 2018年5月8日

Mask R-CNN

Arxiv

7+阅读 · 2018年1月24日

Additive Margin Softmax for Face Verification

Arxiv

11+阅读 · 2018年1月18日

VIP会员