CVPR 2019 | 行人检测新思路：高级语义特征检测取得精度新突破 - 专知

会员服务 ·

0

CVPR 2019 | 行人检测新思路：高级语义特征检测取得精度新突破

2019 年 4 月 23 日 计算机视觉life

点“计算机视觉life”关注，置顶更快接收消息！

本文授权自我爱计算机视觉

今天跟大家分享一篇昨天新出的CVPR 2019论文《High-level Semantic Feature Detection:A New Perspective for Pedestrian Detection》,作者将行人检测问题转化为高级语义特征检测的问题，刷新了行人检测精度的新高度！而且作者称代码将开源。

论文作者信息：

作者分别来自国防科技大学、中科院自动化所、阿联酋起源人工智能研究院和地平线机器人公司。

算法思想

特征检测是计算机视觉中常用算法，比如我们所熟知的边缘检测、Blob检测，简单点说就是检测图像中的感兴趣部分。在传统的计算机视觉视觉中，这往往被认为是low-level的操作。

随着深度学习技术的发展，一般认为深度学习提取的特征具有高级语义特性。

作者认为行人检测中行人的中心点（x，y坐标）和尺度（宽高）是一种高级语义特征，行人检测完全可以转化为这些语义特征的检测。

如下图所示：

输入图像经过卷积网络，然后分成Center Heatmap计算和Scale Map 计算，得到的中心点坐标和宽高大小，即检测出了行人。

看起来很简单，但却是很有效！

下图是更详细的网络架构图：

该算法最主要的两部分为特征提取模块和Detection Head模块。

特征提取模块对4个Stage的特征图进行了串联，以增强特征的多尺度表达能力。

Detection Head模块，由256个3*3卷积和分支开来的两个1*1卷积组成，然后分别成为最终的Center heatmap 和Scale Map。

将现有标注好的行人检测数据集转化为中心点和尺度标注的方法是显而易见的，如下图（图中作者使用log（高度）作为行人尺度）：

在Point Prediction 这一端，作者实际上尝试了中心点、顶部顶点、底部顶点等三种方式，实验结果如下图上半部分，发现使用中心点效果最好，而且是远好于另外两者。

同样在Scale Prediction这一端，作者尝试了预测高度、宽度和二者都预测。发现只预测高度的效果最好（此时设置固定宽高比0.41）。

实验结果

下面三张图是在Caltech数据集上的实验结果，该文提出的算法CSP均取得了最高的精度。

下图为在CityPersons数据集上的实验结果，CSP同样取得了最好的结果。

另外，值得一提的是，该算法不仅仅适用于行人检测！在作者的Github工程主页上放出了使用该文算法在人脸检测数据集WiderFace上的实验结果，在验证集和测试集上均取得了最高精度或者媲美最高精度的结果。

如下图所示：（请点击大图查看）

论文地址：

https://arxiv.org/abs/1904.02948v1

代码地址：

https://github.com/liuwei16/CSP

推荐阅读

CVPR2019 | Decoders 对于语义分割的重要性

CVPR2019 | R-MVSNet: 一个高精度高效率的三维重建网络

CVPR2019 | SiamMask：视频跟踪最高精度

CVPR 2019 | 用异构卷积训练深度CNN：提升效率而不损准确度

CVPR 2019 | 人大 ML 研究组提出新的视频测谎算法

CVPR2019 | 医学影像：MIT 利用学习图像变换进行数据增强

CVPR 2019 | GeoNet：基于测地距离的点云分析深度网络

CVPR2019 | 中科大&微软开源：姿态估计新模型HRNet

CVPR 2019 | 京东提出 ScratchDet：随机初始化训练SSD目标检测器

CVPR 2019 | 微软亚研院提出用于语义分割的结构化知识蒸馏

CVPR2019 | 6D目标姿态估计，李飞飞等提出DenseFusion

综述 | CVPR2019目标检测方法进展

最近三年开源「语义SLAM/分割/建模」方案介绍

超详细干货 | 三维语义分割概述及总结

欢迎关注公众号：计算机视觉life，一起探索计算机视觉新世界~ 关注：计算机视觉life，一起探索计算机视觉新世界~

觉得有用，给个好看啦~

登录查看更多

32

相关内容

行人检测

行人检测( Pedestrian Detection)是利用计算机视觉技术判断图像或者视频序列中是否存在行人并给予精确定位。该技术可与行人跟踪，行人重识别等技术结合，应用于人工智能系统、车辆辅助驾驶系统、智能机器人、智能视频监控、人体行为分析、智能交通等领域。

【CVPR2020】通过获取高质量的关键点对来提升目标检测性能

【CVPR2020】通过获取高质量的关键点对来提升目标检测性能

专知会员服务

44+阅读 · 2020年6月30日

深度学习目标检测方法及其主流框架综述

深度学习目标检测方法及其主流框架综述

专知会员服务

148+阅读 · 2020年6月26日

CVPR2020 | 商汤-港中文等提出PV-RCNN：3D目标检测新网络

CVPR2020 | 商汤-港中文等提出PV-RCNN：3D目标检测新网络

专知会员服务

45+阅读 · 2020年4月17日

【CVPR2020-港科大-腾讯】基于注意力机制及多关系检测器的小样本物体检测

【CVPR2020-港科大-腾讯】基于注意力机制及多关系检测器的小样本物体检测

专知会员服务

39+阅读 · 2020年4月6日

CVPR 2020 | MetaFuse：用于人体姿态估计的预训练信息融合模型

CVPR 2020 | MetaFuse：用于人体姿态估计的预训练信息融合模型

专知会员服务

25+阅读 · 2020年4月2日

【CVPR2020-中科院-腾讯优图】基于注意力卷积二叉神经树的细粒度视觉分类

【CVPR2020-中科院-腾讯优图】基于注意力卷积二叉神经树的细粒度视觉分类

专知会员服务

26+阅读 · 2020年3月29日

【IJCV2020】通过迭代亲密学习实现弱监督语义分割

专知会员服务

42+阅读 · 2020年2月20日

基于深度网络的自监督视觉特征学习综述，附24页论文下载

基于深度网络的自监督视觉特征学习综述，附24页论文下载

专知会员服务

66+阅读 · 2020年1月15日

【何恺明团队新论文】PointRend:将图像分割视作渲染问题，性能显著提升！

【何恺明团队新论文】PointRend:将图像分割视作渲染问题，性能显著提升！

专知会员服务

28+阅读 · 2019年12月19日

【CCF优秀博士学位论文奖-2019初评】基于深度学习的场景分割技术研究，中科院计算所张蕊

【CCF优秀博士学位论文奖-2019初评】基于深度学习的场景分割技术研究，中科院计算所张蕊

专知会员服务

32+阅读 · 2019年11月8日

BASNet，一种能关注边缘的显著性检测算法

BASNet，一种能关注边缘的显著性检测算法

极市平台

15+阅读 · 2019年7月19日

重磅！商汤开源Grid R-CNN Plus：相比Grid RCNN，速度更快，精度更高

重磅！商汤开源Grid R-CNN Plus：相比Grid RCNN，速度更快，精度更高

极市平台

8+阅读 · 2019年6月21日

【学界】CVPR2019 | 快、好、实现简单并且开源的显著性检测方法

【学界】CVPR2019 | 快、好、实现简单并且开源的显著性检测方法

GAN生成式对抗网络

7+阅读 · 2019年5月25日

CVPR2019 | 快、好、实现简单并且开源的显著性检测方法

CVPR2019 | 快、好、实现简单并且开源的显著性检测方法

极市平台

21+阅读 · 2019年5月23日

CVPR 2019 | CSP行人检测：无锚点框的检测新思路

CVPR 2019 | CSP行人检测：无锚点框的检测新思路

机器之心

3+阅读 · 2019年4月13日

CVPR2019 | 行人检测新思路：高级语义特征检测取得精度新突破

CVPR2019 | 行人检测新思路：高级语义特征检测取得精度新突破

极市平台

7+阅读 · 2019年4月10日

综述 | CVPR2019目标检测方法进展

综述 | CVPR2019目标检测方法进展

计算机视觉life

15+阅读 · 2019年4月3日

Grid R-CNN解读：商汤最新目标检测算法，定位精度超越Faster R-CNN

Grid R-CNN解读：商汤最新目标检测算法，定位精度超越Faster R-CNN

AI100

5+阅读 · 2018年12月22日

ECCV 2018 | Bi-box行人检测：‘行人遮挡’为几何？

ECCV 2018 | Bi-box行人检测：‘行人遮挡’为几何？

极市平台

13+阅读 · 2018年9月30日

专栏 | CVPR 2017论文解读：特征金字塔网络FPN

专栏 | CVPR 2017论文解读：特征金字塔网络FPN

机器之心

8+阅读 · 2017年7月25日

3D Hand Shape and Pose Estimation from a Single RGB Image

3D Hand Shape and Pose Estimation from a Single RGB Image

Arxiv

17+阅读 · 2019年3月3日

Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression

Arxiv

6+阅读 · 2019年2月25日

Boundary-weighted Domain Adaptive Neural Network for Prostate MR Image Segmentation

Arxiv

9+阅读 · 2019年2月21日

3D Backbone Network for 3D Object Detection

Arxiv

12+阅读 · 2019年1月24日

Panoptic Feature Pyramid Networks

Panoptic Feature Pyramid Networks

Arxiv

3+阅读 · 2019年1月8日

SFA: Small Faces Attention Face Detector

Arxiv

4+阅读 · 2018年12月20日

InverseRenderNet: Learning single image inverse rendering

InverseRenderNet: Learning single image inverse rendering

Arxiv

3+阅读 · 2018年11月29日

Attention-Aware Compositional Network for Person Re-identification

Arxiv

8+阅读 · 2018年5月16日

Convolutional CRFs for Semantic Segmentation

Arxiv

8+阅读 · 2018年5月15日

Arxiv

7+阅读 · 2018年1月24日

VIP会员

相关主题

计算机视觉

阿联酋起源人工智能研究院

地平线机器人

相关VIP内容

【CVPR2020】通过获取高质量的关键点对来提升目标检测性能

【CVPR2020】通过获取高质量的关键点对来提升目标检测性能

专知会员服务

44+阅读 · 2020年6月30日

深度学习目标检测方法及其主流框架综述

深度学习目标检测方法及其主流框架综述

专知会员服务

148+阅读 · 2020年6月26日

CVPR2020 | 商汤-港中文等提出PV-RCNN：3D目标检测新网络

CVPR2020 | 商汤-港中文等提出PV-RCNN：3D目标检测新网络

专知会员服务

45+阅读 · 2020年4月17日

【CVPR2020-港科大-腾讯】基于注意力机制及多关系检测器的小样本物体检测

【CVPR2020-港科大-腾讯】基于注意力机制及多关系检测器的小样本物体检测

专知会员服务

39+阅读 · 2020年4月6日

CVPR 2020 | MetaFuse：用于人体姿态估计的预训练信息融合模型

CVPR 2020 | MetaFuse：用于人体姿态估计的预训练信息融合模型

专知会员服务

25+阅读 · 2020年4月2日

【CVPR2020-中科院-腾讯优图】基于注意力卷积二叉神经树的细粒度视觉分类

【CVPR2020-中科院-腾讯优图】基于注意力卷积二叉神经树的细粒度视觉分类

专知会员服务

26+阅读 · 2020年3月29日

【IJCV2020】通过迭代亲密学习实现弱监督语义分割

专知会员服务

42+阅读 · 2020年2月20日

基于深度网络的自监督视觉特征学习综述，附24页论文下载

基于深度网络的自监督视觉特征学习综述，附24页论文下载

专知会员服务

66+阅读 · 2020年1月15日

【何恺明团队新论文】PointRend:将图像分割视作渲染问题，性能显著提升！

【何恺明团队新论文】PointRend:将图像分割视作渲染问题，性能显著提升！

专知会员服务

28+阅读 · 2019年12月19日

【CCF优秀博士学位论文奖-2019初评】基于深度学习的场景分割技术研究，中科院计算所张蕊

【CCF优秀博士学位论文奖-2019初评】基于深度学习的场景分割技术研究，中科院计算所张蕊

专知会员服务

32+阅读 · 2019年11月8日

热门VIP内容

开通专知VIP会员享更多权益服务

《多智能体不确定环境追逃博弈研究》216页

美智库最新发布《解放军"人机编组协同作战"发展路径：理论与实践》53页

现代战争"杀伤区"理论：空间尺度与结构特征、控制手段与毁伤机制、生存策略与战线转移

《俄军无人机创新技术或已在乌克兰达成"战场空中封锁"作战效果》最新18页报告

相关资讯

BASNet，一种能关注边缘的显著性检测算法

BASNet，一种能关注边缘的显著性检测算法

极市平台

15+阅读 · 2019年7月19日

重磅！商汤开源Grid R-CNN Plus：相比Grid RCNN，速度更快，精度更高

重磅！商汤开源Grid R-CNN Plus：相比Grid RCNN，速度更快，精度更高

极市平台

8+阅读 · 2019年6月21日

【学界】CVPR2019 | 快、好、实现简单并且开源的显著性检测方法

【学界】CVPR2019 | 快、好、实现简单并且开源的显著性检测方法

GAN生成式对抗网络

7+阅读 · 2019年5月25日

CVPR2019 | 快、好、实现简单并且开源的显著性检测方法

CVPR2019 | 快、好、实现简单并且开源的显著性检测方法

极市平台

21+阅读 · 2019年5月23日

CVPR 2019 | CSP行人检测：无锚点框的检测新思路

CVPR 2019 | CSP行人检测：无锚点框的检测新思路

机器之心

3+阅读 · 2019年4月13日

CVPR2019 | 行人检测新思路：高级语义特征检测取得精度新突破

CVPR2019 | 行人检测新思路：高级语义特征检测取得精度新突破

极市平台

7+阅读 · 2019年4月10日

综述 | CVPR2019目标检测方法进展

综述 | CVPR2019目标检测方法进展

计算机视觉life

15+阅读 · 2019年4月3日

Grid R-CNN解读：商汤最新目标检测算法，定位精度超越Faster R-CNN

Grid R-CNN解读：商汤最新目标检测算法，定位精度超越Faster R-CNN

AI100

5+阅读 · 2018年12月22日

ECCV 2018 | Bi-box行人检测：‘行人遮挡’为几何？

ECCV 2018 | Bi-box行人检测：‘行人遮挡’为几何？

极市平台

13+阅读 · 2018年9月30日

专栏 | CVPR 2017论文解读：特征金字塔网络FPN

专栏 | CVPR 2017论文解读：特征金字塔网络FPN

机器之心

8+阅读 · 2017年7月25日

相关论文

3D Hand Shape and Pose Estimation from a Single RGB Image

3D Hand Shape and Pose Estimation from a Single RGB Image

Arxiv

17+阅读 · 2019年3月3日

Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression

Arxiv

6+阅读 · 2019年2月25日

Boundary-weighted Domain Adaptive Neural Network for Prostate MR Image Segmentation

Arxiv

9+阅读 · 2019年2月21日

3D Backbone Network for 3D Object Detection

Arxiv

12+阅读 · 2019年1月24日

Panoptic Feature Pyramid Networks

Panoptic Feature Pyramid Networks

Arxiv

3+阅读 · 2019年1月8日

SFA: Small Faces Attention Face Detector

Arxiv

4+阅读 · 2018年12月20日

InverseRenderNet: Learning single image inverse rendering

InverseRenderNet: Learning single image inverse rendering

Arxiv

3+阅读 · 2018年11月29日

Attention-Aware Compositional Network for Person Re-identification

Arxiv

8+阅读 · 2018年5月16日

Convolutional CRFs for Semantic Segmentation

Arxiv

8+阅读 · 2018年5月15日

Arxiv

7+阅读 · 2018年1月24日

大家都在搜

软件无线电

无人机集群

国防科技创新

久别重逢话双塔

再见，TD-SCDMA！

微信扫码咨询专知VIP会员