重新思考人群中的计数和定位问题:

一种完全基于点的全新框架

Rethinking Counting and Localization in Crowds: A Purely Point-Based Framework

🔽 此篇论文被收录为Oral 相比仅仅估计人群中的总人数,在人群中定位每个个体更为切合后续高阶人群分析任务的实际需求。但是,已有的基于定位的解决方法依赖于某些中间表示(如密度图或者伪目标框)作为学习目标,这不光容易引入误差,而且是一种反直觉的做法。本文提出了一种完全基于点的全新框架,可同时用于人群计数和个体定位。针对基于该全新框架的方法,我们不满足于仅仅量化图像级别的绝对计数误差,因此我们提出了一种全新的度量指标即密度归一化平均精度,来提供一个更全面且更精准的性能评价方案。此外,作为该框架一个直观解法,我们给出了一个示例模型,叫做点对点网络(P2PNet)。P2PNet忽略了所有冗余步骤,直接预测一系列人头点的集合来定位图像中的人群个体,这完全与真实人工标注保持一致。通过深入分析,我们发现实现该方法的一个核心策略是为预测候选点分配最优的学习目标,并通过基于匈牙利算法的一对一匹配策略来完成了这一关键步骤。实验证明,P2PNet不光在人群计数基准上显著超越了已有SOTA方法,还实现了非常高的定位精度。

https://www.zhuanzhi.ai/paper/2398c90f2b48015cf870014a95ef5952

成为VIP会员查看完整内容
11

相关内容

专知会员服务
22+阅读 · 2021年9月23日
专知会员服务
23+阅读 · 2021年9月16日
专知会员服务
14+阅读 · 2021年8月2日
专知会员服务
15+阅读 · 2021年6月6日
专知会员服务
38+阅读 · 2021年5月16日
【AAAI2021】基于内容迁移的无监督领域自适应语义分割
专知会员服务
17+阅读 · 2020年12月25日
论文解读 | PASS3D:精确且快速的3D点云语义分割
进展 | 密集人群分布检测与计数
计算机视觉life
8+阅读 · 2019年9月17日
CVPR 2019 | CSP行人检测:无锚点框的检测新思路
机器之心
3+阅读 · 2019年4月13日
ETP:精确时序动作定位
极市平台
13+阅读 · 2018年5月25日
Arxiv
12+阅读 · 2020年12月10日
Deformable Style Transfer
Arxiv
14+阅读 · 2020年3月24日
DPOD: Dense 6D Pose Object Detector in RGB images
Arxiv
5+阅读 · 2019年2月28日
Arxiv
3+阅读 · 2018年3月21日
Arxiv
5+阅读 · 2016年10月24日
VIP会员
相关VIP内容
专知会员服务
22+阅读 · 2021年9月23日
专知会员服务
23+阅读 · 2021年9月16日
专知会员服务
14+阅读 · 2021年8月2日
专知会员服务
15+阅读 · 2021年6月6日
专知会员服务
38+阅读 · 2021年5月16日
【AAAI2021】基于内容迁移的无监督领域自适应语义分割
专知会员服务
17+阅读 · 2020年12月25日
相关论文
微信扫码咨询专知VIP会员