重新思考人群中的计数和定位问题:
一种完全基于点的全新框架
Rethinking Counting and Localization in Crowds: A Purely Point-Based Framework
🔽 此篇论文被收录为Oral 相比仅仅估计人群中的总人数,在人群中定位每个个体更为切合后续高阶人群分析任务的实际需求。但是,已有的基于定位的解决方法依赖于某些中间表示(如密度图或者伪目标框)作为学习目标,这不光容易引入误差,而且是一种反直觉的做法。本文提出了一种完全基于点的全新框架,可同时用于人群计数和个体定位。针对基于该全新框架的方法,我们不满足于仅仅量化图像级别的绝对计数误差,因此我们提出了一种全新的度量指标即密度归一化平均精度,来提供一个更全面且更精准的性能评价方案。此外,作为该框架一个直观解法,我们给出了一个示例模型,叫做点对点网络(P2PNet)。P2PNet忽略了所有冗余步骤,直接预测一系列人头点的集合来定位图像中的人群个体,这完全与真实人工标注保持一致。通过深入分析,我们发现实现该方法的一个核心策略是为预测候选点分配最优的学习目标,并通过基于匈牙利算法的一对一匹配策略来完成了这一关键步骤。实验证明,P2PNet不光在人群计数基准上显著超越了已有SOTA方法,还实现了非常高的定位精度。
https://www.zhuanzhi.ai/paper/2398c90f2b48015cf870014a95ef5952