【导读】作为计算机视觉领域的三大国际顶会之一,IEEE国际计算机视觉与模式识别会议CVPR(IEEE Conference on Computer Vision and Pattern Recognition) 每年都会吸引全球领域众多专业人士参与。CVPR 2021将在线举行, 中国科学院院士、中科院自动化所智能感知与计算研究中心主任谭铁牛将出任大会主席(General Chair,GC),上海科技大学的虞晶怡教授将任程序主席(Program Chair,PC)。今年的CVPR有效投稿多达7500篇,一共有1663篇论文被接收,接收率为27%。

为此,专知小编提前为大家整理了六篇CVPR 2021行人重识别(Person Re-identification)相关论文,这块近几年非常火,但是竞争也比较激烈,可以看看最新是如何创新,如何开展的?大家先睹为快——视频行人重识别、领域自适应行人重识别、无监督行人重识别、开放域行人重识别、

CVPR2021IC、CVPR2021VU、CVPR2021OD、CVPR2021OT、CVPR2021AR

1. Watching You: Global-guided Reciprocal Learning for Video-based Person Re-identification

作者:Xuehu Liu, Pingping Zhang, Chenyang Yu, Huchuan Lu, Xiaoyun Yang

摘要:基于视频的行人重识别(RE-ID)旨在自动在非重叠摄像机下检索同一个人的视频序列。为实现这一目标,充分利用视频中丰富的空间和时间线索是关键。现有方法通常专注于最具显著性的图像区域,因此由于图像序列中的行人类型不同,他们可能很容易错过细粒度的线索。为了解决上述问题,在本文中,我们提出了一种新的全局指导的互惠学习(Global-guided Reciprocal Learning,GRL)框架,用于基于视频的行人重识别。具体地,我们首先提出了全局指导的相关估计(Global-guided Correlation Estimation,GCE)来生成局部特征和全局特征的特征相关图,这有助于定位高相关性区域和低相关性区域,以识别同一个人。此后,在全局表示的指导下,区分特征被分解为高相关特征和低相关特征。此外,设计了一种新的时间互惠学习(Temporal Reciprocal Learning ,TRL)机制,以依次增强高相关语义信息并积累低相关亚临界线索。在三个公共基准上进行了广泛的实验。实验结果表明,与其他最新技术相比,我们的方法可以实现更好的性能。

代码:

https://github.com/flysnowtiger/GRL

网址:

https://arxiv.org/abs/2103.04337

2. Group-aware Label Transfer for Domain Adaptive Person Re-identificatio

作者:Kecheng Zheng, Wu Liu, Lingxiao He, Tao Mei, Jiebo Luo, Zheng-Jun Zha

摘要:无监督域自适应(UDA)行人重识别(ReID)的目的是使在有标记源域数据集上训练的模型适应目标域数据集,而无需任何其他标记。最成功的UDA-ReID方法将基于聚类的伪标签预测与表示学习相结合,并以交替的方式执行这两个步骤。但是,这两个步骤之间的离线交互可能使有噪声的伪标签阻碍模型的性能。在本文中,我们提出了一种组感知标签转移(GLT)算法,该算法可实现伪标签预测和表示学习的在线交互和相互促进。具体而言,标签转移算法在使用伪标签来训练数据的同时将伪标签细化为在线聚类算法。它将在线标签提炼问题视为最佳运输问题,它探索了将M个样本分配给N个伪标签的最低成本。更重要的是,我们引入了一种组感知策略来为样本分配隐式属性组ID。在线标签细化算法和群体感知策略的结合可以在线方式纠正嘈杂的伪标签,并缩小目标身份的搜索空间。Market1501→DukeMTMC (82.0%)和DukeMTMC→Market1501(92.2%)的实验结果(Rank-1准确性)证明了拟议GLT的有效性,显着缩小了行人重识别时无监督表现与有监督表现之间的差距。

代码:

https://github.com/zkcys001/UDAStrongBaseline、https://github.com/JDAI-CV/fast-reid

网址:

https://arxiv.org/abs/2103.12366

3. Intra-Inter Camera Similarity for Unsupervised Person Re-Identification

作者:Shiyu Xuan, Shiliang Zhang

摘要:大多数无监督的行人重识别(RE-ID)通过测量特征相似性来生产伪标签,而不考虑相机之间的分布差异,导致相机标签计算中的准确性降低。本文通过研究基于相机内相似性的伪标签生成来解决这一挑战。我们将样本相似度计算分解为两个阶段,即分别是相机内和相机间计算。摄像机内部计算直接利用CNN特征进行每个摄像机内的相似度计算。在不同摄像机上生成的伪标签在多分支网络中训练行人重识别模型。第二阶段将不同相机上每个样本的分类分数视为新的特征向量。这一新特征有效地缓解了摄像机之间的分配差异,并生成了更可靠的伪标签。因此,我们将分别在两个阶段训练我们的行人重识别模型,分别使用相机内和相机间的伪标签。这种简单的相机内和相机间的相似性在多个数据集上产生了令人惊讶的良好性能,例如,在Market1501数据集上达到了18.5%的准确度,比最近的无监督作品高了9 +%,可与最新的迁移学习作品相提并论但不需要利用额外的注释。

代码:

https://github.com/SY- Xuan/IICS

网址:

https://arxiv.org/abs/2103.11658

4. Joint Noise-Tolerant Learning and Meta Camera Shift Adaptation for Unsupervised Person Re-Identification

作者:Fengxiang Yang, Zhun Zhong, Zhiming Luo, Yuanzheng Cai, Yaojin Lin, Shaozi Li, Nicu Sebe

摘要:本文考虑了无监督行人重识别(re-ID)的问题,该问题旨在学习使用未标记数据的判别模型。一种流行的方法是通过聚类获得伪标签并将其用于优化模型。尽管这种方法已显示出令人信服的准确性,但它受到以下因素的阻碍:1)聚类产生的噪声标签;2)相机移位导致的特征变化。前者会导致错误的优化,从而影响模型的准确性。后者将导致将不同摄像机的类内样本分配给不同的伪标签,从而使模型对摄像机变化敏感。在本文中,我们提出了一个统一的框架来解决这两个问题。具体而言,我们提出了一种动态和对称的交叉熵损失(DSCE)来处理噪声的样本,并提出了一种可感知相机的元学习算法(MetaCam)以适应相机的偏移。DSCE可以减轻噪声样本的负面影响,并在每个聚类步骤之后适应聚类的变化。MetaCam通过将训练数据基于摄像机ID分为元训练和元测试来模拟跨摄像机约束。通过元训练和元测试的交互梯度,该模型被强制学习相机不变的特征。在三个re-ID基准上进行的大量实验证明了所提出的DSCE和MetaCam的有效性和互补性。在完全无监督的re-ID和无监督的域自适应re-ID上,我们的方法都优于最新方法。

代码:

https://github.com/FlyingRoastDuck/MetaCam_DSCE

网址:

https://arxiv.org/abs/2103.04618

5. Meta Batch-Instance Normalization for Generalizable Person Re-Identification

作者:Seokeon Choi, Taekyung Kim, Minki Jeong, Hyoungseob Park, Changick Kim

摘要:尽管有监督行人重识别(Re-ID)方法表现出令人印象深刻的性能,但是它们在看不见的域上具有较差的泛化能力。因此,可通用化的Re-ID最近引起了越来越多的关注。许多现有方法已采用实例规范化技术来减少样式变化,但是无法避免判别性信息的丢失。在本文中,我们提出了一种新颖的可推广Re-ID框架,称为Meta Batch-Instance Normalization。我们的主要思想是通过在元学习管道中预先模拟不太成功的泛化方案来泛化归一化层。为此,我们将可学习的批处理实例归一化层与元学习结合在一起,并研究由批处理和实例归一化层造成的挑战性情况。此外,我们通过元训练损失以及循环内更新的方式来使虚拟仿真多样化,以提高泛化能力。毕竟,MetaBIN框架可防止我们的模型过度适合给定的源样式,并提高了对看不见域的泛化能力,而无需额外的数据扩充或复杂的网络设计。大量的实验结果表明,我们的模型在大规模域泛化Re-ID基准测试和跨域Re-ID问题上的性能优于最新方法。

代码:

https://github.com/bismex/MetaBIN

网址:

https://arxiv.org/abs/2011.14670

成为VIP会员查看完整内容
26

相关内容

专知会员服务
37+阅读 · 2021年3月31日
专知会员服务
59+阅读 · 2021年3月17日
近期必读的5篇 CVPR 2019【图卷积网络】相关论文和代码
专知会员服务
32+阅读 · 2020年1月10日
Deep Learning in Video Multi-Object Tracking: A Survey
Arxiv
54+阅读 · 2019年7月31日
Arxiv
29+阅读 · 2019年3月13日
Arxiv
8+阅读 · 2018年4月12日
Arxiv
3+阅读 · 2012年11月20日
VIP会员
微信扫码咨询专知VIP会员