MOTRv2：使用预训练对象检测器引导端到端多目标跟踪 (MOTRv2: Bootstrapping End-to-End Multi-Object Tracking by Pretrained Object Detectors) - 专知论文

会员服务 ·

0

对象检测 · 端到端 · 检测器 · 多目标跟踪 · 多目标 ·

2023 年 4 月 19 日

MOTRv2: Bootstrapping End-to-End Multi-Object Tracking by Pretrained Object Detectors

翻译：MOTRv2：使用预训练对象检测器引导端到端多目标跟踪

Yuang Zhang,Tiancai Wang,Xiangyu Zhang

from arxiv, Accepted by CVPR 2023

In this paper, we propose MOTRv2, a simple yet effective pipeline to bootstrap end-to-end multi-object tracking with a pretrained object detector. Existing end-to-end methods, MOTR and TrackFormer are inferior to their tracking-by-detection counterparts mainly due to their poor detection performance. We aim to improve MOTR by elegantly incorporating an extra object detector. We first adopt the anchor formulation of queries and then use an extra object detector to generate proposals as anchors, providing detection prior to MOTR. The simple modification greatly eases the conflict between joint learning detection and association tasks in MOTR. MOTRv2 keeps the query propogation feature and scales well on large-scale benchmarks. MOTRv2 ranks the 1st place (73.4% HOTA on DanceTrack) in the 1st Multiple People Tracking in Group Dance Challenge. Moreover, MOTRv2 reaches state-of-the-art performance on the BDD100K dataset. We hope this simple and effective pipeline can provide some new insights to the end-to-end MOT community. Code is available at \url{https://github.com/megvii-research/MOTRv2}.

翻译：在本文中，我们提出了MOTRv2，一种简单而有效的管道，通过预先训练的对象检测器引导端到端多目标跟踪。现有的端到端方法MOTR和TrackFormer由于其较差的检测性能而不如跟踪-检测方法。我们的目标是通过优雅地纳入额外的对象检测器来改进MOTR。我们首先采用查询的固定方式，然后使用额外的对象检测器生成提案作为锚点，提供MOTR的检测先验。这种简单的修改极大地减轻了MOTR中联合学习检测和关联任务之间的冲突。 MOTRv2保留了查询传播特征，并在大规模基准测试中具有良好的扩展性。 MOTRv2在DanceTrack上排名第一（73.4％的HOTA），位于人群舞蹈挑战赛第一名。此外，MOTRv2在BDD100K数据集上达到了最新的性能。我们希望这种简单有效的管道可以向端到端MOT社区提供一些新的见解。代码可在\url{https://github.com/megvii-research/MOTRv2}上找到。

0

相关内容

对象检测

【CVPR 2022】基于Tracklet查询和建议的高效视频实例分割，Efficient Video Instance Segmentation via Tracklet Query and Proposal

【CVPR 2022】基于Tracklet查询和建议的高效视频实例分割，Efficient Video Instance Segmentation via Tracklet Query and Proposal

专知会员服务

16+阅读 · 2022年3月3日

【AAAI2022】LGD：用于物体检测的标签引导自蒸馏

【AAAI2022】LGD：用于物体检测的标签引导自蒸馏

专知会员服务

17+阅读 · 2022年1月2日

浙大《深度学习低样本目标检测》综述论文

浙大《深度学习低样本目标检测》综述论文

专知会员服务

76+阅读 · 2021年12月13日

【CVPR2021】基于端到端预训练的视觉-语言表征学习

【CVPR2021】基于端到端预训练的视觉-语言表征学习

专知会员服务

38+阅读 · 2021年4月9日

【商汤科技】可变形Transformers端到端对象检测，Deformable DETR

【商汤科技】可变形Transformers端到端对象检测，Deformable DETR

专知会员服务

33+阅读 · 2020年10月11日

新杀器来了！Facebook AI提出DETR：用Transformers来进行端到端的目标检测

新杀器来了！Facebook AI提出DETR：用Transformers来进行端到端的目标检测

专知会员服务

51+阅读 · 2020年5月28日

【CVPR2020】通过潦草注释的弱监督显著目标检测，Weakly-Supervised Salient Object Detection via Scribble Annotations

【CVPR2020】通过潦草注释的弱监督显著目标检测，Weakly-Supervised Salient Object Detection via Scribble Annotations

专知会员服务

39+阅读 · 2020年3月19日

运动物体检测与运动相机:一个全面的综述：Moving Objects Detection with a Moving Camera: A Comprehensive Review

运动物体检测与运动相机:一个全面的综述：Moving Objects Detection with a Moving Camera: A Comprehensive Review

专知会员服务

27+阅读 · 2020年1月17日

【AAAI2020论文-腾讯】通过稠密边界发生器快速学习时间动作方案（Fast Learning of Temporal Action Proposal via Dense Boundary Generator）

【AAAI2020论文-腾讯】通过稠密边界发生器快速学习时间动作方案（Fast Learning of Temporal Action Proposal via Dense Boundary Generator）

专知会员服务

12+阅读 · 2019年11月15日

Deep Learning Based Detection and Correction of Cardiac MR Motion Artefacts During Reconstruction for High-Quality Segmentation

Deep Learning Based Detection and Correction of Cardiac MR Motion Artefacts During Reconstruction for High-Quality Segmentation

专知会员服务

59+阅读 · 2019年10月17日

首个目标检测扩散模型，比Faster R-CNN、DETR好，从随机框中直接检测

首个目标检测扩散模型，比Faster R-CNN、DETR好，从随机框中直接检测

机器之心

1+阅读 · 2022年11月21日

ECCV 2022 | ByteTrack: 简单高效的数据关联方法

ECCV 2022 | ByteTrack: 简单高效的数据关联方法

PaperWeekly

0+阅读 · 2022年8月1日

ECCV2022 | 屠榜多目标跟踪！华科&港大提出ByteTrack：基于数据关联方法BYTE的跟踪器

ECCV2022 | 屠榜多目标跟踪！华科&港大提出ByteTrack：基于数据关联方法BYTE的跟踪器

极市平台

0+阅读 · 2022年7月19日

CVPR2019 | 15篇论文速递（涵盖目标检测、语义分割和姿态估计等方向）

CVPR2019 | 15篇论文速递（涵盖目标检测、语义分割和姿态估计等方向）

AI研习社

15+阅读 · 2019年5月8日

多目标跟踪：SORT和Deep SORT

多目标跟踪：SORT和Deep SORT

极市平台

47+阅读 · 2019年3月18日

逆强化学习-学习人先验的动机

逆强化学习-学习人先验的动机

CreateAMind

16+阅读 · 2019年1月18日

无监督元学习表示学习

无监督元学习表示学习

CreateAMind

27+阅读 · 2019年1月4日

tensorflow Object Detection API使用预训练模型mask r-cnn实现对象检测

tensorflow Object Detection API使用预训练模型mask r-cnn实现对象检测

极市平台

12+阅读 · 2018年8月24日

【论文推荐】最新十篇目标跟踪相关论文—多帧光流跟踪、动态图学习、MV-YOLO、姿态估计、深度核相关滤波、Benchmark

【论文推荐】最新十篇目标跟踪相关论文—多帧光流跟踪、动态图学习、MV-YOLO、姿态估计、深度核相关滤波、Benchmark

专知

13+阅读 · 2018年5月26日

【论文推荐】最新5篇目标跟踪（Object Tracking）相关论文—并行跟踪和验证、光流、自动跟踪、相关滤波集成、CFNet

【论文推荐】最新5篇目标跟踪（Object Tracking）相关论文—并行跟踪和验证、光流、自动跟踪、相关滤波集成、CFNet

专知

25+阅读 · 2018年2月6日

多目标跟踪中的注意模型研究

国家自然科学基金

0+阅读 · 2014年12月31日

无监督分词及词性归纳联合方法研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于动态图模型与多元结构化在线学习的视觉目标跟踪

国家自然科学基金

0+阅读 · 2013年12月31日

面向未知环境探索的类别独立对象检测

国家自然科学基金

0+阅读 · 2013年12月31日

基于半监督学习和交互模型的多目标跟踪方法

国家自然科学基金

0+阅读 · 2013年12月31日

基于图像序列的动态场景三维结构和运动恢复的鲁棒性算法

国家自然科学基金

0+阅读 · 2012年12月31日

弱监督条件下RGB-D时序图像的语义分割模型与迁移学习算法

国家自然科学基金

0+阅读 · 2012年12月31日

基于随机有限集理论的多目标跟踪方法若干问题研究

国家自然科学基金

0+阅读 · 2012年12月31日

稀土掺杂有机/无机复合介孔薄膜的优化制备和全彩色发光机理研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于边缘引导区域分级合并的高分辨率遥感模糊分类

国家自然科学基金

0+阅读 · 2009年12月31日

End-to-End Word-Level Pronunciation Assessment with MASK Pre-training

Arxiv

0+阅读 · 2023年6月5日

LoCoOp: Few-Shot Out-of-Distribution Detection via Prompt Learning

Arxiv

1+阅读 · 2023年6月2日

Deep Learning for UAV-based Object Detection and Tracking: A Survey

Arxiv

64+阅读 · 2021年10月25日

Multi-Object Tracking with Deep Learning Ensemble for Unmanned Aerial System Applications

Arxiv

26+阅读 · 2021年10月5日

Transformer Tracking

Arxiv

17+阅读 · 2021年3月29日

UP-DETR: Unsupervised Pre-training for Object Detection with Transformers

UP-DETR: Unsupervised Pre-training for Object Detection with Transformers

Arxiv

19+阅读 · 2020年11月18日

Few-Shot Object Detection with Attention-RPN and Multi-Relation Detector

Few-Shot Object Detection with Attention-RPN and Multi-Relation Detector

Arxiv

17+阅读 · 2020年3月31日

Imbalance Problems in Object Detection: A Review

Arxiv

25+阅读 · 2020年3月11日

Prime Sample Attention in Object Detection

Arxiv

13+阅读 · 2019年4月9日

MV-YOLO: Motion Vector-aided Tracking by Semantic Object Detection

Arxiv

10+阅读 · 2018年4月30日

VIP会员

文章信息

相关主题

多目标跟踪

相关VIP内容

【CVPR 2022】基于Tracklet查询和建议的高效视频实例分割，Efficient Video Instance Segmentation via Tracklet Query and Proposal

【CVPR 2022】基于Tracklet查询和建议的高效视频实例分割，Efficient Video Instance Segmentation via Tracklet Query and Proposal

专知会员服务

16+阅读 · 2022年3月3日

【AAAI2022】LGD：用于物体检测的标签引导自蒸馏

【AAAI2022】LGD：用于物体检测的标签引导自蒸馏

专知会员服务

17+阅读 · 2022年1月2日

浙大《深度学习低样本目标检测》综述论文

浙大《深度学习低样本目标检测》综述论文

专知会员服务

76+阅读 · 2021年12月13日

【CVPR2021】基于端到端预训练的视觉-语言表征学习

【CVPR2021】基于端到端预训练的视觉-语言表征学习

专知会员服务

38+阅读 · 2021年4月9日

【商汤科技】可变形Transformers端到端对象检测，Deformable DETR

【商汤科技】可变形Transformers端到端对象检测，Deformable DETR

专知会员服务

33+阅读 · 2020年10月11日

新杀器来了！Facebook AI提出DETR：用Transformers来进行端到端的目标检测

新杀器来了！Facebook AI提出DETR：用Transformers来进行端到端的目标检测

专知会员服务

51+阅读 · 2020年5月28日

【CVPR2020】通过潦草注释的弱监督显著目标检测，Weakly-Supervised Salient Object Detection via Scribble Annotations

【CVPR2020】通过潦草注释的弱监督显著目标检测，Weakly-Supervised Salient Object Detection via Scribble Annotations

专知会员服务

39+阅读 · 2020年3月19日

运动物体检测与运动相机:一个全面的综述：Moving Objects Detection with a Moving Camera: A Comprehensive Review

运动物体检测与运动相机:一个全面的综述：Moving Objects Detection with a Moving Camera: A Comprehensive Review

专知会员服务

27+阅读 · 2020年1月17日

【AAAI2020论文-腾讯】通过稠密边界发生器快速学习时间动作方案（Fast Learning of Temporal Action Proposal via Dense Boundary Generator）

【AAAI2020论文-腾讯】通过稠密边界发生器快速学习时间动作方案（Fast Learning of Temporal Action Proposal via Dense Boundary Generator）

专知会员服务

12+阅读 · 2019年11月15日

Deep Learning Based Detection and Correction of Cardiac MR Motion Artefacts During Reconstruction for High-Quality Segmentation

Deep Learning Based Detection and Correction of Cardiac MR Motion Artefacts During Reconstruction for High-Quality Segmentation

专知会员服务

59+阅读 · 2019年10月17日

热门VIP内容

开通专知VIP会员享更多权益服务

基于大型语言模型的网络威胁情报：利用LLM提取MITRE ATT&CK技术 | 最新文献

无人机（UAV）战略：区域大国与暴力非国家行为体在中东冲突中对无人机的运用 | 130页

神经技术与未来无人机战争的交汇点 | 最新报告

美国从“蛛网行动”中汲取轰炸机舰队保护教训

相关资讯

首个目标检测扩散模型，比Faster R-CNN、DETR好，从随机框中直接检测

首个目标检测扩散模型，比Faster R-CNN、DETR好，从随机框中直接检测

机器之心

1+阅读 · 2022年11月21日

ECCV 2022 | ByteTrack: 简单高效的数据关联方法

ECCV 2022 | ByteTrack: 简单高效的数据关联方法

PaperWeekly

0+阅读 · 2022年8月1日

ECCV2022 | 屠榜多目标跟踪！华科&港大提出ByteTrack：基于数据关联方法BYTE的跟踪器

ECCV2022 | 屠榜多目标跟踪！华科&港大提出ByteTrack：基于数据关联方法BYTE的跟踪器

极市平台

0+阅读 · 2022年7月19日

CVPR2019 | 15篇论文速递（涵盖目标检测、语义分割和姿态估计等方向）

CVPR2019 | 15篇论文速递（涵盖目标检测、语义分割和姿态估计等方向）

AI研习社

15+阅读 · 2019年5月8日

多目标跟踪：SORT和Deep SORT

多目标跟踪：SORT和Deep SORT

极市平台

47+阅读 · 2019年3月18日

逆强化学习-学习人先验的动机

逆强化学习-学习人先验的动机

CreateAMind

16+阅读 · 2019年1月18日

无监督元学习表示学习

无监督元学习表示学习

CreateAMind

27+阅读 · 2019年1月4日

tensorflow Object Detection API使用预训练模型mask r-cnn实现对象检测

tensorflow Object Detection API使用预训练模型mask r-cnn实现对象检测

极市平台

12+阅读 · 2018年8月24日

【论文推荐】最新十篇目标跟踪相关论文—多帧光流跟踪、动态图学习、MV-YOLO、姿态估计、深度核相关滤波、Benchmark

【论文推荐】最新十篇目标跟踪相关论文—多帧光流跟踪、动态图学习、MV-YOLO、姿态估计、深度核相关滤波、Benchmark

专知

13+阅读 · 2018年5月26日

【论文推荐】最新5篇目标跟踪（Object Tracking）相关论文—并行跟踪和验证、光流、自动跟踪、相关滤波集成、CFNet

【论文推荐】最新5篇目标跟踪（Object Tracking）相关论文—并行跟踪和验证、光流、自动跟踪、相关滤波集成、CFNet

专知

25+阅读 · 2018年2月6日

相关论文

End-to-End Word-Level Pronunciation Assessment with MASK Pre-training

Arxiv

0+阅读 · 2023年6月5日

LoCoOp: Few-Shot Out-of-Distribution Detection via Prompt Learning

Arxiv

1+阅读 · 2023年6月2日

Deep Learning for UAV-based Object Detection and Tracking: A Survey

Arxiv

64+阅读 · 2021年10月25日

Multi-Object Tracking with Deep Learning Ensemble for Unmanned Aerial System Applications

Arxiv

26+阅读 · 2021年10月5日

Transformer Tracking

Arxiv

17+阅读 · 2021年3月29日

UP-DETR: Unsupervised Pre-training for Object Detection with Transformers

UP-DETR: Unsupervised Pre-training for Object Detection with Transformers

Arxiv

19+阅读 · 2020年11月18日

Few-Shot Object Detection with Attention-RPN and Multi-Relation Detector

Few-Shot Object Detection with Attention-RPN and Multi-Relation Detector

Arxiv

17+阅读 · 2020年3月31日

Imbalance Problems in Object Detection: A Review

Arxiv

25+阅读 · 2020年3月11日

Prime Sample Attention in Object Detection

Arxiv

13+阅读 · 2019年4月9日

MV-YOLO: Motion Vector-aided Tracking by Semantic Object Detection

Arxiv

10+阅读 · 2018年4月30日

相关基金

多目标跟踪中的注意模型研究

国家自然科学基金

0+阅读 · 2014年12月31日

无监督分词及词性归纳联合方法研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于动态图模型与多元结构化在线学习的视觉目标跟踪

国家自然科学基金

0+阅读 · 2013年12月31日

面向未知环境探索的类别独立对象检测

国家自然科学基金

0+阅读 · 2013年12月31日

基于半监督学习和交互模型的多目标跟踪方法

国家自然科学基金

0+阅读 · 2013年12月31日

基于图像序列的动态场景三维结构和运动恢复的鲁棒性算法

国家自然科学基金

0+阅读 · 2012年12月31日

弱监督条件下RGB-D时序图像的语义分割模型与迁移学习算法

国家自然科学基金

0+阅读 · 2012年12月31日

基于随机有限集理论的多目标跟踪方法若干问题研究

国家自然科学基金

0+阅读 · 2012年12月31日

稀土掺杂有机/无机复合介孔薄膜的优化制备和全彩色发光机理研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于边缘引导区域分级合并的高分辨率遥感模糊分类

国家自然科学基金

0+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员