PTAV:实时高精度目标追踪框架 | ICCV 2017论文解读

2018 年 3 月 20 日 PaperWeekly 陈泰红




在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考。


在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果。


点击本文底部的「阅读原文」即刻加入社区,查看更多最新论文推荐。

这是 PaperDaily 的第 52 篇文章


关于作者:陈泰红,小米高级算法工程师,研究方向为人脸检测识别,手势识别与跟踪。


■ 论文 | Parallel Tracking and Verifying

■ 链接 | https://www.paperweekly.site/papers/1613

■ 源码 | http://tinyurl.com/y94wn2yg


论文动机


目标追踪是视频分析的基本任务,比目标识别更为复杂:目标追踪可以把每一帧看作单独的图片,再进行识别,但目标追踪不会这样做,因为没有考虑视频帧之间的冗余信息,效率低且慢。


目标追踪一直有两大阵营,CF 相关滤波和 CNN,当然也可以 CF+CNN 融合。

 

本文基于以下动机: 


1. 物体运动时,大部分时间运动平缓,外观改变较慢。但是对于偶然发生的剧烈运动,需要复杂信息处理,需要单独验证。 


2. CV 领域已经普及多线程计算,尤其 SLAM(Simultaneous localization and mapping、同步定位于地图构建)领域。PTAM 算法的一个关键观点是每一帧不是有必要构建地图。对于目标追踪而言,每一帧图片也不需要单独的验证。 


3. tracking performance 和 efficiency 之间需要达到一种平衡。 


论文将 tracking 过程分解为两个并行但是相互协作的部分:一个用于快速的跟踪(fast tracking),另一个用于准确的验证(accurate verification)。 


其实作者之前发布的论文版本 [1] 已被 ICCV 2017 录用,此版本在原文基础上做了进一步的修订。本文所有讨论以 2018 年 1 月 在 arXiv 上发布的版本为准


该版本在原文基础上做了以下改进: 


1. 使用更具有鲁棒性的跟踪器(Staple)提升性能。 


2. 动态目标模板池用于自适应验证,放置目标外观的变化。 


3. PTAV 的 V 和 T 进行了多方面验证,比如 T 使用 VGGNet 和 AlexNet ,V 使用 KCF、fDSST 和 Staple。 


4. 使用更多实时性算法和基准,进行更彻底实验验证和分析。


论文模型


PTAV 算法架构包括三部分:Base Tracker T,Base Verifier V,以及它们之间的协调环节。


对于 T,论文选择的是 Staple 算法 [2]。验证环节 V 则选择采用 Siamese network 验证目标之间的相似性。对于协调环节,T 在合适的频率发送结果给 V,保证足够的时间验证。


为了改善 PTAV 的精度和速率,论文使用 k 均值聚类用于保持动态目标模板池用于自适应验证。



实验


论文的实验数据详实,在主要数据集 OTB2015,TC128,UAV20L 和 VOT2016 上均和典型算法进行了对比。


从精度和实时性考虑各个模型,如图所示,OTB2015 数据集显示效果。






总结


PTAV 的假设是大部分时间目标运动平滑,位置改变很慢。而较难的情况是运动的无规律性。论文提出的 verifying 时刻并不一定是运动改变的时刻,具有偶然性,所以对“打架斗殴”等运动剧烈的情况会失败。10 帧更新速率对 verifying 不是最好的选择。 


对于同样视频序列处理的 video segmentation,可以同样考虑。因为视频的逐帧操作比较耗费时间,这种间隔性的验证可大量节约资源。但是,对于剧烈变化的活动,更新会滞后。是否存在自使用速率变化的方法,这样的坑可以继续填。


参考文献


[1] Parallel Tracking and Verifying: A Framework for Real-Time and High Accuracy Visual Tracking (ICCV2017)

[2] Staple: Complementary Learners for Real-Time Tracking


本文由 AI 学术社区 PaperWeekly 精选推荐,社区目前已覆盖自然语言处理、计算机视觉、人工智能、机器学习、数据挖掘和信息检索等研究方向,点击「阅读原文」即刻加入社区!


#榜 单 公 布 #


2017年度最值得读的AI论文 | NLP篇 · 评选结果公布

2017年度最值得读的AI论文 | CV篇 · 评选结果公布



  我是彩蛋 


解锁新功能:热门职位推荐!


PaperWeekly小程序升级啦


今日arXiv√猜你喜欢√热门职位


找全职找实习都不是问题

 

 解锁方式 

1. 识别下方二维码打开小程序

2. 用PaperWeekly社区账号进行登陆

3. 登陆后即可解锁所有功能


 职位发布 

请添加小助手微信(pwbot01)进行咨询

 

长按识别二维码,使用小程序

*点击阅读原文即可注册



           



关于PaperWeekly


PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。


▽ 点击 | 阅读原文 | 查看原论文

登录查看更多
7

相关内容

【快讯】KDD2020论文出炉,216篇上榜, 你的paper中了吗?
专知会员服务
50+阅读 · 2020年5月16日
3D目标检测进展综述
专知会员服务
191+阅读 · 2020年4月24日
CVPR2020 | 商汤-港中文等提出PV-RCNN:3D目标检测新网络
专知会员服务
43+阅读 · 2020年4月17日
【CVPR2020-谷歌】多目标(车辆)跟踪与检测框架 RetinaTrack
专知会员服务
44+阅读 · 2020年4月10日
专知会员服务
109+阅读 · 2020年3月12日
近期必读的5篇 CVPR 2019【图卷积网络】相关论文和代码
专知会员服务
32+阅读 · 2020年1月10日
五篇 ICCV 2019 的【图神经网络(GNN)+CV】相关论文
专知会员服务
14+阅读 · 2020年1月9日
MaskFusion: 多运动目标实时识别、跟踪和重建
计算机视觉life
11+阅读 · 2019年4月20日
【泡泡图灵智库】基于CPU的实时6D物体姿态估计(arXiv)
泡泡机器人SLAM
12+阅读 · 2019年1月26日
用PyTorch做物体检测和追踪
AI研习社
12+阅读 · 2019年1月6日
商汤及联合实验室入选论文重点解读 | ECCV 2018
一种轻量级在线多目标车辆跟踪方法
极市平台
13+阅读 · 2018年8月18日
CVPR 2018中国论文分享会 之「人物重识别及追踪」
AI科技评论
4+阅读 · 2018年6月3日
Mask R-CNN 论文笔记
统计学习与视觉计算组
11+阅读 · 2018年3月22日
论文笔记:PTAV
统计学习与视觉计算组
3+阅读 · 2017年9月23日
Mesh R-CNN
Arxiv
4+阅读 · 2019年6月6日
Joint Monocular 3D Vehicle Detection and Tracking
Arxiv
8+阅读 · 2018年12月2日
Arxiv
8+阅读 · 2018年1月30日
Arxiv
7+阅读 · 2018年1月24日
Arxiv
7+阅读 · 2017年12月26日
VIP会员
相关VIP内容
【快讯】KDD2020论文出炉,216篇上榜, 你的paper中了吗?
专知会员服务
50+阅读 · 2020年5月16日
3D目标检测进展综述
专知会员服务
191+阅读 · 2020年4月24日
CVPR2020 | 商汤-港中文等提出PV-RCNN:3D目标检测新网络
专知会员服务
43+阅读 · 2020年4月17日
【CVPR2020-谷歌】多目标(车辆)跟踪与检测框架 RetinaTrack
专知会员服务
44+阅读 · 2020年4月10日
专知会员服务
109+阅读 · 2020年3月12日
近期必读的5篇 CVPR 2019【图卷积网络】相关论文和代码
专知会员服务
32+阅读 · 2020年1月10日
五篇 ICCV 2019 的【图神经网络(GNN)+CV】相关论文
专知会员服务
14+阅读 · 2020年1月9日
相关资讯
MaskFusion: 多运动目标实时识别、跟踪和重建
计算机视觉life
11+阅读 · 2019年4月20日
【泡泡图灵智库】基于CPU的实时6D物体姿态估计(arXiv)
泡泡机器人SLAM
12+阅读 · 2019年1月26日
用PyTorch做物体检测和追踪
AI研习社
12+阅读 · 2019年1月6日
商汤及联合实验室入选论文重点解读 | ECCV 2018
一种轻量级在线多目标车辆跟踪方法
极市平台
13+阅读 · 2018年8月18日
CVPR 2018中国论文分享会 之「人物重识别及追踪」
AI科技评论
4+阅读 · 2018年6月3日
Mask R-CNN 论文笔记
统计学习与视觉计算组
11+阅读 · 2018年3月22日
论文笔记:PTAV
统计学习与视觉计算组
3+阅读 · 2017年9月23日
相关论文
Mesh R-CNN
Arxiv
4+阅读 · 2019年6月6日
Joint Monocular 3D Vehicle Detection and Tracking
Arxiv
8+阅读 · 2018年12月2日
Arxiv
8+阅读 · 2018年1月30日
Arxiv
7+阅读 · 2018年1月24日
Arxiv
7+阅读 · 2017年12月26日
Top
微信扫码咨询专知VIP会员