Most of the existing Siamese-based trackers treat tracking problem as a parallel task of classification and regression. However, some studies show that the sibling head structure could lead to suboptimal solutions during the network training. Through experiments we find that, without regression, the performance could be equally promising as long as we delicately design the network to suit the training objective. We introduce a novel voting-based classification-only tracking algorithm named Pyramid Correlation based Deep Hough Voting (short for PCDHV), to jointly locate the top-left and bottom-right corners of the target. Specifically we innovatively construct a Pyramid Correlation module to equip the embedded feature with fine-grained local structures and global spatial contexts; The elaborately designed Deep Hough Voting module further take over, integrating long-range dependencies of pixels to perceive corners; In addition, the prevalent discretization gap is simply yet effectively alleviated by increasing the spatial resolution of the feature maps while exploiting channel-space relationships. The algorithm is general, robust and simple. We demonstrate the effectiveness of the module through a series of ablation experiments. Without bells and whistles, our tracker achieves better or comparable performance to the SOTA algorithms on three challenging benchmarks (TrackingNet, GOT-10k and LaSOT) while running at a real-time speed of 80 FPS. Codes and models will be released.


翻译:大多数现有的以暹罗为基地的跟踪者将追踪问题作为平行的分类和回归任务处理。然而,一些研究表明,在网络培训期间,顶部结构可能会导致不优化的解决方案。通过实验我们发现,只要我们细微地设计网络以适应培训目标,业绩同样充满希望,只要我们不倒退,只要我们精细地设计网络,以适应培训目标;我们引入了一种新型的基于投票的、只有分类的追踪算法,名为基于深喉投票的“金字塔关系”(对PCDHV来说很短),以联合定位目标的左上角和右下角。具体地说,我们创新地构建了金字塔火化模块,以精细微的本地结构和全球空间环境环境环境环境环境环境;我们发现,只要我们精心设计的深哈夫投票模块,只要我们细微地覆盖网络,把长距离的像素依赖感应角感;此外,由于在利用频道-空间关系,提高地貌地图的空间分辨率分辨率,普遍的差距就得到切实缓解。算法是一般的、稳健和简单的。我们通过一系列具有挑战性的业绩和可变式的模型来展示模型运行模式,在运行上展示模型上展示模型上运行模式,将达到具有80-10级的轨道上,将实现。

0
下载
关闭预览

相关内容

Pyramid is a small, fast, down-to-earth Python web application development framework.
3D目标检测进展综述
专知会员服务
191+阅读 · 2020年4月24日
专知会员服务
109+阅读 · 2020年3月12日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
语义分割 | context relation
极市平台
8+阅读 · 2019年2月9日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
【跟踪Tracking】15篇论文+代码 | 中秋快乐~
专知
18+阅读 · 2018年9月24日
《pyramid Attention Network for Semantic Segmentation》
统计学习与视觉计算组
44+阅读 · 2018年8月30日
STRCF for Visual Object Tracking
统计学习与视觉计算组
14+阅读 · 2018年5月29日
【推荐】YOLO实时目标检测(6fps)
机器学习研究会
20+阅读 · 2017年11月5日
Arxiv
17+阅读 · 2021年3月29日
Arxiv
8+阅读 · 2018年6月19日
Arxiv
9+阅读 · 2018年3月10日
VIP会员
Top
微信扫码咨询专知VIP会员