Different from visible cameras which record intensity images frame by frame, the biologically inspired event camera produces a stream of asynchronous and sparse events with much lower latency. In practice, the visible cameras can better perceive texture details and slow motion, while event cameras can be free from motion blurs and have a larger dynamic range which enables them to work well under fast motion and low illumination. Therefore, the two sensors can cooperate with each other to achieve more reliable object tracking. In this work, we propose a large-scale Visible-Event benchmark (termed VisEvent) due to the lack of a realistic and scaled dataset for this task. Our dataset consists of 820 video pairs captured under low illumination, high speed, and background clutter scenarios, and it is divided into a training and a testing subset, each of which contains 500 and 320 videos, respectively. Based on VisEvent, we transform the event flows into event images and construct more than 30 baseline methods by extending current single-modality trackers into dual-modality versions. More importantly, we further build a simple but effective tracking algorithm by proposing a cross-modality transformer, to achieve more effective feature fusion between visible and event data. Extensive experiments on the proposed VisEvent dataset, FE108, and two simulated datasets (i.e., OTB-DVS and VOT-DVS), validated the effectiveness of our model. The dataset and source code have been released at our project page: \url{https://sites.google.com/view/viseventtrack/}.


翻译:与按框架记录强度图像框架的可见相机不同, 生物激励事件相机产生了一系列不同步和稀有的事件, 其长度要低得多。 实际上, 可见相机可以更好地看到纹理细节和慢动作, 而事件相机可以不受运动模糊的影响, 并且具有更大的动态范围, 使得它们能够在快速运动和低光度下运行良好。 因此, 两个传感器可以相互合作, 以便实现更可靠的天体跟踪。 在这项工作中, 我们提出一个大规模可见- 静地基准( 定时的 VisEvent), 因为它缺少一个现实的和规模化的数据集。 我们的数据集由820个视频组组成, 在低照明、 高速度和背景模糊的情景下捕捉到的图像, 而它可以分为一个培训和测试子集, 每个子集分别包含500和320个视频。 基于 VisEvent, 我们把事件模式转换成事件模型, 并构建了超过30个基线方法, 通过将当前单一模式追踪器运行到双模版本。 更重要的是, 我们进一步构建一个简单的、 可见化的模型化的模型, 数据运行到一个简单的模型, 数据系统, 通过一个简单的模型, 在两个模型中, 我们的模型中, 显示中, 显示一个简单的模型中, 我们的模型中, 我们的模型中, 将一个简单的数据运行到一个简单的模型, 我们的模型, 将一个简单的数据 显示一个简单的模型, 的系统, 的系统, 通过一个有效的数据转换到一个。

0
下载
关闭预览

相关内容

标跟踪是指:给出目标在跟踪视频第一帧中的初始状态(如位置,尺寸),自动估计目标物体在后续帧中的状态。 目标跟踪分为单目标跟踪和多目标跟踪。 人眼可以比较轻松的在一段时间内跟住某个特定目标。但是对机器而言,这一任务并不简单,尤其是跟踪过程中会出现目标发生剧烈形变、被其他目标遮挡或出现相似物体干扰等等各种复杂的情况。过去几十年以来,目标跟踪的研究取得了长足的发展,尤其是各种机器学习算法被引入以来,目标跟踪算法呈现百花齐放的态势。2013年以来,深度学习方法开始在目标跟踪领域展露头脚,并逐渐在性能上超越传统方法,取得巨大的突破。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
专知会员服务
32+阅读 · 2021年6月12日
【泡泡汇总】CVPR2019 SLAM Paperlist
泡泡机器人SLAM
14+阅读 · 2019年6月12日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
【泡泡前沿追踪】跟踪SLAM前沿动态系列之IROS2018
泡泡机器人SLAM
29+阅读 · 2018年10月28日
【跟踪Tracking】15篇论文+代码 | 中秋快乐~
专知
18+阅读 · 2018年9月24日
STRCF for Visual Object Tracking
统计学习与视觉计算组
14+阅读 · 2018年5月29日
计算机视觉领域顶会CVPR 2018 接受论文列表
Arxiv
0+阅读 · 2021年10月28日
Arxiv
17+阅读 · 2021年3月29日
Arxiv
6+阅读 · 2018年2月8日
VIP会员
相关VIP内容
专知会员服务
32+阅读 · 2021年6月12日
Top
微信扫码咨询专知VIP会员