【AAAI 2022】跨模态目标跟踪: 模态感知表示和统一基准

2022 年 1 月 6 日 专知


视觉跟踪是计算机视觉领域的一个重要问题,在视觉监控、智能交通、机器人等视觉系统中发挥着重要作用。然而,现有的跟踪方法往往基于 RGB 图像序列,这些序列对亮度的变化非常敏感,因此一些目标在弱光条件下是无效的。在这种情况下,现有方法的跟踪性能可能会显著降低。


https://www.zhuanzhi.ai/paper/c6cc2d20fe3e758d83a8decbbc882956


引入诸如深度和红外数据等其他方式是处理单个源成像局限性的有效方法,但多模态成像平台通常需要精心设计,目前无法应用于许多现实应用中。近红外(NIR)成像是许多监控摄像机的重要组成部分,其成像可以根据光照强度在 RGB 和 NIR 之间切换。这两种方式是异质的,具有不同的视觉特性,因此给视觉跟踪带来了巨大的挑战。然而,现有的研究工作尚未对这一具有挑战性的问题进行研究。那么如何设计一种合适的算法,以缓解RGB和NIR模式之间的外观差距,并灵活地嵌入到不同的跟踪框架中,实现鲁棒的跨模式目标跟踪?如何创建视频基准数据集以促进跨模态目标跟踪的研究和发展?

在这项工作中,我们解决了跨模态目标跟踪课题,并提出了一个新的视频数据集CMOTB,包括654个跨模态图像序列,总帧数超过486k,平均视频长度超过735帧。为了促进跨模态目标跟踪的研究和发展,我们提出了一个新的即插即用模块。该模块学习感知模态的目标表示,以减少在跟踪过程中 RGB 和 NIR 不同模态之间的外观差距,可以灵活地嵌入不同的跟踪框架中。在我们提出的数据集上进行了广泛的实验,证明了所提出的模块对于两个代表性的跟踪框架,即 dimp-50和 RT-MDNet 上的17种最先进的跟踪方法的有效性。

图1 跨模态相机成像示例及典型跟踪器跟踪结果

图2 跟踪器框架图

图3 不同跟踪器的结果比较

表1 不同属性上的性能对比



专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“CMOT” 就可以获取【AAAI 2022】跨模态目标跟踪: 模态感知表示和统一基准》专知下载链接

专知,专业可信的人工智能知识分发 ,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!


欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取5000+AI主题知识资源
登录查看更多
0

相关内容

【CVPR2022】以人为中心感知的多模态预训练
专知会员服务
29+阅读 · 2022年3月28日
【CVPR2022】GaTector:凝视对象预测的统一框架
专知会员服务
9+阅读 · 2022年3月24日
【CVPR2022】高分辨率和多样化的视频-文本预训练模型
专知会员服务
9+阅读 · 2022年3月6日
【AAAI2022】用于视觉常识推理的场景图增强图像-文本学习
专知会员服务
48+阅读 · 2021年12月20日
【NeurIPS2021】NeRV:视频的神经表示
专知会员服务
11+阅读 · 2021年10月28日
专知会员服务
18+阅读 · 2021年9月13日
【CVPR2021】跨模态检索的概率嵌入
专知会员服务
19+阅读 · 2021年3月2日
【CVPR2020-Facebook AI】前置不变表示的自监督学习
专知会员服务
46+阅读 · 2020年4月19日
【CVPR2022】视频对比学习的概率表示
专知
1+阅读 · 2022年4月12日
【CVPR2021】跨模态检索的概率嵌入
专知
17+阅读 · 2021年3月2日
【AAAI2021】自监督对应学习的对比转换
专知
12+阅读 · 2020年12月11日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
4+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月18日
VIP会员
相关VIP内容
【CVPR2022】以人为中心感知的多模态预训练
专知会员服务
29+阅读 · 2022年3月28日
【CVPR2022】GaTector:凝视对象预测的统一框架
专知会员服务
9+阅读 · 2022年3月24日
【CVPR2022】高分辨率和多样化的视频-文本预训练模型
专知会员服务
9+阅读 · 2022年3月6日
【AAAI2022】用于视觉常识推理的场景图增强图像-文本学习
专知会员服务
48+阅读 · 2021年12月20日
【NeurIPS2021】NeRV:视频的神经表示
专知会员服务
11+阅读 · 2021年10月28日
专知会员服务
18+阅读 · 2021年9月13日
【CVPR2021】跨模态检索的概率嵌入
专知会员服务
19+阅读 · 2021年3月2日
【CVPR2020-Facebook AI】前置不变表示的自监督学习
专知会员服务
46+阅读 · 2020年4月19日
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
4+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员