Multispectral image pairs can provide the combined information, making object detection applications more reliable and robust in the open world. To fully exploit the different modalities, we present a simple yet effective cross-modality feature fusion approach, named Cross-Modality Fusion Transformer (CFT) in this paper. Unlike prior CNNs-based works, guided by the transformer scheme, our network learns long-range dependencies and integrates global contextual information in the feature extraction stage. More importantly, by leveraging the self attention of the transformer, the network can naturally carry out simultaneous intra-modality and inter-modality fusion, and robustly capture the latent interactions between RGB and Thermal domains, thereby significantly improving the performance of multispectral object detection. Extensive experiments and ablation studies on multiple datasets demonstrate that our approach is effective and achieves state-of-the-art detection performance. Our code and models are available at https://github.com/DocF/multispectral-object-detection.


翻译:多光谱图像配对可以提供综合信息,使天体探测应用在开放世界中更加可靠和强大。为了充分利用不同模式,我们在本文中展示了一个简单而有效的跨现代特征融合方法,名为“跨模式融合变异器 ” ( Cross-Modality Fusion 变异器 ) 。与以前在变压器计划指导下的CNN工作不同,我们的网络学习长距离依赖关系,并将全球背景信息纳入地貌提取阶段。更重要的是,通过利用变异器的自我关注,网络可以自然地同时进行时时装和时装融合,并强有力地捕捉RGB和热域之间的潜在互动,从而大大改进多光谱天体探测的性能。关于多个数据集的广泛实验和调整研究表明,我们的方法是有效的,并实现了最先进的探测性能。我们的代码和模型可以在 https://github.com/DocF/ multi光谱点-object-dectionction。

0
下载
关闭预览

相关内容

【AAAI2021】图卷积网络中的低频和高频信息作用
专知会员服务
58+阅读 · 2021年1月6日
专知会员服务
60+阅读 · 2020年3月19日
专知会员服务
109+阅读 · 2020年3月12日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
【泡泡汇总】CVPR2019 SLAM Paperlist
泡泡机器人SLAM
14+阅读 · 2019年6月12日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
Single-Shot Object Detection with Enriched Semantics
统计学习与视觉计算组
14+阅读 · 2018年8月29日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
Focal Loss for Dense Object Detection
统计学习与视觉计算组
11+阅读 · 2018年3月15日
Arxiv
9+阅读 · 2021年3月3日
Arxiv
11+阅读 · 2019年4月15日
Zero-Shot Object Detection
Arxiv
9+阅读 · 2018年7月27日
Object Relation Detection Based on One-shot Learning
Arxiv
3+阅读 · 2018年7月16日
Arxiv
3+阅读 · 2018年6月14日
VIP会员
相关资讯
Top
微信扫码咨询专知VIP会员