In recent years, various applications in computer vision have achieved substantial progress based on deep learning, which has been widely used for image fusion and shown to achieve adequate performance. However, suffering from limited ability in modelling the spatial correspondence of different source images, it still remains a great challenge for existing unsupervised image fusion models to extract appropriate feature and achieves adaptive and balanced fusion. In this paper, we propose a novel cross attention-guided image fusion network, which is a unified and unsupervised framework for multi-modal image fusion, multi-exposure image fusion, and multi-focus image fusion. Different from the existing self-attention module, our cross attention module focus on modelling the cross-correlation between different source images. Using the proposed cross attention module as core block, a densely connected cross attention-guided network is built to dynamically learn the spatial correspondence to derive better alignment of important details from different input images. Meanwhile, an auxiliary branch is also designed to model the long-range information, and a merging network is attached to finally reconstruct the fusion image. Extensive experiments have been carried out on publicly available datasets, and the results demonstrate that the proposed model outperforms the state-of-the-art quantitatively and qualitatively.


翻译:近年来,计算机视觉中的各种应用在深层次学习的基础上取得了长足进步,这种深层次学习被广泛用于图像融合,并显示能够取得适当的性能。然而,由于在模拟不同源图像的空间对应关系方面能力有限,在建模不同源图像的空间对应关系方面,计算机视觉中的各种应用仍然对现有的未经监督的图像融合模型构成巨大挑战,以提取适当的特征并实现适应性和平衡的融合。在本文件中,我们建议建立一个新的交叉关注引导图像融合网络,这是多模式图像融合、多接触图像融合和多重点图像融合的统一和不受监督的框架。与现有的自我关注模块不同,我们的交叉关注模块侧重于建模不同源图像之间的交叉关系。利用拟议的交叉关注模块作为核心块,构建了一个紧密相连的交叉关注引导网络,动态地学习空间通信,以更好地对不同输入图像的重要细节进行匹配。与此同时,还设计了一个辅助分支,以模拟远程信息,并将一个合并网络作为最终重建聚合图像的附加。在公开可用的数据配置和定性上进行了广泛的实验,并展示了拟议的模型的定性和定性结果。

1
下载
关闭预览

相关内容

Networking:IFIP International Conferences on Networking。 Explanation:国际网络会议。 Publisher:IFIP。 SIT: http://dblp.uni-trier.de/db/conf/networking/index.html
专知会员服务
31+阅读 · 2021年6月12日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
CVPR2019 | 全景分割:Attention-guided Unified Network
极市平台
9+阅读 · 2019年3月3日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
《pyramid Attention Network for Semantic Segmentation》
统计学习与视觉计算组
44+阅读 · 2018年8月30日
【推荐】全卷积语义分割综述
机器学习研究会
19+阅读 · 2017年8月31日
Recurrent Fusion Network for Image Captioning
Arxiv
3+阅读 · 2018年7月31日
Arxiv
3+阅读 · 2018年3月5日
VIP会员
相关VIP内容
专知会员服务
31+阅读 · 2021年6月12日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
Top
微信扫码咨询专知VIP会员