Image fusion integrates complementary information from different modalities to generate high-quality fused images, thereby enhancing downstream tasks such as object detection and semantic segmentation. Unlike task-specific techniques that primarily focus on consolidating inter-modal information, general image fusion needs to address a wide range of tasks while improving performance without increasing complexity. To achieve this, we propose SMC-Mamba, a Self-supervised Multiplex Consensus Mamba framework for general image fusion. Specifically, the Modality-Agnostic Feature Enhancement (MAFE) module preserves fine details through adaptive gating and enhances global representations via spatial-channel and frequency-rotational scanning. The Multiplex Consensus Cross-modal Mamba (MCCM) module enables dynamic collaboration among experts, reaching a consensus to efficiently integrate complementary information from multiple modalities. The cross-modal scanning within MCCM further strengthens feature interactions across modalities, facilitating seamless integration of critical information from both sources. Additionally, we introduce a Bi-level Self-supervised Contrastive Learning Loss (BSCL), which preserves high-frequency information without increasing computational overhead while simultaneously boosting performance in downstream tasks. Extensive experiments demonstrate that our approach outperforms state-of-the-art (SOTA) image fusion algorithms in tasks such as infrared-visible, medical, multi-focus, and multi-exposure fusion, as well as downstream visual tasks.


翻译:图像融合通过整合不同模态的互补信息生成高质量融合图像,从而提升目标检测与语义分割等下游任务性能。与主要关注跨模态信息整合的任务专用技术不同,通用图像融合需在保持复杂度不增加的前提下,应对多样化任务并提升性能。为此,我们提出SMC-Mamba——一种面向通用图像融合的自监督多重共识Mamba框架。具体而言,模态无关特征增强模块通过自适应门控机制保留细节特征,并借助空间-通道与频率-旋转扫描增强全局表征。多重共识跨模态Mamba模块实现专家网络的动态协作,通过共识机制高效整合多模态互补信息。该模块内部的跨模态扫描进一步强化模态间特征交互,促进双源关键信息的无缝融合。此外,我们提出双层自监督对比学习损失函数,在避免增加计算开销的同时保留高频信息,并同步提升下游任务性能。大量实验表明,本方法在红外-可见光、医学、多焦点、多曝光等融合任务及下游视觉任务中均优于当前最先进的图像融合算法。

0
下载
关闭预览

相关内容

【CVPR2024】ViewDiff: 3D一致的图像生成与文本到图像模型
专知会员服务
30+阅读 · 2024年3月10日
ACM TOIS 2021 | 第一个基于多关系图的任务驱动GNN框架
专知会员服务
17+阅读 · 2021年10月25日
【CVPR 2021】变换器跟踪TransT: Transformer Tracking
专知会员服务
22+阅读 · 2021年4月20日
【NeurIPS2019】图变换网络:Graph Transformer Network
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
VIP会员
相关基金
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员