Continual self-supervised learning (CSSL) in medical imaging trains a foundation model sequentially, alleviating the need for collecting multi-modal images for joint training and offering promising improvements in downstream performance while preserving data privacy. However, most existing methods still rely on replaying data from previous stages to prevent catastrophic forgetting, which compromises privacy and limits their applicability in real-world scenarios where data transfer across sites is often restricted. In this work, we propose InvCoSS, an inversion-driven continual self-supervised learning framework for medical multi-modal image pre-training. Specifically, after training on a previous task, InvCoSS inverts the pre-trained self-supervised model to generate synthetic images that approximate the original training distribution. These synthetic images are then combined with data from the new task for joint optimization, which effectively mitigates catastrophic forgetting while strictly adhering to the constraint of no access to previous real data. Furthermore, to improve the fidelity of synthetic images, we introduce a novel InvUNet with a multi-scale fusion architecture to restore both high- and low-frequency components of the inverted images. To enhance diversity and prevent mode collapse, we design a repulsive representation-learning mechanism that encourages a diverse feature space for synthetic images without class guidance. Extensive experiments across nine downstream tasks validate the effectiveness of InvCoSS, achieving performance comparable to or even superior to prior data-replay methods while significantly reducing storage requirements and eliminating data privacy constraints.


翻译:医学成像中的持续自监督学习(CSSL)按顺序训练基础模型,无需收集多模态图像进行联合训练,在保持数据隐私的同时,为下游任务性能带来有前景的提升。然而,现有方法大多仍依赖回放先前阶段的数据以防止灾难性遗忘,这不仅损害了隐私,也限制了其在跨站点数据传输常受限制的现实场景中的应用。本文提出InvCoSS,一种用于医学多模态图像预训练的反转驱动持续自监督学习框架。具体而言,在完成先前任务训练后,InvCoSS通过反转预训练的自监督模型来生成逼近原始训练分布的合成图像。这些合成图像随后与新任务数据结合进行联合优化,从而在严格遵循不访问先前真实数据约束的前提下,有效缓解灾难性遗忘。此外,为提高合成图像的保真度,我们引入了一种新颖的InvUNet,其采用多尺度融合架构以恢复反转图像的高频与低频成分。为增强多样性并防止模式坍塌,我们设计了一种排斥性表示学习机制,在无类别引导的情况下促进合成图像特征空间的多样性。在九个下游任务上的大量实验验证了InvCoSS的有效性,其性能达到甚至超越了先前的数据回放方法,同时显著降低了存储需求并消除了数据隐私限制。

0
下载
关闭预览

相关内容

【AAAI 2022】跨模态目标跟踪: 模态感知表示和统一基准
专知会员服务
44+阅读 · 2022年1月6日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员