In real-world clinical practice, electrocardiograms (ECGs) are often captured and shared as photographs. However, publicly available ECG data, and thus most related research, relies on digital signals. This has led to a disconnect in which computer assisted interpretation of ECG cannot easily be applied to ECG images. The emergence of high-fidelity synthetic data generators has introduced practical alternatives by producing realistic, photo-like, ECG images derived from the digital signal that could help narrow this divide. To address this, we propose a novel knowledge augmentation framework that uses synthetic data generated from multiple sources to provide generalisable and accurate interpretation of ECG photographs. Our framework features two key contributions. First, we introduce a robust pre-processing pipeline designed to remove background artifacts and reduces visual differences between images. Second, we implement a two-stage training strategy: a Morphology Learning Stage, where the model captures broad morphological features from visually different, scan-like synthetic data, followed by a Task-Specific Adaptation Stage, where the model is fine-tuned on the photo-like target data. We tested the model on the British Heart Foundation Challenge dataset, to classify five common ECG findings: myocardial infarction (MI), atrial fibrillation, hypertrophy, conduction disturbance, and ST/T changes. Our approach, built upon the ConvNeXt backbone, outperforms a single-source training baseline and achieved \textbf{1st} place in the challenge with an macro-AUROC of \textbf{0.9677}. These results suggest that incorporating morphology learning from heterogeneous sources offers a more robust and generalizable paradigm than conventional single-source training.


翻译:在真实临床实践中,心电图通常以照片形式采集与共享。然而,公开可用的心电图数据及相关研究大多依赖于数字信号,这导致计算机辅助心电图解读技术难以直接应用于心电图图像。高保真合成数据生成器的出现提供了可行的替代方案,其能够基于数字信号生成逼真的照片式心电图图像,从而有助于弥合这一鸿沟。为此,我们提出一种新颖的知识增强框架,利用多源生成的合成数据实现对心电图照片的泛化性高且准确的解读。本框架包含两项核心贡献:首先,我们设计了鲁棒的预处理流程,用于消除背景伪影并减少图像间的视觉差异;其次,我们实施了两阶段训练策略:第一阶段为形态学习阶段,模型从视觉差异显著的扫描式合成数据中学习广泛的形态特征;第二阶段为任务自适应阶段,模型在照片式目标数据上进行微调。我们在英国心脏基金会挑战数据集上测试了模型,针对五种常见心电图表现进行分类:心肌梗死、心房颤动、心肌肥厚、传导障碍以及ST/T改变。基于ConvNeXt架构构建的方法超越了单源训练基线,并以0.9677的宏观AUROC值在挑战赛中荣获第一名。这些结果表明,与传统单源训练相比,融合多源异构数据的形态学习能够提供更鲁棒且更具泛化能力的范式。

0
下载
关闭预览

相关内容

Python图像处理,366页pdf,Image Operators Image Processing in Python
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员