Cardiovascular diseases (CVDs) are the leading cause of death worldwide, accounting for approximately 17.9 million deaths each year. Early detection is critical, creating a demand for accurate and inexpensive pre-screening methods. Deep learning has recently been applied to classify abnormal heart sounds indicative of CVDs using synchronised phonocardiogram (PCG) and electrocardiogram (ECG) signals, as well as multichannel PCG (mPCG). However, state-of-the-art architectures remain underutilised due to the limited availability of synchronised and multichannel datasets. Augmented datasets and pre-trained models provide a pathway to overcome these limitations, enabling transformer-based architectures to be trained effectively. This work combines traditional signal processing with denoising diffusion models, WaveGrad and DiffWave, to create an augmented dataset to fine-tune a Wav2Vec 2.0-based classifier on multimodal and multichannel heart sound datasets. The approach achieves state-of-the-art performance. On the Computing in Cardiology (CinC) 2016 dataset of single channel PCG, accuracy, unweighted average recall (UAR), sensitivity, specificity and Matthew's correlation coefficient (MCC) reach 92.48%, 93.05%, 93.63%, 92.48%, 94.93% and 0.8283, respectively. Using the synchronised PCG and ECG signals of the training-a dataset from CinC, 93.14%, 92.21%, 94.35%, 90.10%, 95.12% and 0.8380 are achieved for accuracy, UAR, sensitivity, specificity and MCC, respectively. Using a wearable vest dataset consisting of mPCG data, the model achieves 77.13% accuracy, 74.25% UAR, 86.47% sensitivity, 62.04% specificity, and 0.5082 MCC. These results demonstrate the effectiveness of transformer-based models for CVD detection when supported by augmented datasets, highlighting their potential to advance multimodal and multichannel heart sound classification.


翻译:心血管疾病是全球范围内导致死亡的主要原因,每年约造成1790万例死亡。早期检测至关重要,这催生了对于准确且低成本预筛查方法的需求。近年来,深度学习已被应用于利用同步的心音图与心电图信号以及多通道心音图来分类指示心血管疾病的异常心音。然而,由于同步及多通道数据集的可用性有限,最先进的架构仍未得到充分利用。增强数据集与预训练模型为克服这些限制提供了途径,使得基于Transformer的架构能够被有效训练。本研究将传统信号处理与去噪扩散模型(WaveGrad和DiffWave)相结合,创建了一个增强数据集,用于在多模态与多通道心音数据集上微调基于Wav2Vec 2.0的分类器。该方法实现了最先进的性能。在单通道心音图的Computing in Cardiology 2016数据集上,准确率、未加权平均召回率、灵敏度、特异度及马修斯相关系数分别达到92.48%、93.05%、93.63%、92.48%、94.93%和0.8283。使用CinC训练-a数据集的同步心音图与心电图信号时,准确率、UAR、灵敏度、特异度及MCC分别达到93.14%、92.21%、94.35%、90.10%、95.12%和0.8380。在包含多通道心音数据的可穿戴背心数据集上,模型实现了77.13%的准确率、74.25%的UAR、86.47%的灵敏度、62.04%的特异度及0.5082的MCC。这些结果证明了基于Transformer的模型在增强数据集支持下用于心血管疾病检测的有效性,突显了其在推进多模态与多通道心音分类方面的潜力。

0
下载
关闭预览

相关内容

【KDD2024】HiGPT:异构图语言模型
专知会员服务
19+阅读 · 2024年7月9日
专知会员服务
23+阅读 · 2020年9月8日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
VIP会员
相关VIP内容
【KDD2024】HiGPT:异构图语言模型
专知会员服务
19+阅读 · 2024年7月9日
专知会员服务
23+阅读 · 2020年9月8日
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员