Recently, sound-based COVID-19 detection studies have shown great promise to achieve scalable and prompt digital pre-screening. However, there are still two unsolved issues hindering the practice. First, collected datasets for model training are often imbalanced, with a considerably smaller proportion of users tested positive, making it harder to learn representative and robust features. Second, deep learning models are generally overconfident in their predictions. Clinically, false predictions aggravate healthcare costs. Estimation of the uncertainty of screening would aid this. To handle these issues, we propose an ensemble framework where multiple deep learning models for sound-based COVID-19 detection are developed from different but balanced subsets from original data. As such, data are utilized more effectively compared to traditional up-sampling and down-sampling approaches: an AUC of 0.74 with a sensitivity of 0.68 and a specificity of 0.69 is achieved. Simultaneously, we estimate uncertainty from the disagreement across multiple models. It is shown that false predictions often yield higher uncertainty, enabling us to suggest the users with certainty higher than a threshold to repeat the audio test on their phones or to take clinical tests if digital diagnosis still fails. This study paves the way for a more robust sound-based COVID-19 automated screening system.


翻译:最近,基于声音的COVID-19检测研究显示,实现可扩展和迅速数字预检的极佳前景大有希望,然而,仍然存在两个阻碍这一做法的未解决的问题。首先,为模型培训收集的数据集往往不平衡,而为模型培训收集的数据集往往有相当小一部分的用户测试呈阳性,因此难以学习具有代表性和强健的特征。第二,深层次的学习模型在预测中通常过于自信。临床上,假预测会加剧保健费用。估计筛查的不确定性将有助于这一点。为了处理这些问题,我们提出了一个共同框架,在这个框架中,从原始数据的不同但平衡的子组中开发了多种基于声音的COVI-19检测的深层学习模型。由于这个框架,数据得到更有效的利用,与传统的上层和下层抽样方法相比:一个0.74的ACUC,其敏感性为0.68,其特性为0.69。同时,我们估计从多个模型之间的分歧中产生的不确定性会有所帮助。我们发现,假预测往往产生更高的不确定性,使我们能够建议用户在比门槛更高的程度上重复对手机进行稳健的自动测试,或者进行临床测试。

0
下载
关闭预览

相关内容

数据科学导论,54页ppt,Introduction to Data Science
专知会员服务
41+阅读 · 2020年7月27日
因果图,Causal Graphs,52页ppt
专知会员服务
246+阅读 · 2020年4月19日
机器学习相关资源(框架、库、软件)大列表
专知会员服务
39+阅读 · 2019年10月9日
【哈佛大学商学院课程Fall 2019】机器学习可解释性
专知会员服务
103+阅读 · 2019年10月9日
异常检测(Anomaly Detection)综述
极市平台
20+阅读 · 2020年10月24日
人脸检测库:libfacedetection
Python程序员
15+阅读 · 2019年3月22日
人工智能 | SCI期刊专刊信息3条
Call4Papers
5+阅读 · 2019年1月10日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
语义分割+视频分割开源代码集合
极市平台
35+阅读 · 2018年3月5日
动手写机器学习算法:异常检测 Anomaly Detection
七月在线实验室
11+阅读 · 2017年12月8日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Augmentation for small object detection
Arxiv
11+阅读 · 2019年2月19日
VIP会员
相关资讯
异常检测(Anomaly Detection)综述
极市平台
20+阅读 · 2020年10月24日
人脸检测库:libfacedetection
Python程序员
15+阅读 · 2019年3月22日
人工智能 | SCI期刊专刊信息3条
Call4Papers
5+阅读 · 2019年1月10日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
语义分割+视频分割开源代码集合
极市平台
35+阅读 · 2018年3月5日
动手写机器学习算法:异常检测 Anomaly Detection
七月在线实验室
11+阅读 · 2017年12月8日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Top
微信扫码咨询专知VIP会员