风险模型对于护理计划和疾病预防至关重要。已有的临床模型表现不佳,引起了广泛的关注和担忧。一个准确、可解释、可靠的风险模型将会带来巨大的益处,但其仍是一项挑战。本论文旨在开发深度学习模型,利用大规模且具有代表性的电子健康记录(EHR)数据集,以提供更准确的风险预测,同时提供不确定性估计和医学解释的能力。 在这篇论文中,我们研究了三个方向:风险预测、解释性以及不确定性估计。对于风险预测,我们研究了可以将最少处理的电子健康记录(EHR)纳入模型的深度学习工具,并与已建立的机器学习和临床模型进行了全面比较。另外,我们将事后解释应用于深度学习模型以获取医学信息,特别关注风险关联和反事实推理的解释。我们使用概率建模技术定性地研究了不确定性估计。我们的分析依赖于临床实践研究链接,该链接包含来自初级护理、二级护理和死亡登记的匿名化EHR,并代表了英国人口。
我们引入了一种名为BEHRT的深度学习模型,可以将最少处理的电子健康记录(EHR)纳入风险预测。在没有专家参与的情况下,它学习了有意义的表示,可以自动聚类高度相关的疾病。与依赖于专家选择的预测因子的已建立的机器学习和临床模型相比,我们提出的深度学习模型在广泛的风险预测任务中表现出优越的性能,并强调了当将风险模型应用于具有严重先前分布偏移的人群时,需要重新校准的必要性,以及定期更新模型以在时间数据偏移下保持模型的区分性能的重要性。此外,我们还显示出深度学习模型解释是发现风险因素的绝佳工具。通过解释深度学习模型,我们不仅发现了与已有证据高度一致的因素,也发现了那些在专家驱动的研究中尚未考虑的因素。此外,深度学习模型还捕获了风险和治疗风险之间的相互作用,以及药物在不同年份的差异性关联,如果在建模中没有包含时间背景,这将会很困难。除了关联性解释外,我们还引入了一个框架,可以在假设干预下实现准确的风险预测,同时进行反事实推理。这提供了反事实解释,可以为临床医生选择最能受益的人提供参考。我们使用两个示例性的案例研究展示了所提出框架的益处。此外,将确定性深度学习模型转换为概率模型可以带有不确定性范围的预测。我们表明,这样的信息在实践中有许多潜在的影响,如量化决策的信心,指示数据的不足,区分正确和错误的预测,以及指示风险关联。 深度学习模型在风险预测方面的性能得到了大幅度的提升。不确定性估计的能力可以量化风险预测的信心,进一步指导临床决策。深度学习模型的解释可以产生假设以指导医学研究,并提供反事实分析以协助临床决策。这些鼓舞人心的证据支持将深度学习方法引入电子健康记录的巨大潜力,以指导如护理计划、疾病预防和医学研究设计等广泛的健康应用。
牛津大学是一所英国研究型大学,也是罗素大学集团、英国“G5超级精英大学”,欧洲顶尖大学科英布拉集团、欧洲研究型大学联盟的核心成员。牛津大学培养了众多社会名人,包括了27位英国首相、60位诺贝尔奖得主以及数十位世界各国的皇室成员和政治领袖。2016年9月,泰晤士高等教育发布了2016-2017年度世界大学排名,其中牛津大学排名第一。