深度学习是人工智能的一个分支学科,它使用一种名为人工神经网络的机器学习技术,从大型数据集中提取模式并做出预测。深度学习在医疗保健领域的日益普及,以及高度特征的癌症数据集的可用性,加速了深度学习在复杂癌症生物学分析中的应用研究。虽然早期的结果很有希望,但这是一个快速发展的领域,癌症生物学和深度学习领域都出现了新知识。在这篇综述中,我们概述了新兴的深度学习技术以及它们是如何应用于肿瘤学的。我们专注于组学数据类型的深度学习应用,包括基因组、甲基化和转录组数据,以及基于组织病理学的基因组推断,并提供了如何集成不同数据类型以开发决策支持工具的观点。我们提供了具体的例子,如何深度学习可以应用于癌症诊断,预后和治疗管理。我们还评估了深度学习在精确肿瘤学中的应用目前的局限性和挑战,包括缺乏表型丰富的数据和需要更多解释的深度学习模型。最后,我们讨论了如何克服目前的障碍,从而使深度学习在未来的临床应用成为可能。
人工智能(AI)包含多种技术,其共同目标是计算模拟人类智能。机器学习(ML)是人工智能的一个分支,专注于通过使用数学算法识别数据中的模式来进行预测。深度学习(DL)是ML的一个亚组,专注于利用受大脑神经结构启发的多层神经网络算法进行预测。与其他ML方法(如逻辑回归)相比,DL的神经网络架构使模型能够随着数据[1]的数量和维数的增长呈指数级伸缩。这使得DL特别适用于解决复杂的计算问题,如大规模图像分类、自然语言处理、语音识别和翻译[1]。
由于包括基因组、转录组和组织病理学数据在内的多种数据类型的可用性和整合性不断增加,癌症护理正在向精准医疗转变(图1)。用于转化研究或临床任务的多种高维数据类型的使用和解释需要大量的时间和专业知识。此外,多个数据类型的集成比单个数据类型的解释更占用资源,并且需要能够从大量复杂特征中学习的建模算法。使用ML算法来自动化这些任务并帮助癌症检测(识别癌症的存在)和诊断(表征癌症)已经变得越来越普遍[2,3]。令人兴奋的是,DL模型有潜力利用这种复杂性来提供有意义的见解,并从多种数据类型中识别相关的粒度特征[4,5]。本文综述了深度学习在癌症诊断、预后和治疗选择方面的最新应用。我们专注于组学和组织病理学数据的DL应用,以及多种数据类型的集成。我们提供了一个简短的介绍新兴DL方法相关的应用程序涵盖在这一综述。接下来,我们将讨论DL在肿瘤学中的具体应用,包括肿瘤起源检测、分子亚型鉴定、预后和生存能力预测、基因组性状的组织学推断、肿瘤微环境分析以及未来在空间转录组学、宏基因组学和药物基因组学中的应用。我们总结了目前的挑战和潜在的策略,使DL在临床环境中常规应用。