https://hdl.handle.net/11245.1/595f9cb7-1e44-4775-989f-f08e9897afe6
这篇论文重新审视了深度学习的基本组成部分,并评估了其在医学图像分析中的应用。论文指出,深度学习在该领域存在三大主要挑战:专家知识的整合、未标记数据的利用和预测不确定性的估计。论文的结构分为几个部分,分别解决这些挑战。
在第一部分,论文介绍了一种新的深度学习模型,该模型通过旋转-反射等变性整合专家知识,以提高医学影像任务的准确性和鲁棒性,特别是在组织病理学切片中转移性组织的检测上。所提出的模型优于传统的卷积神经网络(CNN)架构,并且对输入扰动表现出鲁棒性。接下来,论文探讨了如何激励深度学习社区关注现实世界的医学问题,提出了PCam数据集,该数据集来源于Camelyon16挑战赛。PCam数据集的结构类似于常见的深度学习基准测试,证明了在该数据集上的改进可以转化为在更大规模的Camelyon16基准测试上的改进。 第二部分探讨了通过对比预测编码(Contrastive Predictive Coding, CPC)进行自监督表示学习的好处,并提出了对比扰动预测编码(Contrastive Perturbative Predictive Coding, C2PC),通过整合特定的医学影像增强方法提升了CPC的性能。
第三部分解决了预测不确定性估计的挑战,这对高风险医学决策至关重要。论文介绍了一种新的变分推断方法,该方法利用多项式分布在量化潜变量上的特性。所提出的方法在不确定性估计和风险评估方面表现出与现有方法竞争的性能。
论文总结认为,通过解决上述挑战,深度学习可以更好地适用于医学影像任务。论文展示了专家知识可以有效地整合到深度学习模型中,利用未标记数据进行自监督学习可以提高模型性能,预测不确定性可以通过更灵活的变分推断方法得到改进。