聚焦前沿 | 深度学习在医疗健康领域的应用

聚焦前沿 | 深度学习在医疗健康领域的应用

​导读

临床医学在临床过程中收集各种医学证据,对疾病进行确诊和治疗。通过智力对各种医学证据的处理是关键,这种智力的输出逐渐由人脑转为机器。当前深度学习已经广泛应用于语音识别、图像识别及自动驾驶,今天小编带领大家了解深度学习在健康医疗领域的应用。

什么是深度学习?

深度学习(Deep Learning,DL)属于机器学习(Machine Learning,ML)的子类。它的灵感来源于人类大脑的工作方式,是利用深度神经网络来解决特征表达的一种学习过程。深度神经网络包含多个隐含层的神经网络结构。这些层通常按顺序排列,并由大量原始的非线性运算组成,这样就可以将一层的表示(从原始数据输入开始)输入到下一层,并转换为更简要的表示。当数据流过系统的各个层时,输入空间将迭代扭曲,直到数据点变得可区分为止。为了提高深层神经网络的训练效果,人们对神经元的连接方法以及激活函数等方面做出了调整。其目的在于建立、模拟人脑进行分析学习的神经网络,模仿人脑的机制来解释数据,如文本、图像、声音。




深度学习又分为卷积神经网络(Convolutional neural networks,CNNs)和循环神经网络(Recurrent neural networks,RNNs)。其主要的思想就是模拟人的神经元,每个神经元接受到信息,处理完后传递给与之相邻的所有神经元即可。处理方式如下图:




深度学习模型可扩展到大型数据集,并且会随着更多数据的积累而不断完善,从而使其优于许多传统的机器学习方法。深度学习系统可以接受多种数据类型作为输入,医疗数据就是具有明显的多种数据类型。最常见的模型是使用监督学习进行训练,其中数据集由输入数据点(例如皮肤病变图像)和相应的输出数据标签(例如“良性”或“恶性”)组成。




深度学习用于计算机视觉

计算机视觉(Computer vision,CV) 是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等,主要的任务分别为图像分类/定位、目标检测、目标跟踪、语义分割以及实例分割。医学方面,在判断病人的x光片是否含有恶性肿瘤时非常有用。卷积神经网络(Convolutional neural networks,CNNs)就是设计来用来处理此类具有自然空间不变性的数据(如图像)。

可以采用CNN进行各种医学图像的训练,包括放射线医学,病理学,皮肤病学和眼科医学等数据。如下图,信息流从左到右, CNN会采用简单的操作(例如卷积,池化和全连接)来获取输入图像并将其顺序转换为扁平的向量,最终输出向量(softmax层)的元素表示疾病发生概率。在训练过程中,网络层的内部参数会不断进行迭代调整以提高准确性。通常,较低的层(左)学习简单的图像特征(边缘和基本形状),这些特征会影响高层(右)。预测任务包括图像分类(即恶性与良性)以及医学特征(例如肿瘤)的定位。

局限性:1、缺乏足够的临床信息,仅能根据图像进行诊断。在实际工作中,应参考更多的可用信息,如患病史,健康记录,附加检测、患者口述等;2、建立一个监督深度学习系统需要足够大的标签数据集,小规模且带标签的数据集易于收集,但建立的算法性能较差。

深度学习用于自然语言处理

自然语言处理(Natural language processing,NLP)就是用计算机来处理、理解以及运用人类语言(如中文、英文等)。在医疗保健中,深度学习和语言技术在电子病历(Electronic health records,EHR)等领域发挥重要作用。电子病历正在迅速普及,大型医疗机构在过去十年中已经收集超过1000万患者的电子病历,单单住院一次通常会产生约150,000条数据。这些数据包含了巨大的潜在价值。因此,将深度学习方法应用于EHR数据能快速、高效的挖掘其中存在的价值。

循环神经网络(Recurrent neural network,RNN)是深度学习算法之一,它可有效处理顺序输入,例如语言,语音和时间序列数据,在自然语言处理领域发挥重要作用。下图概述了构建EHR的深度学习系统的技术步骤:1、未结构化的HER数据,多个医疗结构收集的病历以特殊的数据结构和格式存储;2、数据标准化,将来自多个医疗结构的数据标准化为同类格式;3、数据排序,将所有数据按时间顺序排序到患者时间轴中,然后将基于时间的深度学习技术应用于整个EHR数据集建立预测模型,最终实现对单个患者进行预测和推断出一些医学问题的答案,例如“过去的哪些经历与患者当前的诊断有关?”,“患者的当前问题清单是什么?”和“有哪些机会能进行干预”?


局限性:有限的结构化数据集,包括实验室结果,生命体征,诊断书和人口统计信息。

深度强化学习用于机器人辅助手术

强化学习(Reinforcement learning, RL),又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(Agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。强化学习把学习看作试探评价过程,Agent选择一个动作用于环境,环境接受该动作后状态发生变化,同时产生一个强化信号(奖或惩)反馈给Agent,Agent根据强化信号和环境当前状态再选择下一个动作,选择的原则是使受到正强化(奖)的概率增大。选择的动作不仅影响立即强化值,而且影响环境下一时刻的状态及最终的强化值。强化学习系统学习的目标是动态地调整参数,以达到强化信号最大。

在医疗领域中,深度强化学习可用应用到机器人辅助手术(Robotic-assisted surgery,RAS)。通过专家指导直接学习(即模仿学习)来预测专家的行为,或者通过推断专家的目标(即反向RL)来实现从专家演示中学习。目前,RAS在很大程度上取决于外科医生以遥控方式引导机器人的器械。此外,可以通过使用计算机视觉模型(如CNN)感知手术环境和RL方法来深度学习外科医生的肢体动作从而增强机器人辅助手术的鲁棒性和适应性。

挑战:1、手术现场附近正确定位器械的位置和方向,需要开发最新高像素仪器分割技术;2、深度模仿学习需要大量的训练数据集,每个手术动作都有很多示例。鉴于许多手术都是细微而独特的,因此仍然难以收集足够的数据用于更一般的手术任务。此外,自动化系统难以适应与以前所见的任何事物高度不同的和完全未知和不可观察的情况,例如异常的外科手术事故。

广义深度学习用于医学研究

除了CV,NLP和RL任务外,深度学习还适用于需要细化输入数据并需要专门处理的领域。深度学习已超越常规方法(例如,基于CNN或RNN的)而适用于独特的数据表示形式(非图像,非时间),例如基因组学领域。现代基因组技术收集了各种各样的测量数据,从个人的DNA序列到血液中各种蛋白质的含量。深度学习有很多机会改进用于分析这些度量的方法,最终将帮助临床医生提供更准确的治疗和诊断。用于构建基因组深度学习系统的典型分析流程主要包括:获取原始数据(例如基因表达数据),将原始数据转换为输入数据张量,然后通过神经网络提供这些张量,然后为特定的生物医学应用提供支撑。


全基因组关联研究(Genome-Wide Association Studies,GWAS)就是一个很好的示例,它是指在全基因组层面上,开展多中心、大样本、反复验证的基因与疾病的关联研究,是通过对大规模的群体DNA样本进行全基因组高密度遗传标记(如SNP或CNV等)分型,从而寻找与复杂疾病相关的遗传因素的研究方法,全面揭示疾病发生、发展与治疗相关的遗传基因。因此,GWAS需要算法可扩展到非常大的患者队列,并处理潜在的混杂因素。这些挑战就可以通过针对深度学习开发的优化工具和技术以及通过处理看不见的混杂因素的建模技术来解决。将来,如果将外部环境因素和其他来源的生物学数据(例如医学图像或RNA剪接和其他中间分子表型的测量指标)整合到GWAS模型中也可能会使深度学习能更准确地识别与疾病相关的因果突变。


展望

机器学习在遗传数据的表型预测中发挥着作用,包括复杂的特征,例如身高和疾病风险。深度学习可以通过整合其他方式(例如医学图像,临床病史和可穿戴设备数据)进一步增强此类模型。未来,在深度学习、可穿戴传感器、物联网、临床检测、基因组等技术共同推动下,医疗大数据让精准医疗成为可能。

发布于 2020-10-20 11:08