UNet作为卷积神经网络(CNN)中最重要的语义分割框架之一,广泛地应用于医学图像的分类、分割和目标检测等图像处理任务。对UNet的结构原理进行了阐述,并对基于UNet网络及变体模型进行了全面综述,从多个角度对模型算法进行了充分研究与分析,试图建立起各个模型间的演进规律。首先,将UNet变体模型根据其应用的七种医学成像系统的不同而进行分类研究,且将核心构成相似的算法进行了对比描述;其次,对每个模型的原理、优缺点和适用的场景等内容进行分析;再次,对主要UNet变体网络从结构原理、核心组成结构、数据集和评价指标四方面进行总结;最后,结合深度学习的最新进展,客观地描述了UNet网络结构存在的固有不足和解决方案,为未来继续改进提供了方向。同时,对UNet可结合的其他技术演进与应用场景等内容进行详述,进一步展望了基于UNet变体网络未来的发展趋势。
医学影像分析是一个涉及多个学科的研究领 域,例如数字图像处理和计算机图形学等,在医疗诊 断中扮演着重要角色。医学图像分析的目的是突出 图像中的某些特征信息并对其进行处理和分析,在 医疗手术计划、放射性治疗计划和解剖教学等方面 有着重要的应用。医学影像学在近 20年中得到了快 速的发展,帮助临床医生清晰、直接且快速地观察人 体的病变部位。准确度、精确度、召回率、灵敏度和 特异性等重要参数在评估中至关重要,这些评价指 标在医学图像分析中具有很高的价值。 因为医学影像技术在临床诊疗中发挥出色,所 以作为医学图像分析中的重要环节的医学图像分 割,能否准确地分割图像则变得尤为关键。医学图 像分割的过程是在病灶图像中提取被分割器官的特 征,将感兴趣的区域从周围环境中提取出来并分析 其物理和病理信息,为疾病的诊断提供强有力的保 障。在医学图像分割方法的发展进程中,形成了许 多分割算法,例如基于边缘检测的分割算法、基于灰 度阈值的分割算法和基于区域的分水岭分割算法 等。然而,在面对大型图像或者大量数据时,传统的 分割算法暴露了内存空间占用多、计算量大、效率低 下和特征提取能力弱等缺陷。因此,随着计算机硬 件性能的快速提升,基于深度学习的分割算法被广 泛研究,在图像处理任务中展现出强大的计算能 力。图像分割中引入深度学习的方法,不仅可以提 高图像分割的准确性,而且为定量分析和三维可视 化等研究奠定了坚实的基础。 深度学习在医学图像分割中的应用价值巨大, 借助深度学习的超高性能,基于深度学习的医学图 像分割算法可以轻松应对不同模式的医学影像。在 高效处理大量数据和提取相关特征的过程中,使用深 度学习方法的主要优点之一是它的天然能力:(1)可 以直接学习原始数据中具有特殊意义的部分并提取 相关特征;(2)深度学习框架是由多个处理层组成的 计算模型,不同的层用于学习不同层次的数据结构 中的抽象表示;(3)具有强大的特征提取能力,可以 完全取代手动注释数据的方式。 基于深度学习的语义分割方法提供了最先进的 分割性能,成功地应用于医学图像分类、检测和分割 等任务中。UNet作为医学图像语义分割领域中最受 欢迎的深度学习框架,在 2015 年 ISBI 细胞跟踪挑战 赛中展示出了最为先进的性能。UNet卷积神经网络 是最具代表性的算法之一,在医学图像分析中发挥 着举足轻重的作用。 UNet 网络是应用广泛的分割模型,基于对称的 收缩路径和扩展路径并在两个路径之间使用跳跃连 接构成体系结构,在解决图像到图像的映射任务中 有显著效果,UNet 的网络结构如图 1 所示。UNet 网 络最初是由 Ronneberger等人[1]为细胞分割任务提出, 这种对称的模型结构将图像从高维度转变到低维 度,对大小不变的图像进行降维处理,使其大小符合 对应的显示区域。在收缩路径中,模型获取图像作 为输入并应用多个 3×3 卷积、最大池化和 ReLU 激活 函数,将收缩路径中获得特征图的通道数以二倍的 规律逐步扩大,旨在提取更详细的图像特征。在扩 展路径中,网络使用转置卷积运算从图像中解码特 征信息并产生图像的分割蒙版,其余的操作与收缩 路径中的操作类似。与普通的具有收缩路径和扩展 路径的网络模型的不同之处在于 UNet网络使用了跳 跃连接,对称路径间的一组跳跃连接允许在输出图 像中进行精确定位。通过裁剪和复制操作将收缩路 径中的低分辨率图层与扩展路径中获得高分辨率图 层进行融合,使丰富的上下文信息传播到更高分辨 率的层中,帮助网络捕捉更清晰的图像细节,得到更 精准的输出图像。此外,UNet 网络允许分割任意大 小的图像,适用于各种生物医学图像分割的任务。 UNet 模型由于其灵活性、优化的模块化设计和 在所有的医学图像模式中的成功,成为最广泛应用 的图像分割结构之一。多年来,UNet 模型获得了学 术界和工业界的广泛关注。张欢等人[2]对 UNet 网络 的基本结构和原理进行描述,同时对众多 UNet 变体 算法从结构和非结构改进的两方面进行总结,但是 其关注的病灶种类仅局限于肺结节、肝脏和视网膜 血管等五种病灶器官,未能全面评述 UNet 网络在其 他重要病灶器官中的应用。文献[3]以输入图像的种 类对相关文献进行分类,缺乏近几年最新的研究成 果,对 UNet 模型最新的发展方向和突破缺乏准确的 把握。
为了解决上述问题,本文综述涵盖了近几年 关于 UNet变体网络用于医学图像分割任务的最新进 展。从多个方面对算法进行了广泛的回顾和阐述,包括 UNet 及其变体网络原理、基本思想和模型架构 组成,并在文章中对重要模型从分割对象、改进的核 心结构、数据集和度量指标的提升四方面进行详细 总结。本文从算法应用的医学成像系统的不同对文 献进行分类总结,将评述的算法模型划分为计算机 断层扫描(computed tomography,CT)、核磁共振图像 (magnetic resonance imaging,MRI)、超声(ultrasound, US)、正电子发射断层扫描(positron emission computed tomography,PET)、光学相干断层扫描(optical coherence tomography,OCT)、电子显微镜(electron microscope, EM)和 X 射线(X-Ray)七大类,此种分类方法成功地 从技术层面完成了对 UNet变体网络在医学图像分割 中成功经验的全面综述,克服了从病灶角度进行综 述难以全面的缺陷。图 2 以宏观的方式对本文的分 类方法中主要模型进行展示,将内部模型或机制相 同的算法放在同组进行总结,更好地探讨 UNet 模型 改进的方式和特点。此外,在同一种成像系统中的 不同分割模型在算法实现中具有很高的相似性,本 文借助此分类方法的优势试图从算法的相似性中探 求模型改进的方向和思路,为建立可以高效分割多 种病灶的分割框架提供更多的理论支撑。