论文阅读！kaggle比赛第一名--肺癌自动诊断系统

会员服务 ·

论文阅读！kaggle比赛第一名--肺癌自动诊断系统

2018 年 5 月 30 日 全球人工智能

高薪招聘兼职AI讲师和AI助教！

加入高端数字货币投资者群！

简介

根据CT图像的肺癌自动诊断系统包含以下步骤：

检测所有可疑病变；
评估整个肺部的恶性程度。

但目前大多数的研究主要集中于第一步，以及通过肺结节诊断肺癌存在较高的假阳性率。因此，肺癌的诊断需要对每个可疑结节进行细致分析，再联合所有结节信息进行定性诊断。针对上述问题，本文提出了一个三维深度神经网络（3D deep neural network）用于解决这些问题。该网络由两部分组成：

用于结节检测的3D region proposal network；
基于置信检测（the detection confidence）选出top-5结节并评估其癌症可能性，最后将此概率与Leaky noisy-or模型相结合评估患者患癌的可能性。

其中，上述两个模型均采用修改后的U-net模型，并使用数据增强操作避免过拟合问题。

数据集和预处理

数据集

训练集由LUNA16数据集（the Lung Nodule Analysis 2016）和NDSB3（Data Science Bowl 2017）数据集两部分组成。其中，LUNA16数据集含有888个病例，标记了1186个肺结节；在NDSB3数据集中，1397个病例用于训练，198个病例用于验证，506个病例用于测试，且人工标注了训练集中754个结节和验证集中78个结节。

对于LUNA16数据集，其存在许多较小的注释结节，且临床经验认为直径6mm以下的肺结节无危险。但在NDSB3数据集中，存在较多的大直径结节且结节多与主支气管相连。因此，针对两个数据集的差异，需去除LUNA16数据集中直径6mm的结节，同时对NDSB3数据集进行人工标注。

此处说明了Julian de Wit的解决方案中，直接设置结节直径为6mm的原因，以及为何需对NDSB3数据集进行人工标注。

上图为结节分布情况图。其中，图a为DSB（NDSB3）与LUNA（LUNA16）数据集中结节直径分布情况；图b为DSB数据集中患癌患者与健康人群的最大结节直径分布情况。

预处理

首先将所有的原始数据转变为HU值，如下图a所示，再进行如下步骤：

掩膜提取：在2D切片上，首先使用标准差为1的高斯滤波和阈值为-600的处理得到肺部以及周围较暗部分的掩膜，如上图b所示，然后进行连通性分析去除小于30mm²的connected component和离心率大于0.99的部分（some high-luminance radial imaging noise），再计算得到二值的3D矩阵中所有的3D connected component，且仅保留非边缘部分（用于去除肺部周围较暗的部分）以及体积在0.68~7.5L之间的部分，结果如上图c所示；
凸包与扩张：若结节与肺的外壁相连，则其将不会出现在上述提取的掩膜中。因此，对于这种情况，首先将肺部分为左右两个部分，即左肺与右肺，如上图d所示。然后分别对左右肺进行凸包处理，并向外扩张10像素，如上图f所示。但对于一些2D切片而言，肺部的底部类似与月牙形，如下图所示。若对于该类型进行凸包处理后，面积大于初始的1.5倍，则放弃凸包，从而避免引入过多的其他组织；
灰度标准化：将HU值（[-1200, 600]）线性变换至0~255内的灰度值，且掩膜以外的像素灰度值均设为170，以及扩张区域内的像素灰度值高于210则也设为170。

用于结节检测的3D卷积神经网络

该网络是基于U-net的3D版RPN（Region Proposal Network）模型。

输入数据

受限于显存，输入数据大小为128×128×128×1（Height×Length×Width×Channel），并随机选择两种patch：一种为70%的输入数据至少包含一个结节；另一种为30%的输入数据不含结节。其中，patch超出图像部分用灰度值为170填充。

为了避免过拟合问题，数据采用数据增强方法。

从输入数据大小可看出，本文作者采用的显卡为专业卡，其显存大。鉴于此，可根据实际情况将输入数据大小调整为64或者32。

网络结构

网络由前馈路径和反馈路径组成，如下图图a所示。

前馈路径

以两层卷积核为2×2×2的卷积（channel为24）开始，且padding为1；其后为4个残差块，其中每个残差块由3个残差单元组成（如上图图b所示），而每个残差单元由卷积、Batch Norm、ReLU激活函数、卷积和Batch Norm组成，且卷积核大小均为3×3×3。除此之外，每个残差块均有一个最大池化层，大小为2×2×2，步长为2。

反馈路径

反馈路径由两层反卷积（装置卷积）层和两个融合单元构成。最后，由卷积核均为1×1×1且channel为64和15的两层卷积层将数据大小转换为32×32×32×15。

反卷积层

卷积核大小为2，步长为2。

注意该部分的代码实现部分，原始U-net网络设置为不可学习。

融合单元

每个融合单元（如上图图c所示）均由一个前馈blob和反馈blob组成，其结果作为残差块的输入。

值得注意的一点，本文作者在此处引入了位置信息，作为额外的输入数据。

位置信息

proposal的位置信息可能影响是否为结节和是否为恶性的判断，因而引入位置信息。

具体方法：对于每个patch，计算其相对位置坐标，并将其大小转换为32×32×32×3。

其中，位置坐标对应归一化后的X，Y和Z轴（每个轴的取值范围为-1~1，对应于肺的两端）。

输出层

输出数据为4D的tensor，32×32×32×3×5，其中3表示anchor个数，5表示回归量（即概率，三维坐标和bounding box直径大小）。

其中，对于概率这一参数的激活函数采用sigmoid函数，其余不使用任何激活函数。

损失函数

真值标签为(G_x, G_y, G_z, G_r)，每个anchor记为(A_x, A_y, A_z, A_r)，IoU（Intersection over Unit）大于0.5记为Positive，小于0.02记为False，其他在训练过程中忽略。

分类损失为：

其中，p为anchor box的真值标签。

bounding box回归标签为：

回归总损失为：

其中，S为smoothed L1-norm函数：

对于每个anchor box的损失函数为：

最后，整体的anchor box的损失函数为anchor box的损失值取平均。

正反例数据

正例数据

对于大结节而言，网络会生成较多的positive anchor box，因此为了降低训练数据之间的相关性，随机挑选其中一个。

由于结节直径大小分布不均，而NDSB3数据集多为大结节，因而对大于30mm和40mm的结节，采样频率分别是其他结节的2倍和6倍。

此处对于NDSB3竞赛得分有利，实际是否可行有待商榷。

反例数据

对于一些易误诊为结节的反例数据，通过使用hard negative mining方法解决。

具体方法为：

将不同的patch输入至网络得到不同置信度的输出映射；
随机选择N个反例数据构成候选池；
侯选池中的数据以置信度值大小排序，且选出top-n的数据作为反例数据。

未选中的数据忽略且不参与损失计算。

此处可借鉴该方法，尽可能降低假阳性率，以及加速模型训练。

图像分割（测试过程）

输入数据大小为208×208×208×1，overlap为32像素。

输出数据为{x_i, y_i, z_i, r_i, p_i}，其中x_i, y_i, z_i表示proposal中心坐标，r_i表示其半径大小，p_i表示其置信度。

输出数据且使用非极大值抑制操作来去除overlaping proposal。

肿瘤分类

由于受限于训练样本数，因而复用结节检测器阶段的N-net网络。

输入数据为结节的proposal，大小均为96×96×96×1，其仅使用了结节中心点的信息。在分类器训练阶段，随机挑选proposal，且其选中的概率与proposal的置信度成正比；在测试阶段，只挑选top-5的proposal。

经卷积核为24×24×24×128的最后一个卷积层得到输出结果；随后提取每个proposal中心处2×2×2的体素，并将其通过最大池化操作后得到128维的特征，如下图图a所示。

对比四种预测肿瘤类别的方法（Feature combining method，MaxP method，Noisy-or method和Leaky Noisy-or method），挑选出Leaky Noisy-or方法作为最终的分类方法，如下图图b所示。

Leaky Noisy-or Method

引入一个假想结节，其患癌概率为P_d，P_d的值在模型训练阶段学习获得。

将特征输入至两层相同的Perceptron得到分类概率P：

其中，P_i表示第i个结节癌变的概率。

训练过程

损失函数为交叉熵函数。为了避免过拟合采用了数据增强和正则化操作。

训练的步骤：

transfer检测器训练参数后，再训练分类器；
采用gradient clipping方法训练分类器，随后存储BN（Batch Normalization）参数；
用存储的BN参数和gradient clipping方法交替训练检测器和分类器。

注：BN在训练阶段和测试阶段所计算的方法有所差异。因复用N-net网络，分类器和检测器交替训练，因而需对BN的参数做特殊处理。

原文链接：https://www.jianshu.com/p/50158f8daf0d

- 加入AI学院学习 -

点击“ 阅读原文 ”进入学习

登录查看更多

相关内容

自动诊断

关注 0

最新《医学图像深度语义分割》综述论文

专知会员服务

97+阅读 · 2020年6月7日

YOLOv4 重磅来袭！俄罗斯小哥带来新一代快速高效检测器

专知会员服务

32+阅读 · 2020年4月24日

【南洋理工】三维深度学习医学图像处理综述，13页pdf，

专知会员服务

77+阅读 · 2020年4月6日

北航发布「深度学习人群计数」2020综述论文，220+基于CNN的密度估计和人群计数的方法大调研

专知会员服务

41+阅读 · 2020年4月1日

【马老师推荐】阿里巴巴-浙江大学医学院附属第一医院《新冠肺炎防治手册》

专知会员服务

19+阅读 · 2020年3月23日

【CVPR2020-阿里巴巴】CPR-GCN:冠状动脉自动解剖标记中的条件部分残差图卷积网络

专知会员服务

22+阅读 · 2020年3月22日

【经典书】Python数据数据分析第二版，541页pdf

专知会员服务

197+阅读 · 2020年3月12日

新型冠状病毒肺炎流行病学特征的最新认识

专知会员服务

29+阅读 · 2020年3月6日

深度学习用于新冠肺炎CT诊断表现如何？武大人民医院medRxiv论文揭示：诊断性能比肩医师，而用时少，大有可为

专知会员服务

26+阅读 · 2020年2月29日

【华侨大学】基于混合深度学习算法的疾病预测模型

专知会员服务

97+阅读 · 2020年1月21日

开源数据集和代码，深度学习实践：在X光图像中检测新型冠状病毒肺炎

极市平台

41+阅读 · 2020年3月19日

2019 ASCO中国之声| POLARIS-02研究：特瑞普利单抗治疗复发转移性鼻咽癌再创佳绩

肿瘤资讯

13+阅读 · 2019年6月2日

乳腺癌内分泌高峰论坛：李俊杰教授深度解析STEPP分析

肿瘤资讯

10+阅读 · 2019年3月5日

【Nature子刊新论文】依图科技等71位中外学者打造“人工智能儿科疾病诊断系统“，准确率90%，超人类医师

专知

7+阅读 · 2019年2月13日

用机器学习预测谁将夺得世界杯冠军？附完整代码！

CSDN

4+阅读 · 2018年6月14日

登上《Cell》封面的AI医疗影像诊断系统：机器之心专访UCSD张康教授

机器之心

7+阅读 · 2018年4月1日

实战｜手把手教你实现图象边缘检测！

全球人工智能

10+阅读 · 2018年1月19日

论文解析 | Google如何用CNN检查乳腺癌？

AI100

4+阅读 · 2017年12月21日

全球肝脏肿瘤病灶区CT图像分割挑战大赛，联想E-Health夺得冠军

新智元

10+阅读 · 2017年9月22日

【Kaggle冠军分享】图像识别和分类竞赛，数据增强及优化算法

新智元

8+阅读 · 2017年7月9日

LadderNet: Multi-path networks based on U-Net for medical image segmentation

Arxiv

7+阅读 · 2019年8月28日

DC-SPP-YOLO: Dense Connection and Spatial Pyramid Pooling Based YOLO for Object Detection

Arxiv

3+阅读 · 2019年3月20日

FocusNet: An attention-based Fully Convolutional Network for Medical Image Segmentation

Arxiv

8+阅读 · 2019年2月8日

MDU-Net: Multi-scale Densely Connected U-Net for biomedical image segmentation

Arxiv

10+阅读 · 2018年12月4日

Knowledge Based Machine Reading Comprehension

Arxiv

4+阅读 · 2018年9月12日

Test-time augmentation with uncertainty estimation for deep learning-based medical image segmentation

Arxiv

4+阅读 · 2018年7月19日

Baselines and test data for cross-lingual inference

Arxiv

3+阅读 · 2018年3月2日

Multimodal Explanations: Justifying Decisions and Pointing to the Evidence

Arxiv

7+阅读 · 2018年2月15日

TernausNet: U-Net with VGG11 Encoder Pre-Trained on ImageNet for Image Segmentation

Arxiv

5+阅读 · 2018年1月17日

Joint Optic Disc and Cup Segmentation Based on Multi-label Deep Network and Polar Transformation

Arxiv

6+阅读 · 2018年1月11日

VIP会员