资讯 | 天池大数据竞赛第一名,上海交通大学人工智能实验室如何用AI定位肺结节

2017 年 10 月 24 日 机器之心

机器之心发布

上海交通大学




癌症,犹如黑暗中的魔鬼,带给人们恐惧与绝望。而肺癌,在我国作为发病率、死亡率最高的一类癌症,伤害着无数家庭。在我国每年都有近 60 万人死于肺癌。然而,癌症的死亡率与首次发现癌症的时期紧密相关,早期肺结节筛查可以为无数人免去痛苦与折磨。上海交通大学人工智能实验室徐奕教授、倪冰冰教授、杨小康教授、朱禹萌同学等人与点内科技合作,利用深度学习搭建的肺结节自动定位筛查系统,能够有效检测肺 CT 影像中包含微小结节、磨玻璃等各类结节,并降低假阳性误诊的发生,实现「早发现,早诊断,早治疗,早痊愈」的愿望。该算法获得了天池大数据比赛的第一名,这个比赛吸引了全国两千多支参赛团队,总奖池高达百万,面向全社会各大医院、高校、公司、研究所参加。




团队利用计算机视觉领域卷积神经网络技术来解决肺结节检测问题,并在多个层面上进行创新。1)结合物体检测与分割算法提取候选结节,产生高召回率候选结节池。2)使用假阳性衰减网络,并采取多尺度集成学习的网络模型提高检测精度,衰减假阳性比例。3)在数据的处理上,采取生成对抗网络进行了数据增广,提高了训练的有效性。



算法框架如图


数据预处理


通过旋转平移等几何变换针对有限数量的正样本做数据多样性增广,类似于医生通过不同的视角、不同的上下文去分析结节区域,并利用生成对抗网络(GAN),从随机噪声中产生新的结节正样本,学习生成新形态的结节样本,深度增广数据的多样性,提升模型泛化能力。

 

结节预检测


建立 3D-Unet 网络结构,该分割网络主要功能是提取疑似候选结节,最大化敏感度,降低漏检率。 其网络输入三个维度的数据特征,可从多个 Z 轴维度「观察」,正如医生结合多个平面观察结节,从而充分学习肺内部正常纹理和非正常纹理的区别,捕捉到结节多样性特征,比如毛玻璃结节密度比周围略高、呈云雾状性,纯实性结节实性密度较高,类似单独分离的蛋黄等。


结节精检测


结节精检测采用三种模型分别预测候选结节概率,并根据模型间权重比例给出最终概率的方法。主要优势在于,负样本经历由易至难的学习过程,分割网络和后续假阳性衰减网络相辅相成。多结构类型的模型 Ensemble,且单一网络性能良好,类似于多个医生独立阅片的过程,综合给出阅片结果。


结果


这一算法在阿里云与英特尔联合举办的天池医疗 AI 大赛中大获全胜,以 0.732 的成绩从两千多组强劲队伍中脱颖而出,在比赛最为重要的复赛赛程中排名第一。


根据算法训练出的模型能够更好地处理不同形态的结节特征,达到很好的检测效果,在 400 例小结节测试数据上,FROC 曲线如图所示:




值得注意的是,该算法诊断 20 万张肺结节片需要 10 分钟,远远少于医生人工诊断的时间,在提升准确率的同时,节约了医生的时间,真正在诊断流程上做好了医生的助手。团队也将算法真正投入到上海各大医院进行试验与使用,嵌入医生诊断流程当中,真正造福患者。



本文为机器之心发布,转载请联系本公众号获得授权

✄------------------------------------------------

加入机器之心(全职记者/实习生):hr@jiqizhixin.com

投稿或寻求报道:content@jiqizhixin.com

广告&商务合作:bd@jiqizhixin.com

登录查看更多
3

相关内容

专知会员服务
116+阅读 · 2020年6月12日
少标签数据学习,54页ppt
专知会员服务
199+阅读 · 2020年5月22日
【天津大学】风格线条画生成技术综述
专知会员服务
34+阅读 · 2020年4月26日
专知会员服务
42+阅读 · 2020年2月20日
【大数据白皮书 2019】中国信息通信研究院
专知会员服务
138+阅读 · 2019年12月12日
为什么医学影像AI已进入「后深度学习时代」?
如何理解模型的过拟合与欠拟合,以及如何解决?
七月在线实验室
12+阅读 · 2019年4月23日
实战|基于图割算法的木材表面缺陷图像分析
全球人工智能
4+阅读 · 2018年4月23日
【消息】自动化所获计算机视觉大会ICCV2017场景解析竞赛冠军
中国科学院自动化研究所
5+阅读 · 2017年11月6日
【大数据】如何用大数据构建精准用户画像?
产业智能官
12+阅读 · 2017年9月21日
Seeing What a GAN Cannot Generate
Arxiv
8+阅读 · 2019年10月24日
Mesh R-CNN
Arxiv
4+阅读 · 2019年6月6日
Arxiv
5+阅读 · 2019年4月8日
Two Stream 3D Semantic Scene Completion
Arxiv
4+阅读 · 2018年7月16日
Arxiv
4+阅读 · 2017年11月4日
VIP会员
相关VIP内容
专知会员服务
116+阅读 · 2020年6月12日
少标签数据学习,54页ppt
专知会员服务
199+阅读 · 2020年5月22日
【天津大学】风格线条画生成技术综述
专知会员服务
34+阅读 · 2020年4月26日
专知会员服务
42+阅读 · 2020年2月20日
【大数据白皮书 2019】中国信息通信研究院
专知会员服务
138+阅读 · 2019年12月12日
Top
微信扫码咨询专知VIP会员