肽积木CEO柏文洁:AI 医学影像的三大技术实战、优劣与经验

2017 年 12 月 12 日 AI掘金志 刘伟


AI掘金志出品

雷锋网旗下只报道“AI+传统”的内容频道


《未来医疗大讲堂——医学影像专题》第二期总结文:一个只给医疗AI从业者、影像科医生、名校师生、CFDA工作人员看的系列课程。


注:120分钟的视频信息量巨大,文字仅为冰山一角,强烈建议观看完整版视频,请点击阅读原文


近日,雷锋网AI掘金志邀请到了肽积木科技CEO柏文洁,为大家深入讲解《AI 医学影像的三大技术实战、优劣与经验》。


作为一名处在AI医学影像产业一线的管理者和算法研究者,柏文洁立足实践经验,在120分钟的分享里为500多位资深医疗人工智能专业人士剖析了医疗影像AI的实战方法与案例,并重点分析了分类网络、图像切割网络、GAN网络在医疗影像中的应用及其优缺点。


柏文洁指出,虽然从逻辑上理解,分类网络比较简单,但从解决问题的角度来说,分类问题是远期目标,短期内难以应用。病灶标识和视频跟踪并不直接对疾病进行判别,只是作为医生的一种辅助,相对容易实现,是AI应用的中期目标。


嘉宾介绍:


柏文洁


柏文洁,北京肽积木科技有限公司创始人&CEO,大数据领域的连续创业者,知名大数据公司信柏科技、时趣互动运营核心创始成员。AI算法工程师,独创的LP-NET算法在医疗影像病灶识别方面取得国际领先水平。


课程内容:


  • 医疗影像的常见应用问题以及我们应该怎么做


  • 医疗影像应用的深度学习解决方案


  • 分类网络在医疗影像中的应用、优缺点及拓展


  • 图像切割在医疗影像中的应用、优缺点及拓展


  • GAN网络的应用场景及思考 



以下文字为柏文洁课程节选:


医疗影像AI的发展现状


柏文洁指出,在普通民众看来,医疗AI应该能替代医生,但现有的深度学习算法主要还是对传统方案的优化,是一些新的工具。这些新的工具未来有可能发生质变,但还需要我们的共同努力。


AI医疗影像作为AI切入医疗的突破口,仍然只是传统医疗流程中的一部分,对医疗影像的判读是医生诊断治疗的参考依据之一。现有的AI医疗影像还无法构成一个闭环,完成对患者的诊断及治疗方案规划。因此AI必须先融入到医疗环节之中,才能提升医疗效率和降低成本。



目前绝大多数AI医疗影像创业公司都是技术背景出身,融入医疗环节相对比较困难,普遍会遭遇三个问题:


数据坎:一方面,创业公司通过和三甲医院合作获取的数据无法直接使用,面临数据标记的难题。另一方面,如果创业公司的产品没有融入到医院的业务流程中,就无法获得长期、持续、有效的数据。


渠道坎:CFDA认证是医疗行业的一道硬性门槛。虽然近期CFDA对医疗AI产品有逐步开放的趋势,但要通过认证还是非常困难的,而且过程十分漫长。没有CFDA认证,就无法形成稳定的营销渠道,也很难给渠道商足够的利润空间去推广产品。


硬件坎:在医疗场景中,很多时候AI必须结合硬件使用,而且也只有通过硬件,AI才能够获取相应的价值。目前很多人脸识别厂商已经开始做摄像头之类的硬件产品了。


从更高的维度来说,AI应用于诊断环节能够产生的社会价值是低于治疗环节的。医生最关注的还是如何更加高效地,以更低的成本治病救人。



尽管面临诸多挑战,但柏文洁认为AI在医疗行业的应用前景仍然是潜力无限的。现有的传统医疗环节中,可被AI提升和改造的地方非常多。如果我们能把AI的能力应用到这些场景中,将对整个行业产生极大的提升,正如大数据对对传统行业所产生的影响那样。


医疗影像应用的深度学习解决方案


柏文洁首先对AI在医疗影像中的应用进行了一番梳理。她介绍道,医疗影像主要有放射性影像(X光、CT、MRI、OCT等),超声、彩超检测,病理检测,内窥镜检测,高倍拍照(主要针对眼底、皮肤)等几种类型。



针对这些不同类型的医疗影像,又主要有分类、标记、切割和序列四种处理方式,它们分别对应的范围为图像、区域、像素和视频。以传统的CAD问题拓展出更好的结果,这是目前应用比较广的热点问题。



柏文洁认为,虽然从逻辑上理解,分类网络比较简单,但从解决问题的角度来说,分类问题是远期目标,短期内反而难以应用。因为我们最终要做的是判断患者有没有疾病,而现有的技术还很难对疾病进行非常准确的判别。


病灶标识和视频跟踪并不直接对疾病进行判别,只是作为医生的一种辅助,因此是AI应用的中期目标。


分类网络在医疗影像中的应用、优缺点及拓展


分类网络应用于医疗影像,优点非常明显——简单明确而且有很多预训练结果。基于这些结果可以做进一步的预训练和迁移学习。



与此同时,分类网络的缺点也很明显:


一、需要大量的数据。即使用迁移学习的方法,起码也需要数万量级的数据才能做分类。


二、针对小病灶的分类容易产生偏差。过去的分类模型都是对猫、狗等较大的物体进行分类,相对比较容易。


三、分类标注往往不具备客观性。如果有解剖金标准做为依据,分类是比较简单的,但在实际应用场景中,很多分类标准不具备客观性,而是受医生的个人情况和医院的知识传承影响。


四、可解释性差。在医生给出分类标准的前提下,算法的分类结果与医生可能存在一定的差异,无法令人信服。


图像切割的应用场景


柏文洁认为,图像切割是AI在医疗影像中应用最丰富的场景。因为医生在诊断和治疗过程中经常需要将病灶区域清楚地描绘出来,为后续提供指导意义和价值。但在一些特殊情况下——尤其是在一些X光片中,边界非常模糊无法进行图像切割,只好用物体识别的方法。


目前图像切割的主流做法有三种:编解码结构、孔洞卷积和条件随机场。其中Unet是最主流的网络之一,也是首个应用于医学案例的FCN网络,是深度学习用于图像切割的早期重要论文。



随着研究不断深入,Unet也取得了一些最新进展:


首先是大内核,它解决的核心问题是,在FCN的同时对多个物体进行切分,然后进行分类。这种情况下,小内核对整体信息的把握是不够的。


其次是PSPnet。PSPnet会把整张图切成四等份再做pooling,这样的好处是可以获取全局的信息。


MaskRCNN也是比较新的,它实际上整合了物体识别优势和方法。柏文洁表示很看好这种方法,正在积极探索其在医疗领域的具体应用方法。


Unet适用于边缘明确的组织和病灶,但它也存在一些不足:首先数据量严重不足,数据标记很难获取;其次病灶类别具有天然的不均衡性。网络上的很多公开数据库都是对数、汽车之类的物体进行分割,这类物体在图片中的占比很高,实践起来相对容易。但病灶在图片中的面积占比通常非常小。以眼底图像为例,用FCN直接训练眼底图,一不小心就可能训练成全阴性的网络。


GAN网络的应用场景


今年GAN网络十分火热,不停有人发布新的GAN网络。但GAN网络在医疗领域的应用目前还非常有限的。


柏文洁认为,GAN网络在医疗领域其实是有一些应用场景的,比如图像切割和增强样本。众所周知,GAN网络一半用于生成一半用于判别,比如我们可以用GAN网络生成图片的一部分或者一个眼镜。图像的标记本质上也是一种信息生成,在此基础上可以做后期溯源。



既然GAN网络可以生成图像和标记,那么是不是也可以生成更多的数据和病灶,解决数据不足的问题呢?


目前业界正在对GAN网络进行积极探索,可惜迄今为止在医疗领域尚未诞生特别有影响力的论文。用GAN网络生成的伪样本还缺少足够的实用价值。这主要是因为大家对于GAN网络内在机理的探索还不够。


学员部分问题


直播结束后,学员从不同维度提出27个问题,柏文洁对部分问题进行了耐心解答:


Q:目前市场上的糖网系统落地应用状况如何?落地过程中曾面临过哪些临床问题?


Q:如果使用核磁图像做特征提取,需要对核磁图像做哪些预处理?


Q:最近NIPS有没有推荐的优质AI医疗影像论文?


Q:从医院获取的图像中,经常有测量结节大小的“+”或“×”字标记,这种图像对训练网络有影响吗?


Q:在诸多医疗影像应用中,哪些是比较成熟的?CT、MRI、超声还是其他?

……


详细内容和精彩问答,欢迎点击阅读原文


登录查看更多
0

相关内容

医学影像是指为了医疗或医学研究,对人体或人体某部分,以非侵入方式取得内部组织影像的技术与处理过程,是一种逆问题的推论演算,即成因(活体组织的特性)是经由结果(观测影像信号)反推而来。
人机对抗智能技术
专知会员服务
201+阅读 · 2020年5月3日
《人工智能2020:落地挑战与应对 》56页pdf
专知会员服务
195+阅读 · 2020年3月8日
【大数据白皮书 2019】中国信息通信研究院
专知会员服务
137+阅读 · 2019年12月12日
 图像内容自动描述技术综述
专知会员服务
86+阅读 · 2019年11月17日
【综述】智能医疗综述,48页论文详述医学AI最新进展
专知会员服务
70+阅读 · 2019年9月1日
报名 | 清华大学“智慧医学影像论坛2018”
数据派THU
8+阅读 · 2018年6月27日
中科院赵地:深度学习在 4 大超声影像中的应用
AI掘金志
9+阅读 · 2017年12月17日
体素科技丁晓伟:医疗影像的哲学三问
机器之能
5+阅读 · 2017年11月25日
How to Fine-Tune BERT for Text Classification?
Arxiv
13+阅读 · 2019年5月14日
Arxiv
7+阅读 · 2018年5月23日
Arxiv
4+阅读 · 2018年4月30日
Arxiv
25+阅读 · 2018年1月24日
VIP会员
Top
微信扫码咨询专知VIP会员