肽积木CEO柏文洁：AI 医学影像的三大技术实战、优劣与经验

会员服务 ·

肽积木CEO柏文洁：AI 医学影像的三大技术实战、优劣与经验

2017 年 12 月 12 日 AI掘金志 刘伟

AI掘金志出品

雷锋网旗下只报道“AI+传统”的内容频道

《未来医疗大讲堂——医学影像专题》第二期总结文：一个只给医疗AI从业者、影像科医生、名校师生、CFDA工作人员看的系列课程。

注：120分钟的视频信息量巨大，文字仅为冰山一角，强烈建议观看完整版视频，请点击阅读原文

近日，雷锋网AI掘金志邀请到了肽积木科技CEO柏文洁，为大家深入讲解《AI 医学影像的三大技术实战、优劣与经验》。

作为一名处在AI医学影像产业一线的管理者和算法研究者，柏文洁立足实践经验，在120分钟的分享里为500多位资深医疗人工智能专业人士剖析了医疗影像AI的实战方法与案例，并重点分析了分类网络、图像切割网络、GAN网络在医疗影像中的应用及其优缺点。

柏文洁指出，虽然从逻辑上理解，分类网络比较简单，但从解决问题的角度来说，分类问题是远期目标，短期内难以应用。病灶标识和视频跟踪并不直接对疾病进行判别，只是作为医生的一种辅助，相对容易实现，是AI应用的中期目标。

嘉宾介绍：

柏文洁

柏文洁，北京肽积木科技有限公司创始人&CEO，大数据领域的连续创业者，知名大数据公司信柏科技、时趣互动运营核心创始成员。AI算法工程师，独创的LP-NET算法在医疗影像病灶识别方面取得国际领先水平。

课程内容：

医疗影像的常见应用问题以及我们应该怎么做
医疗影像应用的深度学习解决方案
分类网络在医疗影像中的应用、优缺点及拓展
图像切割在医疗影像中的应用、优缺点及拓展
GAN网络的应用场景及思考

以下文字为柏文洁课程节选：

医疗影像AI的发展现状

柏文洁指出，在普通民众看来，医疗AI应该能替代医生，但现有的深度学习算法主要还是对传统方案的优化，是一些新的工具。这些新的工具未来有可能发生质变，但还需要我们的共同努力。

AI医疗影像作为AI切入医疗的突破口，仍然只是传统医疗流程中的一部分，对医疗影像的判读是医生诊断治疗的参考依据之一。现有的AI医疗影像还无法构成一个闭环，完成对患者的诊断及治疗方案规划。因此AI必须先融入到医疗环节之中，才能提升医疗效率和降低成本。

目前绝大多数AI医疗影像创业公司都是技术背景出身，融入医疗环节相对比较困难，普遍会遭遇三个问题：

数据坎：一方面，创业公司通过和三甲医院合作获取的数据无法直接使用，面临数据标记的难题。另一方面，如果创业公司的产品没有融入到医院的业务流程中，就无法获得长期、持续、有效的数据。

渠道坎：CFDA认证是医疗行业的一道硬性门槛。虽然近期CFDA对医疗AI产品有逐步开放的趋势，但要通过认证还是非常困难的，而且过程十分漫长。没有CFDA认证，就无法形成稳定的营销渠道，也很难给渠道商足够的利润空间去推广产品。

硬件坎：在医疗场景中，很多时候AI必须结合硬件使用，而且也只有通过硬件，AI才能够获取相应的价值。目前很多人脸识别厂商已经开始做摄像头之类的硬件产品了。

从更高的维度来说，AI应用于诊断环节能够产生的社会价值是低于治疗环节的。医生最关注的还是如何更加高效地，以更低的成本治病救人。

尽管面临诸多挑战，但柏文洁认为AI在医疗行业的应用前景仍然是潜力无限的。现有的传统医疗环节中，可被AI提升和改造的地方非常多。如果我们能把AI的能力应用到这些场景中，将对整个行业产生极大的提升，正如大数据对对传统行业所产生的影响那样。

医疗影像应用的深度学习解决方案

柏文洁首先对AI在医疗影像中的应用进行了一番梳理。她介绍道，医疗影像主要有放射性影像（X光、CT、MRI、OCT等），超声、彩超检测，病理检测，内窥镜检测，高倍拍照（主要针对眼底、皮肤）等几种类型。

针对这些不同类型的医疗影像，又主要有分类、标记、切割和序列四种处理方式，它们分别对应的范围为图像、区域、像素和视频。以传统的CAD问题拓展出更好的结果，这是目前应用比较广的热点问题。

柏文洁认为，虽然从逻辑上理解，分类网络比较简单，但从解决问题的角度来说，分类问题是远期目标，短期内反而难以应用。因为我们最终要做的是判断患者有没有疾病，而现有的技术还很难对疾病进行非常准确的判别。

病灶标识和视频跟踪并不直接对疾病进行判别，只是作为医生的一种辅助，因此是AI应用的中期目标。

分类网络在医疗影像中的应用、优缺点及拓展

分类网络应用于医疗影像，优点非常明显——简单明确而且有很多预训练结果。基于这些结果可以做进一步的预训练和迁移学习。

与此同时，分类网络的缺点也很明显：

一、需要大量的数据。即使用迁移学习的方法，起码也需要数万量级的数据才能做分类。

二、针对小病灶的分类容易产生偏差。过去的分类模型都是对猫、狗等较大的物体进行分类，相对比较容易。

三、分类标注往往不具备客观性。如果有解剖金标准做为依据，分类是比较简单的，但在实际应用场景中，很多分类标准不具备客观性，而是受医生的个人情况和医院的知识传承影响。

四、可解释性差。在医生给出分类标准的前提下，算法的分类结果与医生可能存在一定的差异，无法令人信服。

图像切割的应用场景

柏文洁认为，图像切割是AI在医疗影像中应用最丰富的场景。因为医生在诊断和治疗过程中经常需要将病灶区域清楚地描绘出来，为后续提供指导意义和价值。但在一些特殊情况下——尤其是在一些X光片中，边界非常模糊无法进行图像切割，只好用物体识别的方法。

目前图像切割的主流做法有三种：编解码结构、孔洞卷积和条件随机场。其中Unet是最主流的网络之一，也是首个应用于医学案例的FCN网络，是深度学习用于图像切割的早期重要论文。

随着研究不断深入，Unet也取得了一些最新进展：

首先是大内核，它解决的核心问题是，在FCN的同时对多个物体进行切分，然后进行分类。这种情况下，小内核对整体信息的把握是不够的。

其次是PSPnet。PSPnet会把整张图切成四等份再做pooling，这样的好处是可以获取全局的信息。

MaskRCNN也是比较新的，它实际上整合了物体识别优势和方法。柏文洁表示很看好这种方法，正在积极探索其在医疗领域的具体应用方法。

Unet适用于边缘明确的组织和病灶，但它也存在一些不足：首先数据量严重不足，数据标记很难获取；其次病灶类别具有天然的不均衡性。网络上的很多公开数据库都是对数、汽车之类的物体进行分割，这类物体在图片中的占比很高，实践起来相对容易。但病灶在图片中的面积占比通常非常小。以眼底图像为例，用FCN直接训练眼底图，一不小心就可能训练成全阴性的网络。