如何“喂饱”医疗AI?腾讯这个实验室想了“两个办法”

2019 年 6 月 6 日 腾讯研究院

我们都知道人要保持充沛的精力,离不开食物、水等能量供给,只有保持充沛精力才会有力量去发现、去创造。


同样,要想一个医疗AI像人类那样思考,成为医生的得力助手,就必须“喂”给它大量的数据,帮助它从中找出规律。


而现在,医疗AI却面临“双重挑战”,一是缺乏训练样本,二是缺乏标注。


这两大挑战让深度学习严重“弹药不足”,由此衍生出的“小样本学习”问题一定程度上阻碍了AI医学影像的发展,难道就这样止步不前?这些问题到底该如何突破?


在5月30日-6月2日的“中国医师协会第十三次放射医师年会”上,腾讯优图实验室医疗AI总监郑冶枫博士,在题为“深度学习在医学影像分析上的应用”的分享中,讲述了腾讯优图实验室通过迁移学习和计算机合成图像两大方法,突破医疗AI数据量不足,没有办法像传统机器学习那样用大数据进行喂哺的问题。


郑冶枫博士在中国医师协会第十三次放射医师年会上做主题演讲


腾讯优图实验室是腾讯顶级人工智能实验室之一,专注于在人脸、图像、视频、医疗影像等领域开展技术研究。腾讯首款将人工智能技术运用在医学领域的产品“腾讯觅影”,即是由腾讯医疗健康事业部牵头,优图实验室提供的算法支持。



医疗AI面临“双重挑战”


当前人工智能技术的迅猛发展,与强大的计算能力、合理的优化算法和高质量的大数据密切相关。要让机器像人类那样思考,成为医生的得力助手,就必须“喂”给它大量的数据,帮助它从中找出规律。但是,在医疗人工智能领域,这一切却没有这么简单。郑冶枫博士提到,近年来,深度学习在包括图像识别、游戏、语音识别、自然语言处理等方面取得了重大发展。但是,医疗AI的发展却面临“双重挑战”。


一是缺乏训练样本。郑冶枫博士表示,“深度学习的目标是尽量端对端,图像进去、结果出来,因而网络越来越大,越来越多层,需要的训练样本也越来越多。”但与自然场景下自然图像获取不同,医学影像的获取十分艰难。



  • 一方面,图像采集的“高门槛性”也制约着训练样本的获取。“医学影像采集需要专门的设备,有一些设备非常昂贵,比如CT和核磁。”


  • 另一方面,疾病本身的特殊性也对算法工程师获取样本造成阻碍,郑冶枫博士表示,“对于一些罕见病种,能够找到的图像就只有几百张或者一千来张,因为每年的发病量就那么多。”


二是缺乏标注。郑冶枫博士介绍道,对于自然图像来讲,其标定相对容易,即便是普通人也能够直接标注。但医学影像不同,其标注需要行业顶尖的专业医生参与。“现实是,培养一个医生需要十年时间甚至很长,加上临床、科研任务重,做数据标注对于医生来说也是‘有心无力’。”


两大方法突破医疗AI小样本学习问题


针对这两大挑战,郑冶枫博士提出,有两种方法有助于解决这一问题:一是迁移学习;二是计算机合成图像,比如生成对抗网络。


迁移学习这个要如何理解呢?郑冶枫博士用了一个生动的比喻:“比如说一个人去森林里找老虎,但从来没有见过老虎,不知道老虎长什么样。但假如他可以把猫和狗、狐狸等其他动物区分开来,就可以先训练他去找猫,这就是预训练的过程。接下去,我们告诉对方:老虎就是黄色的猫放大100倍,从而达到‘找老虎’这个目的。”他强调,迁移学习非常适用于解决小样本的训练问题。


另一个方法则是计算机合成图像。通过影像跨模态转换,计算机合成图像能够有效补充训练样本,而生成对抗网络则让训练如虎添翼:一个网络生成图像,一个网络鉴别目标的真伪,把两个网络做一些联合训练。训练结束时,生成网络可以产生非常逼真的图像。


郑冶枫博士以肝癌为例,“有时候跨模态生成的图像会扭曲,会生成一些新的病灶,也可能遗漏一些病灶,为此,我们在研究过程中会加上各类限制,减少生成图像的失真。我们的算法很完美地保留了器官和病灶的形状,是在用非常真实的图像作为训练任务,通过这种方法,能够让准确率得到明显的提升。


“腾讯觅影”能精确定位3mm以上的微小肺结节,检出率≥95%


医疗AI逐步落地 提升诊断准确率和效率


通过迁移学习、计算机合成图像等方法,影像诊断领域的深度学习取得了显著进展。以肺结节检测为例,郑冶枫博士介绍道,目前肺结节检查方式主要是肺部CT,随着薄层低剂量CT的应用,图像数量的倍增、小结节显示率的提高及结节的定量测量等使得读片的难度显著增加,同时,繁重、枯燥的阅片工作使影像科医师的疲劳度增加,漏诊、误诊的风险也在增加。


人工智能的运用,使得这些问题逐步得到解决。经过不断地迭代和更新,“腾讯觅影”早期肺癌筛查AI系统采用了腾讯优图实验室的“端到端肺癌辅助诊断技术”,能够精准定位微小结节位置和辅助医生准确判断患者患有肺癌的风险。


预处理模块、检测与识别模块是这一系统的核心算法。前者利用肺部的三维分割和重建算法,可以处理不同CT成像设备在不同成像参数条件下产生的不同源数据。而后者采用了“深度学习领域最好的分割算法”——全卷积神经网络,可以实现早期肺结节检测和分割。


郑冶枫博士表示,全卷积神经网络有两部分,一部分是编码器,把图像不断卷积和下采样,最后压缩到低维空间,这是不同任务可以共享的。一部分是解码器,不断卷积和上采样,最后输出一个输入图像大小一样的分割结果,这部分是每个任务独有的。“我们预训练的编码器会把所有任务的图像都看一遍,因此训练得非常好。”


“把编码器训练好之后,就将其迁移到其它任务,如肺部分割和肺结节良恶性判断上。采用公开数据集,发现不仅仅分割可以做得很好,分类也可以做得很好。”郑冶枫博士强调,在医疗AI上,技术方面大部分工作都差不多,最后的竞争还是在细节方面。”


比如在良恶性的判断上,腾讯提出了Med3D预训练模型,该模型采用多个公开竞赛数据集进行训练。通过选取三维医学影像进行图像分割任务,并对这些数据进行抓取、收集,预训练一个模型,能够大幅提高分割和分类的准确率,解决了大部分结节不活检,不知道良恶性的问题。”


目前,“腾讯觅影” 通过人工智能医学图像分析能力辅助医生阅片,已经能精确定位3mm以上的微小肺结节,检出率≥95%。同时,除早期肺癌外,“腾讯觅影”还能利用AI医学影像分析辅助临床医生筛查早期食管癌、眼底疾病、结直肠肿瘤、宫颈癌、乳腺肿瘤等疾病。


本文转载自腾讯医疗健康(公众号:qq_internetplus)

登录查看更多
1

相关内容

郑冶枫,腾讯天衍实验室主任、AIMBE Fellow。郑冶枫本科和硕士毕业于清华大学电子工程系,博士毕业于美国马里兰大学。2006年至2017年在西门子医疗美国研究院工作。2018年1月加入腾讯。他一直从事智能医学影像分析,发明的投影空间学习法于2011年获美国马斯.爱迪生专利奖,相关的研究成果于2014年结集出版《医学影像处理的投影空间学习法:器官的快速检测与分割》。发表论文150余篇,撰写专著2部,参编专著1部,拥有美国发明专利70多项,论文被引用6000多次,h-index指数42。曾于2003年获中国国家科技进步二等奖,是美国医学和生物工程学会的会士(AIMBE Fellow)和IEEE医学影像杂志副编(TMI IF=7.8)。
【CVPR2020-北京大学】自适应间隔损失的提升小样本学习
专知会员服务
83+阅读 · 2020年6月9日
2019中国硬科技发展白皮书 193页
专知会员服务
81+阅读 · 2019年12月13日
医疗知识图谱构建与应用
专知会员服务
384+阅读 · 2019年9月25日
中科院赵地:深度学习在 4 大超声影像中的应用
AI掘金志
9+阅读 · 2017年12月17日
体素科技丁晓伟:医疗影像的哲学三问
机器之能
5+阅读 · 2017年11月25日
已删除
将门创投
6+阅读 · 2017年7月6日
Domain Representation for Knowledge Graph Embedding
Arxiv
14+阅读 · 2019年9月11日
Arxiv
8+阅读 · 2018年11月27日
Neural Arithmetic Logic Units
Arxiv
5+阅读 · 2018年8月1日
Arxiv
4+阅读 · 2017年10月30日
VIP会员
Top
微信扫码咨询专知VIP会员