专访讯飞病灶分割比赛优胜团队,年内会将该算法投入实用

2018 年 4 月 2 日 AI研习社 思颖

AI 研习社按,日前,由生物医学成像领域顶级学术会议 ISBI((IEEE International Symposium on Biomedical Imaging)举办的 IDRiD 眼底图分析竞赛成绩揭晓。从排行榜上可以看到,来自中国的研究机构表现相当亮眼 —— 科大讯飞「iFLYTEK-MIG」团队在病灶分割比赛的 MA(微动脉瘤)子项目上排名第一,平安科技「PATech」团队在病灶分割比赛的 EX(硬渗出)子项目上排名第一。

浙江大学、新加坡国立大学、新加坡生物信息学研究所联合北京上工医信公司组成的团队在视神经盘与中央凹检测比赛上得分领先。

此次眼底图分析竞赛共分为病灶分割、疾病分级、视神经盘与中央凹检测三个分赛道,病灶分割比赛中包括微动脉瘤(MA)、出血点(HE)、软渗出(SE)、硬渗出(EX)四个子项目,讯飞「iFLYTEK-MIG」团队在病灶分割的四个指标 MA/HE/SE/EX 上的得分排名分别为 1/3/3/2,雷锋网 AI 研习社第一时间联系到「iFLYTEK-MIG」团队,了解到这一优秀成绩背后的个中细节,同时,也获悉讯飞在医疗图像领域取得的突破与进展。

图:眼底图四种病灶示意图(via:科大讯飞)

  比赛细节

在病灶分割、疾病分级、视神经盘与中央凹检测这三个分赛道上,排名领先的科大讯飞和平安科技都只是选择参加第一项赛事而忽略了后两项,「iFLYTEK-MIG」团队对 AI 研习社解释道,「其他几项比赛对医生的辅助意义并不是很大,不能很好地提升医生的工作效率与准确率。」

iFLYTEK-MIG 团队主要来自科大讯飞 AI 研究院,研究方向是人工智能在医学影像领域的技术及应用。基于专业知识和实地考察经验,他们表示,病灶分割可以给医生带来极大的利好。「我们在比赛中检测的微动脉瘤(MA)实际上是非常之小的,在一张 4000x3000 像素的图上,MA 可能只占 10x10 个像素左右,很容易被医生遗漏。根据我们的调研,高水平的医生看一份眼底图找到一个 MA 可能要耗费 4 到 5 分钟,目前我们的系统只需要几秒钟,而且速度还有优化空间,可以大幅提高医生的工作效率。」

提到参赛初衷,他们表示,对于讯飞来说,眼底图是之前一直没有尝试过的病种,也是计划马上要做的。在机缘巧合之下,看到 ISBI 在举办 IDRiD 这样一个国际比赛,所以马上选择投入参加。

在该比赛中,官方提供的数据集只有 516 张图像,虽然主办方表示可以使用其他外部数据,但 iFLYTEK-MIG 团队并没有这样做。「我们参加比赛的目的主要是验证已有算法的有效性,是否能达到比较好的效果。眼底的疾病,不论是糖尿病视网膜病变,还是其他一些相关疾病,都是通过对病灶进行分割、检测来做辅助诊断。」

他们在这个数据集上大概投入了一个月时间,基于已有的算法进行设计改进。比赛中,算法的有效性得到了充分证明。「未来,在获取更多数据后,医学影像辅助诊断系统的准确度可达到更高水平。」

而这场比赛的难点在哪里?讯飞表示,「与自然场景图像不同,眼底图像的分辨率一般在 4000*3000 像素左右,而有些小的 MA 病灶可能仅占有几十个像素,而且不同病灶的面积往往相差很大,因此会导致正负样本比例失衡、检出特异性(specificity)较低等问题。」

针对以上难点,他们基于 coarse-to-fine 思想做了如下改进:

  • 在 Encoder-Decoder 框架下融合空洞卷积操作、self-attention 机制,设计出一种新的分割网络,在不损失原始图像信息的前提下,快速定位出可疑病灶区域并给出分割边界。

  • 新增了一个虚警抑制网络以及矫正网络,提高灵敏度和特异性。

  与 LUNA 评测的区别

值得一提的是,半年前,讯飞在 LUNA 上获得平均召回率 94.1% 的检测效果,刷新世界纪录。LUNA (LUng Nodule Analysis) 评测是肺结节检测领域最权威的国际评测,也是医学影像领域最具代表性、最受关注的评测任务之一。召回率低意味着系统会漏掉患者的关键病灶信息,对患者的健康造成很大隐患。

当时,为了提升召回率,讯飞主要采用了如下几种方法:

  • 多尺度、多模型集成学习;

  • 使用结节分割和特征图融合的策略来改善虚警的增多和重复检测问题;

  • 利用 fully 3D-CNN 模型来计算特征图,并在特征图上进行检测;

  • 提出一种有效样本挖掘策略,能够通过在线学习过程自动过滤可疑错误样本。

而这种对肺结节检测的方案中,有无可以迁移到这次的眼底检测比赛中的技术?讯飞表示,LUNA 中的肺部 CT 是三维数据,那时候的方法是基于 3D-CNN。参加 LUNA 前他们已经有了肺结节方面的辅助诊断系统,所以那次是直接应用。这次的眼底图像比赛是二维图像,算法上会有比较大差别,具体到任务上,实现原理也有所不同。

他们表示:「这对讯飞来说是一个从无到有的过程。」
后续,他们在比赛中采用的算法会发表在相关领域顶级期刊上,促进行业的共同进步。「算法的效果及效率都比较优异,我们觉得对行业发展还是能起到一些激励作用。如果只给医生一个『黑盒子』的结果,那样很难让他们信服。」

  实用性考虑

其实早在 2016 年底,谷歌就利用深度学习诊断糖尿病视网膜病变,并号称取得了与专业医生相媲美的成果。他们当时使用使用 Inception-v3 网络,利用 12.8 万幅图片组成的数据集来训练算法。而在 2018 年初,Google 旗下的 DeepMind 宣布训练出了一种 AI 医学影像算法,号称可以比人类医生更加高效准确地检查出眼底疾病。他们与 NHS 和全球最好的眼科医院之一——伦敦 Moorfields 眼科医院,进行了长达两年的合作,来验证这项算法的有效性。

目前,讯飞医学影像辅助诊断系统已在全国帮助近百家医院进行肺结节和乳腺钼靶的影像筛查,那么他们这一眼底图诊疗算法还有多久投入实用?他们表示,「在这次算法的有效性被充分验证之后,下一步,我们会确定合作医院和科室,对系统进行进一步的研究。」

目前来说,国内主要的问题是医疗影像数据缺乏统一标准。讯飞在临床上做的许多试点工作中经常会碰到如下难题:基于一家医院数据学习到的系统迁移到另一家医院时,系统的效果会有比较大的折扣。「因为国内各医院的影像设备技师在操作过程中,基本都是按照自己医院的小标准去做的;不同影像设备之间也会有所差异,这些差异对于影像科医生来说,花一些时间便可以适应,但对于机器来说,由于它依赖数值计算,所以数值上的很大差异会对机器造成不利的影响,因此机器也需要一次再学习的适应过程,这是很不利于系统推广的。」

目前,为了切实推进医疗影像数据的标准化,他们还在根据不同的医院需求去一家家修改系统。

实用的道路是曲折的,他们补充道,进一步改进该眼底图像诊断系统之后,具体应用将在年内落实。

竞赛详细信息:https://idrid.grand-challenge.org/home/

(完)

ISBI:ISBI 是由 IEEE 信号处理协会 (SPS) 和 IEEE 生物医学工程协会 (EMBS) 共同发起的专门研究生物医学成像的国际学术会议。

算机视觉基础(从算法到实战应用)班

限时拼团,最后一周

已有100+人参加了此拼团

最高每人优惠200元!



新人福利



关注 AI 研习社(okweiwu),回复  1  领取

【超过 1000G 神经网络 / AI / 大数据资料】



天池医疗 AI 大赛冠军团队算法分享:肺部结节智能检测

登录查看更多
2

相关内容

最新《自然场景中文本检测与识别》综述论文,26页pdf
专知会员服务
69+阅读 · 2020年6月10日
新加坡南洋理工最新37页《零样本学习综述》论文
专知会员服务
112+阅读 · 2019年10月20日
深度学习自然语言处理综述,266篇参考文献
专知会员服务
229+阅读 · 2019年10月12日
阿斯利康高管为您解密药企医学事务部那些事儿
肿瘤资讯
41+阅读 · 2019年7月24日
重磅!商汤开源目标跟踪最强算法SiamRPN系列
AI前线
13+阅读 · 2019年5月24日
Kaggle 新赛:第二届 YouTube-8M 视频理解挑战赛
AI研习社
10+阅读 · 2018年5月26日
吴恩达团队发起骨骼X光片识别挑战赛,好胆你就来
人工智能头条
4+阅读 · 2018年5月25日
Talking-Heads Attention
Arxiv
15+阅读 · 2020年3月5日
Revisiting CycleGAN for semi-supervised segmentation
Arxiv
3+阅读 · 2019年8月30日
Few-shot Adaptive Faster R-CNN
Arxiv
3+阅读 · 2019年3月22日
Arxiv
5+阅读 · 2016年10月24日
VIP会员
相关论文
Talking-Heads Attention
Arxiv
15+阅读 · 2020年3月5日
Revisiting CycleGAN for semi-supervised segmentation
Arxiv
3+阅读 · 2019年8月30日
Few-shot Adaptive Faster R-CNN
Arxiv
3+阅读 · 2019年3月22日
Arxiv
5+阅读 · 2016年10月24日
Top
微信扫码咨询专知VIP会员