【AI又对肺癌下手】依图倪浩拆解全球首个肺癌智能诊断系统

2018 年 6 月 17 日 未来产业促进会


点击上方“公众号”可以订阅哦!




  新智元报道  

编辑:张乾


【导读】四川大学华西医院与依图医疗合作研发国内首个肺癌临床科研智能病种库和全球首个肺癌多学科智能诊断系统,让人工智能走向临床科室,也给AI医疗创造了更多想象空间。


AI又对死亡率最高癌症——肺癌,下手了。


6月15日,四川大学华西医院与依图医疗合作研发出国内首个肺癌临床科研智能病种库(以下简称“肺癌病种库”)和全球首个肺癌多学科智能诊断系统



肺癌病种库收录肺癌患者的影像、病理、基因检测、病历文本等多维数据,利用AI对数据进行整合。肺癌多学科智能诊断系统则依托病种库,以临床指南为指导,并融汇华西医学专家智慧,实现结节筛查、肺癌全类型病灶诊断覆盖。


跟目前广泛存在的AI医疗影像系统不同之处在于,肺癌多学科智能诊断系统综合多学科临床信息进行综合诊断,让医疗影像走向临床,也给AI医疗创造了更多想象空间。


不久前,IBM Watson Health裁员50%至70%,让AI医疗再次受到落地难的质疑。依图医疗总裁倪浩在接受包括新智元在内的媒体专访时表示,Watson不是AI医疗的代表,不是一流的人工智能公司,裁员对行业来说是好事。



破解三大难题:文本数据转化、影像提取复杂、数据标准化



肺癌的死亡率有多高?


四川大学华西医院院长李为民给出以下数据:


肺癌发病人数、死亡人数我国居世界之首,每年肺癌发病人数约83万,占全国癌症发病人数的20.5%;


每年肺癌死亡人数约62万,占全国癌症发病人数的27.2%,是死亡率最高的癌症


对抗肺癌的关键是早期诊断和规范治疗,其中AI诊断又在早期诊断中不断发挥作用,研究意义重大。


不过,在AI诊断肺癌过程中,通常面临以下三个问题:


1、文本数据转化问题。临床语言属于自然语言范畴,同时具备医学表述所特有的语法结构特点和语义特点,特定医学实体识别相对容易,全量信息解析提取没有现成可用的成果。


2、医疗影像提取复杂度问题。医疗影像数据属于典型的“高维数据”,内容丰富但提取复杂,若使用人工判读,工作量和一致性极差,无法进行万量级大数据处理,若基于报告进行提取,会遗漏大量信息。


3、数据标准化问题。在术语使用、描述方式等多层面,临床数据要完成彻底的标准化,才能成为高质量数据,临床工作强度高,部分数据存在描述不完整设置表述错误的情况,质量治理工作复杂。


针对上述三个问题,依图医疗分别给出三个应对措施:


1、结合医学术语本体构建技术与自然语义理解技术,自主研发医学语义解析算法,实现全量医学信息提取。


比如,医生给出如下诊断,肺癌病种库会将其分为信息抽取逻辑和信息抽取网络架构。(下图)


左肺上叶中分化腺癌(乳头型腺癌+粘液腺癌)。侵及脏层胸膜,周围肺呈慢性炎改变伴灶区碳末沉积,免疫组化示腺癌细胞:ALK-V(+,建议FISH检测)。



这样的效果是临床信息覆盖度超过95%,重要信息覆盖度超过99.5%;自动化提取正确率98%,人工审核后综合正确率达到99.3%。


2、自主研发基于深度神经网络的影像结构化提取模型,覆盖病灶类型、病灶大小、解剖学位置、影像学征象等影像诊断的核心内容,实现病灶倍增时间自动计算与提取,进一步实现影像的高维信息提取。



随着时间的推移,病灶的大小和位置都会有变化,依图通过深度学习,把肺的叶和段分割成3D模型,再判断病灶的位置和大小。


3、对于数据标准化问题,依图联合四川大学华西医院基于本体构建方法,建设中文医学术语库,文本结构化提取模型融合术语库,实现表述归一化;并建立精细化质量控制模型,基于逻辑推理实现错误纠正。



李为民介绍,通过上述手段,肺癌病种库完成2.8万例肺癌患者全周期数据跨系统集成,容纳超百万份临床文档与报告,超过千万份原始医学图像。



医疗影像走向临床,算法将顶级专家的知识和经验下沉



建设全球顶级肺癌病种库是依图医疗与华西医院的合作的第一步,两者合作的路径是:


人工智能研究及成果转化→临床多中心实验→制定精准化肺癌早筛专家共识,最终让医疗影像走向临床科室。


在肺癌诊断层面上,依图医疗总裁倪浩有三代定义


第一代是大家熟悉的基于影像的病灶检出和测量。


第二代是对于病灶描述的细致的程度。第一代和第二代在整个人工智能的发展的阶段其实还处于非常早期的阶段,依图与华西医院一起合作的间接诊断和决策产品,倪浩将其定义为第三代。


与目前广泛存在的AI医疗影像系统不同,肺癌多学科智能诊断系统跨越了影像,把临床的各种各样的数据集合到系统里面来,能够做到多学科的综合诊断。系统帮助的对象也不止是放射科的医生,还覆盖到临床的医生,为他们提供临床上更加有价值的建议和更加有价值的结论。


第一,实现以患者为中心的个性化的基于基因组的诊断和检测,为临床的医生打造一个多学科的智能的决策的系统;第二,能够突破现行科室的限制,其让患者享受专家级MDT团队服务;第三,算法将顶级医院的数据和专家的知识集成到系统里面,将顶级专家的知识和经验下沉,最后推广到基层医院里面,让全国各级医院都能够受益。


此外,倪浩还曝光了依图医疗的产品矩阵。




倪浩:IBM Watson不是一流的人工智能公司,完全不能代表医疗人工智能产业



在“华西医院&依图医疗”肺癌人工智能成果发布会后,倪浩接受了包括新智元在内的媒体专访,被问及IBM Watson 医疗部门裁员、依图医疗的商业模式等问题。


问:不久前,IBM Watson Health裁员50%至70%,其中一个重要的原因就是它很难实现商业变现,您怎么看待这个问题?


倪浩:我的一个非常明确的观点:沃森从来都不是人工智能或者是医疗人工智能行业的代表,在我们看来它不是一流的人工智能公司。在美国,沃森从来没有招到过顶级的人才,沃森之前一直在用IBM的一些市场上和品牌上的优势,然后去在炒作一个概念,这次它出了问题其实对于整个行业是好事情,就是把一些浑水摸鱼的人清理走。


中国以前不少人对人工智能的认识不到位,觉得IBM做出来的东西肯定是好的,但并非如此。其实对于沃森这件事情,它完全不能代表医疗人工智能产业,我们是以比较积极的眼光看待它出的这些问题的。


问:依图有没有想过与华西医院合作,未来形成怎样的商业模式?


倪浩:我们做某一个方向,明确它有足够大的商业空间、通过什么方式来明确,这是非常考验我们的战略眼光。


现在在解决的这个问题是一个革命性的东西吗?这个东西如果不是一个革命性东西,它有没有真正的去解决一个痛点,而不是一个痒点?很多人会搞不清楚痛点和痒点的差别,痒点是没有商业化前景的,痛点才有商业化前景。所以其实在我们看来,只要痛点足够明确,而且是在增长而不是萎缩的一个市场,这个市场就会越来越大。


得肺癌的人一年几十万,其实很少,但是属于应该要去筛查范围的人很多,而且国家的鼓励政策下来之后,医院接不住,数量可能是几十倍的翻上去。医院是接不住的,所以可以判断是有一个明确的市场空间。


其实我觉得今天也不用算投入产出比,因为医疗行业本身它的特点就是周期长,然后做一个产品要拿证,把这个产品再改一遍,你还要重新再去申请一遍证,很多公司没有这个能力能够这样做下去的。其实去年已经倒掉一批人工智能公司,对于我们来说,确定它有明确的前景之后,其实我们不会太算细的账,你做到业内最好的,首先是能够活下去,然后再说是不是能变得伟大这件事情。


问:包括Google、DeepMind等大量的公司都在把人工智能应用放在早期疾病的筛查和识别上,但实际上人工智能面临一个不透明性的问题,特别是一旦在医疗中帮助决策,如果是不可追溯和解释的,这个东西会变得非常麻烦,我不知道你们在这方面有些什么样的准备和计划?


倪浩:确实目前基于深度学习技术建立的模型本身是不可解释的但是其实我们在产品的层面上做了一些可解释性,也就是说为什么我今天告诉医生说,我觉得这个病灶是一个恶性的,恶性概率有99%,那我为什么给了你这么一个结论?我会给你证据,我们做了很多的模型,为了让他去接受这个99%是合理的。



  注:投稿请电邮至124239956@qq.com ,合作 或 加入未来产业促进会请加:www13923462501 微信号或者扫描下面二维码:

  


  文章版权归原作者所有。如涉及作品版权问题,请与我们联系,我们将删除内容或协商版权问题!联系QQ:124239956

  

登录查看更多
0

相关内容

商业数据分析,39页ppt
专知会员服务
160+阅读 · 2020年6月2日
人机对抗智能技术
专知会员服务
201+阅读 · 2020年5月3日
【微众银行】联邦学习白皮书_v2.0,48页pdf,
专知会员服务
165+阅读 · 2020年4月26日
广东疾控中心《新型冠状病毒感染防护》,65页pdf
专知会员服务
18+阅读 · 2020年1月26日
2019中国硬科技发展白皮书 193页
专知会员服务
81+阅读 · 2019年12月13日
中科院赵地:深度学习在 4 大超声影像中的应用
AI掘金志
9+阅读 · 2017年12月17日
【智能医疗】如何利用深度学习诊断心脏病?
产业智能官
8+阅读 · 2017年10月3日
Phase-aware Speech Enhancement with Deep Complex U-Net
Arxiv
8+阅读 · 2018年11月27日
Arxiv
4+阅读 · 2018年11月6日
VIP会员
Top
微信扫码咨询专知VIP会员