谈到人工智能在医学影像中的应用,不少业内人认为医疗领域内的约束和障碍还有很多,AI若想落地临床,会受到数据多样化、标注复杂化、政策明朗化及询证理解难等多个问题的限制,目前还很难看到明确的未来。
于是不少企业选择退步或观望,即便涉水,也只是浅尝辄止。
“医疗问题面前,不再分中国美国,也不分科技公司还是医疗公司,这是一个关系到全人类生命健康的话题。在面对这一问题时,不管过程多么艰辛,一定要有人站出来。” 英特尔中国数据中心云计算高级技术总监周翔如是说。
在与浙江大学第一附属医院、爱尔眼科等多家医院,以及阿里云、浙江大学数理学院、浙江德尚韵兴图像科技有限公司、晋弘科技和极视互联等多家单位及企业共同探索数月后,英特尔已经印证了AI在甲状腺结节、糖网和黄斑变性等眼底病变医学影像辅助诊断上的可行性,于是决定加大力度,全力推进AI技术在医疗领域的实践。
当业内其他公司的医疗团队把所有精力集中在研发自有产品之际,英特尔认为“授人以鱼,不如授之以渔”,一家公司能做的事毕竟有限,如果利用自己百年来积累的技术优势、平台优势和行业服务能力,扶持更多的AI医疗创新者,将比一人孤军奋战更有意义。
那么如何“授之以渔”?
经过一番考量,英特尔决定为来自世界各地想用AI解决医疗问题的团队,提供更强大的硬件平台、更易用的软件,让他们更专注解决问题本身,无需考虑软、硬件限制,从而发挥最大势能。
最终,英特尔选择以比赛作为切入点,与合作伙伴启动了一场有着2887支队伍参与的天池医疗人工智能大赛,历时7个月后,于近日正式落下帷幕。
这次大赛向医学界公认的难题肺结节早筛发起挑战。
一、为何选择从肺结节筛查切入?
此次大赛是英特尔、阿里云、零氪科技一同发起和支持,是国内第一个医疗人工智能大赛,规模和数据量也在世界范围内绝无仅有,共有16家国内知名肿瘤医院为本次比赛提供了脱敏和标注的、近3000例高危患者的低剂量肺部CT影像数据。
之所以选择肺结节筛查作为“考题”,是因为我国肺癌疾病形势愈加严峻。全国肿瘤登记中心早在2013年发布的《2012年中国肿瘤登记年报》就显示:截止当时,近30年肺癌的死亡率上升了465%,取代肝癌成为中国首位恶性肿瘤死亡原因。
而且国内有从肝癌识别的业内人士也曾指出,通过对比中、美、英三国的肺癌发生率和死亡率,数据显示国内肺癌发生率低于英、美,但死亡率却已超过英、美。这其中的重要原因是,当患者诊断出自身有肺癌后,70%已到中晚期,错过了最佳诊断和治疗时间。
因此肺癌早筛在国内是一件刻不容缓、急需解决的任务。
早筛是减少肺癌死亡率的重要手段,而癌症早期多表现为肺部结节。这些肺部结节的尺寸非常小、对比度低、抑制化高。
过去的筛查工作均由影像科医生完成,由于每个病人肺部CT的扫描图片数目超过200层,平均诊断时间在20分钟以上,当医生遇到大量病人时,极其耗时、耗力,而且容易漏诊。
与此同时,微小肺部结节在影像学的表现易与其他组织或部位产生混淆,如毛细血管、结核、假瘤等,从而打扰到医生的判断。
基于这一痛点,影像科急需新的技术来辅助医生提升诊断效率,这时候人工智能从众多技术中脱颖。它能从海量医学影像数据中学习和模仿医生的诊断“经验”,在短时间内快速提升诊断能力,辅助医生减少误诊。
二、行业此前面临的软硬件局限与解决方法
虽然人工智能更新迭代迅速,但医学影像分析作为一个庞大的工程问题,很多工作都得一步步进行,尤其像医疗这种数据形态和特征较为复杂的行业,它在人工智能铺助诊断上面临的难题,也是一个接一个,且彼此之间密切相关:
首先,GPU难担重负,至强融核却有独到优势
经调查发现,相比而言医学影像分析更需要3D神经网络架构的支撑,后者与行业内常见的2D图像深度神经网络有着很大不同。
记者了解到,天池大赛参赛队伍大多采用3D影像数据方案,其模型本身并不大,但每次输入的数据却超过常用显卡的显存容量。医疗行业内除了3D数据外,还有附带时序的核磁共振4D数据,它们更加依赖内存,这时GPU在处理3D和4D影像数据时往往面临吃不消的问题。
要想做出优秀的医疗AI方案,不仅需要狭义上的计算力,同时也要有强大的存储力做支撑,因此医疗为AI底层设施提出了全新的挑战。
基于上述情况,英特尔专门为深度学习设计的至强融核处理器的优势便开始突显,它就像CPU一样,可直接读取内存,单颗能支持和使用的内存容量就高达384GB。
不少参赛队伍在描述英特尔至强融核处理器时如此形容到:“我们首先要明白 最重要的一点,它是CPU,不是卡。你可以把它理解为一个高性能的、能做深度学习,又能够直接连内存的CPU产品。”
而在此之前,得益于在人脸识别和常见图像识别上的显著优势,GPU已成为绝大多数开发者们训练模型的首选。
英特尔中国数据中心云计算高级技术总监周翔向雷锋网透露,他在高校经常看到学生辛苦苦苦设计的很多医学影像分析模型无法在GPU上运行。
为此,学生们不得不降低3D肺部影像数据像素,然后拆分为多个小分块,再进行一一识别。
这种“妥协”的方式会引发两大问题:第一,降低像素会丢掉细节信息;第二,分块识别有可能会产生误差。
天池大赛冠军团队(北京大学LAB2112 )对此也深有体会,队长胡志强谈到,肺部CT影像分析对存储要求很高,GPU平台由于受到显存的限制,要想对CT影像进行较好地分析往往需要多GPU协同甚至多机协同,但这些工程实现起来有一定的难度,尤其是对于诸如Batch Normalization等需要多GPU同步的层来说。
相比之下,至强融核平台可利用大容量内存,能更好地满足了CT影像分析对内存的要求,同时也不存在多个设备之间同步的问题。
软件方面,记者得知,通过英特尔的努力,目前大部分常用的深度学习框架都已有了针对CPU的优化版本。但进一步的,英特尔特别针对此次医疗AI大赛的需求,还对自有优化版Caffe框架和算法库进行了深度定制。通过新增且优化诸如三维卷积层、三维反卷积层、损失函数层等数十个关键操作,极大的保证了至强融核平台计算力的充分发挥,再结合该平台自身的存储力优势,使之能够真正有效的支撑三维医学影像的深度学习应用。
于开发者而言,在至强融核处理器上的开发难度相对更低,虽然它的底层为深度学习的技术,但上层指令集均为X86,而且英特尔提供的部分库也可把下层进行涵盖,只要开发者们熟悉传统CPU上的编程,也能迅速熟悉它。
“很多人喜欢谈自己在GPU上的MicroBenchmark有多出色,确实,大家也已习惯拿到影像后先做预处理。但太过看重MicroBenchmark往往会忽略掉预处理之后造成的误差。因此大家如果想做出一个比较实用的成品,应该把注意力集中更宏观的任务上,专注解决Solution级别的问题,通过英特尔平台会让整个目标的实现来得更加简单,”周翔表示:“所以英特尔希望通过天池大赛给大家提供一个新的思路,让他们了解到,不管是医学影像还是高精度视频分析,你编程的方法、训练模型的方法,可以不受已有硬件在内存带宽、容量方面的限制。”
其次,通用深度学习开源框架已无法满足医疗AI应用需求,更优化的框架是必备利器
硬件平台犹如土地,而土地之上若要丰收,离不开耕地的工具,它们就是软件框架。
此次大赛,英特尔为深度学习框架Caffe定制了43个超越开源版本的新功能,来支撑选手的模型创新。
由于Caffe抽象级别较高,相比而言,它的性能明显优于其他框架,但也存在灵活性欠佳的弊病。为此,英特尔针对它在灵活性上缺陷,为其定制了43个新功能,来对医学影像分析难题提供更好的支持。
同时,英特尔也为天池软件贡献了35000行框架代码和6000行参考模型代码,为模型训练保驾护航。结果表明,各队选手在比赛期间遇到的80%的问题,英特尔事先都有验证过。
“通过这次比赛积累的经验,为未来深度学习框架的扩展奠定了一个较好的基础,后续我们也考虑引入更多的框架。”
至强融核平台相比GPU在医疗影像AI应用上有如此多的优势,那么习惯了GPU平台的开发者,又应该如何实现平滑的迁移?
针对这一问题,天池冠军北京大学团队也谈到,这件事刚开始麻烦,但最终还是成功解决。
“我们先尽量将整个流程分成不同的模块,这种模块化的开发方式能使代码结构更加清晰,各部分功能独立,方便排查错误,从而避免很多问题;我们在第一阶段实现PyTorch版本框架时,已经考虑到了复赛的问题,于是将尽可能多的数据处理模块独立于深度学习框架之外,用NumPy等库实现所有操作。
除此之外,开发者团队也应该多花时间阅读源代码,因为我们在第二轮使用的是英特尔针对CPU优化后的Caffe版本,所以相比公版Caffe改变了一些功能,为了能更好的使用这些功能,阅读源代码就变得很有必要,同时理解源代码也能帮助我们在遇到问题时更快地找出错误。比如我们在实现过程中,发现一开始使用的网络初始化方式并没有针对三维卷积进行处理,于是我们自己修正了初始化方式,使得结果有所提升。”队长胡志强向雷锋网(公众号:雷锋网)介绍到。
胡志强继续说道,整个过程中,无论是代码迁移还是其他重大技术问题,都离不开英特尔技术专家的服务与支持。
“印象最深刻的一次就是在我们使用英特尔优化版Caffe时,经常遇到Segmentation Fault的错误,该问题难以排查的地方在于其错误不经常复现,也就是说运行代码的过程中有时会发生错误,有时候不会发生,使得我们很难找出错误的原因。有天晚上和英特尔团队反馈了这个问题之后,工作人员很快就开始帮助我们排查问题并且第二天就给了我们回复,产生错误的原因是我们使用了一个原址(in-place)操作导致内存溢出。”
“英特尔工作人员牺牲自己的休息时间,熬夜帮我们调试代码,并且在很短时间内找出问题所在,这也从侧面反映出他们团队强大的技术实力。”
而现在,这支年轻的北京大学团队已经与北大几家附属医院在内的一些医疗机构展开合作,医学专家们也对他们的系统给予非常不错的评价。
三、英特尔的医疗AI愿景
在本次访谈最后,周翔把英特尔对未来医疗AI的构想,从全社会和个人的角度予以展现:
一直以来,人们对英特尔的认知是一家芯片企业。实际来看,英特尔远不止研发芯片这么简单。正如英特尔CEO科再奇所说,我们是一家以数据为中心的公司。
医疗行业有很多数据犹如还未被正确开发的巨大宝藏,我们希望联手阿里巴巴、零氪科技这类优秀企业把各行各业的数据盘活。
英特尔特别希望通过这次医疗AI大赛,让那些真正做医疗的人、拥有数据的人、制定政策的人,能够看到一个由人工智能支撑的医疗模式是更加高效、更加安全、更具价值的。
我觉得科技公司不能因为政策和监管问题的限制,就选择观望,等待政策和监管落实后再行动。相反,我们的企业使命是考量能否通过扶持世界各地的创新者们加速AI技术的落地,让更多政策制定者和监管机构明显地感受到大家的创新成果和实际使用结果在不断进步,从而也间接推动政策的落实,加快全社会对人工智能的认知和认同。
而站在个人角度,作为公司和社会的一个小小个体,最让我们这些技术从业者感到幸福的事,莫过于自己付出的长期努力,不仅可以造福全世界,也或许能够切切实实地帮助到自己以及身边的人。