这家台湾医院并没有教 AI 诊断特殊肝癌病例,但机器自己却成功发现了

2017 年 12 月 8 日 DeepTech深科技 詹子娴

年度订阅用户可加入科技英语学习社区,每周科技英语直播讲堂,详情查看“阅读原文”


注:本文以下提及的医学影像数据,指的都是经过去连接化处理、无法得知患者身份的数据。


人们常常说,神经网络像是一个黑盒子。之所以这么讲,是因为相比一些基于规则的系统,神经网络或其他机器学习算法并不透明,目前你并不知道它是怎么运作、下判断的。但也因为无法掌握,偶尔就有意料之外的发现,有一家医院的AI研究中心就经历了这种惊喜。


位在台湾的“中国医药大学”附设医院(CMUH)的人工智能医学诊断中心,正在训练机器看计算机断层扫描(CT)影像来诊断肝癌,令人意外的是,研究人员在训练初期还没有把一些发生机率很低的特殊病例素材放进机器的训练数据集中,没想到, AI 却自己发现了,“机器自动找到 nodule in nodule ,也就是肿块之中还有一个变异肿块,”CMUH人工智能医学诊断中心副主任游家鑫兴奋地说。


AI+医学影像的研究及应用遍地开花


在现阶段的医疗保健(healthcare)AI领域中,图像及诊断辅助可说是最受欢迎的应用,不久前刚落幕的北美放射学会(RSNA)2017 年会上,机器学习就成了核心话题, RSNA 首度举办一场机器学习挑战赛:利用儿童手部的X光片,让机器自动判断骨骼年龄。希望通过众人的脑力激荡,开发出更精准的算法来解决放射学(radiology)遇到的临床问题。


另外,大型企业如 IBM 、 Google 、医疗设备商如 GE 、飞利浦、西门子以及众多的初创公司,也纷纷携手医院、医疗机构展开诸多研究,而且获得了不错的效果。像是 Google Research 研究人员利用卷积神经网路(CNN)读取糖尿病患者的眼部照片,判断是否有视网膜病变(diabetic retinopathy),目前试验结果显示,演算法判断结果与专业眼科医生的诊断结果呈高度一致性。


另一家在医疗视觉分析领域具高知名度的以色列初创公司Zebra Medical Vision,他们也利用深度学习解读计算机断层扫描、核磁共振成像等医学影像,可识别出肺脏、肝脏、心血管或骨头中的疾病,还特别强调每一张影像的判读费用只需要1美元!


调研机构 IDC 指出, 2017 年的人工智能/认知计算的应用中,支出最多的除了自动化顾客服务(15亿美元)之外,就是诊断和治疗系统(11亿美元)。 IDC 医疗领域亚太区研究经理 Ashwin Moduga 认为,医院使用 AI/Cognitive 技术例如以深度学习改进医学图像诊断,不仅仅是为实现自动化或提高精确度,更重要的是解决某些地区医疗专家、资源匮乏的问题,在未来2~3年内,医院将陆续展开一些简单的自动化测试,同时投资深度学习算法。


确实,医疗产业对 AI 表现出高度兴趣, CMUH 人工智能医学诊断中心就是一例。在 DT 君采访当日,研究人员正在跟中心主任黄宗祺进行越洋电话会议,汇报每日的工作进度,因为黄宗祺具备电机、医疗影像、放射跨领域的优势,因此获得 NVIDIA 邀请,正在美国总部展开为期一年关于细胞影像及乳癌方面的交流及进修。


AI是这个时代影响层面最大的工具,一定会改变医疗生态。在所有数据中,医疗数据无疑是最有意义的,两者会结合的非常快,Google、阿里巴巴、苹果....世界上每一家AI技术领先的公司都在进入医疗行业.......” ,黄宗祺强调。


图|CMUH人工智能医学诊断中心主任黄宗祺。(图片来源:CMUH人工智能医学诊断中心)


放射科医生每天都有看不完的片子........


什么是医学影像呢?就是帮助医生不需动刀就能观测病患身体内部状况的技术,包括我们常听说的超声波、 X 光片,还有计算机断层扫描(CT)、核磁共振成像(MRI)、正电子放射断层造影术(PET,Positron Emission Tomography)、单光子发射型计算机断层(SPECT,Single Photon Emission Computer Tomography),每一种方式都有其优势,适合用来检查不同的病症,像是超声波可快速扫瞄,方便性高, CT 、MRI 则是善于做结构、组织异常的侦测,SPECT则适合侦测神经传导物质、代谢的异常。     


再简单看一下医院的工作流程:当我们可能感觉到身体不适时,到医院挂号后,就会有一个“专科医生”如肝胆肠胃科科、乳房外科等,听取我们描述病征,接着他会安排检查,例如CT、MRI等,有一群在背后检查这些医学影像的人就是“放射科医生”,他们的工作就是看一张又一张的片子、打出报告,提供给专科医生去拟定治疗方案。


为什么把 AI 应用在医学影像领域会有如此急迫的需求?因为放射科医生的人力非常有限,而且他们每一天花费很多的时间看大量的片子。


放射科医生的工作负担是远超过你想像的大,因为肿瘤的位置不一定只会出现在身体某个部位,因此一个病人至少会拍上百张的图像,他们就必须一张一张看,再从中挑出数十张可用的图像数据,“所以每一个医生都很累,工作到眼睛很痛,”本身拥有放射师执照的 CMUH 人工智能医学诊断中心数据工程师林仰贤这么说。


所以如果能够通过 AI 来协助医生加快看片的速度,就有更多的病患能从中受惠,不论是快速找到治疗方法还是预防其他病症的产生。


像是上述提及 Google Research 的研究,糖尿病患者因长期血糖上升,导致血小板凝集力上升,毛细血管受损,容易引起眼部视网膜毛细血管病变,严重会导致视力丧失,早期诊断治疗是保住病人视力最重要的依据。可惜的是,部分医疗资源稀缺的地区如印度,就有众多的患者因为医院得排队排很久、看不到医生而失明,比例高达近45%。但其实如果拥有足够的医疗人力资源的话,这些失明都是完全可以预防及避免的。


而人工智能很有机会改变现今医护供给、需求高度落差的状况,协助提升医疗行业效率。


CMUH人工智能医学诊断中心的研究有两大部分,初期是做放射组学(Radiomics),林仰贤解释,Radiomics 是一种结合多种演算法的影像处理技术,从医学影像如 CT、MRI 定量病变(lesion)的特征,再将特征与事件做连接,建立出模型。简单来说,就是计算图像的特征值,从这些数值中去判别某个疾病跟某个事件的关联性。


他们使用肝脏的 CT 影像,分析这位病人在 2~3 年之内会不会出现肿瘤转移,或是治疗后复发的可能性。过去,一直以来都是凭医生自己的经验、“感觉”来判断,没有一种可量化的方式,但因为凭经验判断,不同的医生来看就可能给出不同的答案,而判断不同,后续就会展开不同的疗法,最极端的状况就是一个说有病,另一个说没病。因此他们希望通过Radiomics 让影像有标准化。


图|放射组学(Radiomics)研究的流程。(图片来源:CMUH人工智能医学诊断中心)


CMUH人工智能医学诊断中心因为隶属于医院,做 AI 研究的好处就是较容易取得数据,同时又有许多医生可供咨询,毕竟 AI 系统的使用者是医生,必须重视用户意见。因此中心的研究人员与院内多位医生讨论下,认为现阶段较好的 AI 应用应该是作为医生的助手,希望通过 AI 减轻医生的工作负担,他们就将研究重心从 Radiomics 做转移(metastasis)、复发(recurrence)的评估,转为利用深度学习做肿瘤检测(detection)。


游家鑫表示:“因为医生每天花超过10小时看 CT ,手动圈出肿瘤的位子,而且还是用鼠标一笔一笔画,真的很花时间,我们希望先帮医生打造一个随手可用的好工具。”


AI真的比我们想像的厉害


他们使用了超过 200 个肝癌病例,每一位病例至少上百张的医学图像,作为训练数据,虽然病例数量还不算多,但目前效果相当不错。


先用下方的肝脏 CT 图片来解释,左边 Ground Truth 图是传统的做法,就是医生看片子,把肿瘤的位置、大小框出来。右边 Detection 图是 AI 侦测的结果,上头显示 HCC(肝细胞癌 Hepatocellular Carcinoma,简称HCC) 0.977 ,数字指的是机器下判断的自信程度(与准确率无关,只是机器在做判断时对答案的自我评估)。


图|左图是医生手动标示,右图是 AI 侦测的结果,HCC 0.977 数字是机器下判断的自信程度。(图片来源:CMUH人工智能医学诊断中心

图|左图是医生手动标示,右图是 AI 侦测的结果,机器都能找出肿瘤位置及大小。(图片来源:CMUH人工智能医学诊断中心)


不仅 AI 可以找出肿瘤位置、框出边缘,甚至还出现惊喜,游家鑫指出有两个很特别的状况,一个是他们没有教机器 nodule in nodule 肿瘤中还有一个肿瘤这种低机率低的情况,但它自己找出来了,当初研究人员看到机器标这张图,还以为机器出错,就拿去请教医生,才知道原来这就是 nodule in nodule 。另一个就是有一张素材里有一个“人为标错”的状况,因为有时医生真的太疲累而画错,但机器却自己找出正确的肿瘤位置。


图|这张图就是 nodule in nodule ,他们没有教机器这个状况,但机器自己发现了,不过也值得注意的是,对于第二颗肿瘤机器下判断的自信程度是 HCC 0.8 ,对比一般机器的自信通常都会超过 0.9 来说,它是稍微没有自信,但还是识别出来了。(图片来源:CMUH人工智能医学诊断中心)


除了肝癌之外, CMUH 人工智能医学诊断中心目前也在展开乳癌的AI医学影像识别研究,“主要是锁定亚洲人较容易罹患的疾病,像是肝癌、肺癌、乳癌,反观欧美的研究主要是皮肤癌,但亚洲人普遍不爱晒太阳,罹病机率较少,”游家鑫解释。


AI真的比我们想像来得厉害吗?


从 CMUH 的例子来看,AI 听起来真的很聪明,还自己学习了那些人类没有教它的事,但 AI 真的有如我们想像的那么厉害吗?游家鑫坦言,有时候机器还是会找不出来,因为目前他们给的训练数据都是比较大的肿瘤,当机器遇到很小很小的肿瘤时,有时就识别不出来,也曾经发生过机器识别错误的情况。


也就是说,如果真的要训练一个准确的 AI ,训练数据必须越多元化越好。因此,他们除了计划与邻近的医院合作,增加病例的数量,也是为了让机器看不同设备品牌如GE、西门子、飞利浦扫描出来的照片,“最好是让 AI 软体都看过一次,提高对不同机器的适应性。”


同时,他们下一步计划把健康人士的图档加进训练数据集里。一般来说,当人是健康的时候,医院并不会特别在影像上标注,例如,在做超声波时,通常都是当医生看到了异常,才会按键把影像拍下来,正常就不会拍。但由于 CMUH 的放射线部医生相当支持 AI 研究,不少医生愿意额外投入时间帮忙标标注,或是拍下一般人士健康状态的医学影像,协助中心有更多的精准数据可供训练。唯有让机器看过更多的病例、不同品牌设备拍摄的图像,才能学得越多。


图|CMUH人工智能医学诊断中心副主任游家鑫(左)、人工智能医学诊断中心数据工程师廖英凯(中)、人工智能医学诊断中心数据工程师林仰贤(右)。(图片来源:DeepTech深科技)


AI落地医疗仰赖医生的正确标记数据


相比多数用 AI 做影像识别的应用或行业,要在医疗落地的难度绝对是最困难的,“毫无疑问,机器学习将改变放射科医师在未来几年的实践方式,但在机器学习变得普及之前,还有许多工作要做,”斯坦福大学放射学及生理医疗信息系教授 Curtis Langlotz 曾这么说,他口中的工作包括了面临监管问题,机器学习还需要大量标记的图像数据集,尽管大多数放射学已经进行了数百万次的影像检查,但是大部分都没有标记。


姑且先撇除算法必须通过严格的临床实验及法规,光是在数据及训练上至少就有三件事得解决。


首先,“医疗领域最大的不同在于对影像下标注只能依靠专业人士,”游家鑫强调。举例来说,不论是在安防领域或是自动驾驶领域,一般人都可以为图像下标注,因为常人都可以分辨出这是人、猫狗动物、汽车、信号灯等,但是,在医学影像里,一般人根本看不出身体到底哪里出了异常,例如给你看一张 CT ,无法分辨什么有或没有癌症、位置在哪里,更不要说有时肿瘤还非常小,这是只有受过专业训练的医生才拥有判断的能力。


不仅 CMUH 提出了这个观察,负责糖尿病视网膜病变计划的 Google 研究团队产品经理、医学博士彭浩怡(Lily Peng)在接受媒体采访时曾指出, Google 团队建立了一个数据集,并聘请 54 名专业眼科医师评估超过 13 万张的图像。


另外,“在医疗产业,数据绝对比算法重要,如果训练数据越精确,训练出来的机器也会变得越强,”游家鑫一语道出重点,因此想要训练出好的医疗人工智能,必须得仰赖专业医生的协助,替影像数据下出精确的标签及诊断,换句话说,就是得靠人类名师的帮忙才能培育出 AI 高徒。


林仰贤指出另一个比其他行业更有挑战的问题,就是影像的色彩,一般行业训练 AI 都是使用彩色的图像,例如训练自驾车,一定就得让机器看过信号灯、交通标示的影像,信号灯有红黄绿、标示通常有红色、黄色,但是医疗影像都是黑与白,再加上有些医疗院所用的仪器可能是较旧的机型,拍出来影像的解析度较差,因此要做医疗影像的识别必须不断试验多种算法,找出适合检视黑白图像的算法,而且还要够克服低解析度的问题,在在考验团队的技术能力。


此外,就是数据的取得。医院内部做 AI 研究,数据的取得相对容易,但对外部的人来说,想要拿到医院的影像数据可就不简单,DT君采访一家专攻 AI 医学影像识别的新加坡初创公司 adaline ,其创办人郑子双表示,他们目前与新加坡公立医院合作,取得了 1000 多位病患的影像数据,“但完全不够!所以要一直跟医院合作,包括东南亚、香港、台湾,希望至少得拿到 10 万个病例。”不过,想要跟各地的医院合作就得按各地的法规来走,对于初创公司来说是一条漫长的路,因此谁取得数据越多、速度越快,就有比较高的机会在市场占到位子


医学界对于 AI 应用,看似有支持及反对两类声音,游家鑫强调:“人工智能是绝不可能取代医生的,但绝对可以作为一个辅助医生的好助理,”检测早期癌症或预防疾病的发生,同时还有助于减少因“人眼”错失,或是忽略细微差异而发生诊断上的疏漏,这是利用计算机跟 AI 最大的价值,不过得有医生的支持,AI 才有可能在医学行业落地


-End-


校审:郝锕铀


登录查看更多
0

相关内容

人工智能医学:人工智能应用于医学领域。
【学科交叉】抗生素发现的深度学习方法
专知会员服务
24+阅读 · 2020年2月23日
【综述】智能医疗综述,48页论文详述医学AI最新进展
专知会员服务
70+阅读 · 2019年9月1日
BioMind ™:勇做神经影像AI领域的探路者
医谷
4+阅读 · 2019年4月23日
2017-2018年抗肿瘤药物行业研究报告
行业研究报告
7+阅读 · 2018年11月1日
苦尽甘来:AI为更有效地治疗抑郁症带来希望
英伟达NVIDIA中国
10+阅读 · 2018年3月1日
Arxiv
15+阅读 · 2020年2月6日
Arxiv
6+阅读 · 2018年6月18日
Arxiv
4+阅读 · 2017年11月4日
VIP会员
相关VIP内容
【学科交叉】抗生素发现的深度学习方法
专知会员服务
24+阅读 · 2020年2月23日
【综述】智能医疗综述,48页论文详述医学AI最新进展
专知会员服务
70+阅读 · 2019年9月1日
Top
微信扫码咨询专知VIP会员