雷锋网AI掘金志消息,近日,“未来计划—— AI 关爱健康”医疗人工智能应用高峰论坛在杭州举办,同济大学附属同济医院的王培军教授发表了题为“人工智能在医学影像诊断中的价值及发展趋势”的主题演讲。
王培军教授在演讲中表示,深度学习解决的问题比过去更加的广泛和深入。但是为什么会在现在发挥出作用?首先是计算能力不行,无法进行大量的运算,其次是缺乏标准化的数据。
王培军认为,全世界在人工智能医学影像上还没有突破瓶颈,原因在于敏感性和特异性都无法达到临床的标准。他总结了几大原因,其一是标准化的数据不够。肺结节的数据量要达到10万以上;第二,算法的框架、顶层的设计方案还存在提升的空间。“所以,一定要完善算法的顶层设计框架;其次,提升数据的标准化水平。”
以下为嘉宾演讲实录,雷锋网AI掘金志做了不改变原意的编辑。
王培军:论述人工智能的现状跟发展趋势要回顾一下过去,历史会提供一些将来以及现状发展的规律性思考。我们现在所处的是工业革命里的信息革命,信息革命跟人工智能密切相关。从信息化的过程来讲,我们经过了这么几个阶段:数字化,一体化,还有虚拟化。接下来,我们要快速发展的就是智能化的阶段。
人工智能的发展阶段是以2005年的深度学习为标记。人工智能早期解决的是比较简单的问题,简单的逻辑判断还有简单功能。现在的人工智能是基于机器学习领域的深度学习。我们现在所讲的人工智能的革命性的结果都是在深度学习的背景之下,深度学习解决的问题比过去更加深入。
为什么深度学习在现在显示它的威力,2006年以前却没有呢?首先,计算能力不行。那个时候是万事俱备,但是还差东风。其次,数据标准化不行,方法之前就已经具备,但是计算能力跟不上。所以,我们一定要有深层的神经网络才能做比较复杂的东西。目前影像基本已经介入了。总的来讲,大家都有方法和工具,但是如何更好地使用这个工具,例如卷积神经网络,深度神经网络、反向传播网络等方面,这是我们要研究的问题。
这些方法都是深度学习方面的范畴,它的优点是各有所长,取长补短。但是每一个人应用的方法是有差别的。所以,要取得最好的结果一定要有顶层设计的算法。我们用的比较多的是卷积神经网络,它主要就是用顶层设计来表达一系列特征,用参数训练来接近最后的结果。
企业在诊断疾病方面也做了很多事情,研究的部分是检测病在哪里,还是诊断病是什么。这是两大基本问题。
所以,影像主要有三大块,检测、诊断、预测。现在国内外的放射组学,跟这些有什么关系?放射组学用的指标有两类:
1、人的指标。让计算机学习,这是专家干的事。机器跟人学习就永远在人的下面,所以 AlphaGO 打败了李世石以后,我还是花了一段时间去研究他为什么会败。我后来得出一个结论,机器一定可以战胜人类,我当时也理解了专家系统为什么不行,因为它永远跟人学,它学不到人的水平。
2、放射组学里还有一部分是人可以理解但是不能预测的指标。
我们接下来要做的事情是把结果做好,不仅仅局限在放射组学,一定要跳出放射组学的范畴。例如动脉狭窄,这个现象和后面的结果数据有什么关系,以此来进行预测、关联等等。
我跟20家公司谈过肺结节的检测诊断,我认为企业在肺部的人工智能筛查上还处在瓶颈期,没有取得突破性进展。这个瓶颈到底在哪里?
我们来看看这个图象, 把图像分割、检测,提取特征,最后进行诊断预测,基本上都是采用人工神经网络卷积的方法。现在的问题在于很多预测、诊断的水平不够高,没有一家真正有突破意义。所以,临床方面正在试用,但是真正在临床应用上表现出色的还是没有。现在人工智能的发展也处在平台期(缓慢上升期),是在累积力量。任何的事情,包括全世界文明的发展都是呈现指数的规律。那么,人工智能也一定是这样。
我们现在来看问题在哪里?医学影像的敏感性在90%左右,特异性在80%-85%,这是正式的数据,有的可能高一些,因为样本量不一样,结果也会有变化。但是目前普遍的水平维持在这个数值。如果考虑到假阳性的问题,还会存在误诊、漏诊的情况,这样就可能引起不必要的医患纠纷。所以,人工智能在影像上还没进入到使用的状态。企业发布的产品,如果其特异性还没有达到95%,就不要急于宣传,因为产品经不起检验。我们以数据说话。那么,你们看哪个人是不是在吹牛,就可以问数据的敏感性是多少,特异性多少,这两个数据可以用来衡量产品的水平。
人工智能医学影像现状是:所有产品的特异性都没有超过90%。所以,理论上讲,现有的人工智能医学影像产品都没有达到可以实际应用的阶段。
有几大原因:
第一:标准化的数据不够。那么需要多少才能足够?——肺结节10万以上的数据量。10万以上的数据量就代表了深度学习目前可以到达的水平。如果数据量只有3000个、8000个,一定是有区别的,所以标准化的数据量要够。
第二:算法的框架、顶层的设计还需要进一步完善。现阶段方法的应用,顶层设计的方案还有距离。为什么企业都没有通过检验,因为他们在方法的顶层设计上都存在缺陷。所以,一定要完善算法顶层设计的框架。这两个方面积累足够之后,企业才可以做好这个产品。
那我们接下来应该怎么做?人工智能的趋势在哪里?
第一:建立标准化、大样本的大数据中心。
第二,超大规模地训练数据、复杂深层模式和分布式并行训练。影像资料要和其他的临床基因资料结合,包括临床疾病的相关信息,临床表现、检验结果。
第三,要以应用的结果作为目标驱动。诊断的敏感性一定要达到98%-99%,特异性要达到95%。没有达到这个标准,以后就不要去说临床应用这件事。
接下来我们探讨一下人工智能的发展趋势,我认为有三个趋势。
阶段一、在开始但是还没有到的阶段,成为人类很好的帮手。
阶段二、达到人类的水平,成为与人一样的高水平专家。
阶段三、成为超过人类水平的专家。
回顾历史就要展望未来,这是事物的趋势,是不可抗拒的。所以,我认为达到第一阶段需要3年时间,达到第二阶段需要5年,达到第三阶段需要8年。
我们看看人怎么评价人工智能的发展。马云认为机器永远不会剥夺人类的智慧和经验。说的对不对不知道,但是他这个技术革命很重要,上海的一位书记也表示,人工智能的使用门槛已经实现突破。所以,我们不要保守,不要落后。如果你现在想做这件事,一定要跟实际操作相结合。
我们说说国外的,霍金觉得人工智能有好有坏,他也认为人工智能的发展会超出我们的想象,同时也要规避它的不利因素。所以,他认为2031年人类要移民,人工智能对人的额威胁很大。当然, IT 的领袖们都很担心人工智能会超过人类,呼吁我们现在就要开始进行预防。
人工智能的发展现在已经走向应用的阶段。但目前还不能真正使用。在一部分医学应用上是可以的,但至少影像还没有。医学影像是最复杂的。如果产品能够通过影像的人工智能的检验,其他医学方面的人工智能都是小菜一碟。
接下来人类会实现两大进步,给人工智能带来巨大的飞跃,第一是认知科学进步。神经网络的认知进步就带来了深度学习,接下来再进步一小步就会带来革命性的变化。这种可能性是大大存在的。
第二,量子计算机,我觉得在20年以内一定会应用到实际,它能够带来巨大的计算能力。所以,人工智能的发展依赖于计算的计算,这个非常重要。
所以,这两大块接下来还会有很多的变化,会给我们的人工智能带来巨大的飞跃,所以这个发展的趋势就是这样。
CCF-ADL在线讲习班(第80期):区块链—从技术到应用
顶级学术阵容,50+学术大牛
快速学习区块链内涵,了解区块链技术实现方法
阅读原文戳开链接,抵达课程介绍
长按二维码,关注雷锋网旗下「AI掘金志」