治疗癌症的 Waston 步履艰难,IBM 能否依靠人工智能成功转型?

2017 年 9 月 17 日 机器之能 Casey Ross

一年多以前,IBM 宣布转型为认知解决方案和云平台公司,在 2011 年的美国智力问答节目《危机边缘》(Jeopardy!) 中打败两位得分最高的选手的超级计算机 Waston 成为 IBM 转型的核心级产品,Waston 在医疗领域,尤其是癌症治疗领域的应用,也被认为是人工智能在垂直领域落地的典型代表。时至今日,Waston 在攻克癌症方面效果如何?这份来自 STAT 的调查报告全面而客观地讲述了 Waston 对癌症治疗和医生的帮助以及它的局限性。而 Waston 的落地很大程度意味着 IBM 是否能够成功转型。


编译:侯韵楚 晏奇 高静宜

来源:STAT


IBM 宣称,仅凭一台机器(IBM Watson),他们就可以对付最令人类头疼的疾病,还将引发医学业界的新一轮革命。即便对于具传奇色彩的美国公司 IBM 来说,这种承诺也是非常大胆的。


为了推广自己的标志性品牌——Watson,IBM 决定以独特的创造力来吸引全球的目光。没过多久,他们就锁定了一个极具话题性的目标:癌症。


可是在 IBM 把 Watson 卖给用户,并开始为全世界的医生推荐最佳癌症治疗方案的三年之后,来自 STAT 的一项调查却发现,Watson 似乎并没有达到当初 IBM 所承诺的效果。Waston 还艰难地徘徊在学习不同癌症的区别的基础阶段。目前,仅有少数医院采用了这套系统,对于想独占这块价值数十亿美元蛋糕的 IBM 来说,无疑还有很长一段路要走。此外,一些国外医院的内科医生也抱怨称,Watson 给出的建议带有针对美国患者和美国治疗方案的倾向。


从韩国到斯洛伐克再到美国南佛罗里达,STAT 全球性范围地考察了 Watson 在肿瘤病领域的应用情况、市场规模以及表现性能。记者采访了很多医生、IBM 的管理人员以及人工智能领域的专家,也采访了一些熟悉这套系统底层技术和部署的研发人员。


调查结果显示,为了增加收益,IBM 并没有充分评估 Waston 在全球医院范围内部署所产生的挑战,而是推出了一款不够成熟的产品。尽管 IBM 将 Watson 着重用于癌症治疗领域,但是他们却并没有发表任何学术论文来介绍这项技术将如何影响内科医生和患者。此外,Watson 的缺点也逐渐暴露在了医生和研究人员的面前。这些人表示,尽管该系统在有些方面不错,但是它依然是个半成品。


韩国癌症专家 Taewoo Kang 博士曾使用过 IBM Waston 产品,他表示:「Watson for Oncology(IBM Watson 针对肿瘤病治疗推出的服务)还处于早期阶段,我们还需等待并积极参与产品性能的提升,希望能够借此帮助 IBM 改进自己的技术。」


本质上,Watson for Oncology 使用了基于云端技术的超级计算机来处理海量的数据——包括医生的诊断记录到医学研究结果再到临床治疗指南。然而,Waston 系统给出的治疗建议却并不是通过洞察这些数据所产生相应的见解。相反,它们完全由人类监督训练而成,人们手动为 Watson 输入信息,教它如果给具有不同特征疾病的患者提供治疗方案。


IBM 负责人承认,虽然 Watson for Oncology 已经开发了六年,但是这个项目仍处在起步阶段。不过他们也表示,系统的性能正在快速改进,在今年年底,系统将可以对 12 种癌症问题提供治疗建议,覆盖全球癌症病例的 80%。他们表示,这可以节省医生的时间,保证患者能够得到最高质量的护理。


IBM 全球 Watson 健康总经理 Deborah DiSanzo 说:「我们现在可以看到很多真实的案例,患者们告诉我们说『听了 Watson 的建议我现在感觉舒服多了』。他们的这番话让我感觉从事这项事业是非常值得的,因为它正在给患者和医生更好的体验。」


不过,与 IBM 这番对 Watson 神乎其神的描绘相比,我们需要明白,其实这台超级计算机的能力十分有限。


IBM 宣传 Watson for Oncology 最夸张的地方在于,系统可以借助人工智能技术,处理海量的数据来产生新的理解和新的功能,就像他们的销售代表所说的「甚至它还可以产生癌症治疗的新方法」。但是,STAT 却发现,系统根本不会创造新的知识,而且其所谓的人工智能也仅仅停留在最基本的水平上。


尽管 Watson 通过赢得电视节目「Jeopardy」而变得家喻户晓,但是其程序却类似于一款 1700 年代的下棋机器人「Mechanical Turk」。虽然效果让观众眼花缭乱,但实际上背后是有一个人类在进行操控,可是这件事却不为人知。


图为电视节目「Jeopardy」的冠军 Ken Jennings(左)和 Brad Rutter(右),他们在 2011 年的练习赛中被 Waston 击败。


以 Watson for Onclogy 为例,上述那些「幕后人类操控者」其实就是美国纽约著名的 Memorial Sloan Kettering 癌症中心里的外科医生们。这里的医生被授权可以将自己的建议输入 Watson,即便这些建议并不是很成熟。


部分公众以及一些使用过 Watson for Oncology 的医院其实都还不了解它的真实能力。数据工程师与医生们煞费苦心花了六年时间才仅仅让 Watson 学习了 7 种癌症,这还没完,他们还要持续不断地向系统更新相关知识。


Memorial Sloan Kettering 中心负责训练 Watson 的主管 Mark Kris 博士表示:「老实说,对 Watson 持续进行更新是一件很麻烦的事情。」他强调道,最近,每次癌症大会发表完研究成果之后,全球对每个转移性肺癌患者的治疗方案就会改变一次。「要知道,改变认知计算系统并不像转硬币那么简单,」他说,「你必须要输入文献,输入案例才行。」


IBM 极力希望借助 Watson 从过去的硬件制造商转型成结合云计算与尖端人工智能技术的新公司。不过,即便 Watson 已经介入了银行业、制造业等领域,它也未能阻止 IBM 营收连续 21 个季度下滑的颓势。就在上个季度,营收甚至还比不上去年同期 IBM 认知解决方案部门(该部门基于 Watson 打造,力图成为 IBM 未来一切业务的核心)的收入。


IBM 回应了 STAT 的质疑,表示 Watson 在医疗卫生和其他方面任然保持着上升的势头。到目前为止,Waston 已经成为了 IBM 价值 200 亿美金智能分析产业的「一个重要部分」。医疗卫生是 Watson 的关键业务之一,IBM Watson 健康部门雇佣了 7000 名员工,并将这个市场在未来几年中的估值判定为近 2000 亿美金。金融服务领域被估值 3000 亿美金,被认为能够超越前者,成为公司未来的核心业务。


目前看来,Watson 不仅仅是 IBM 这家全球著名公司赖以转型的机遇,也对于全球医疗行业的变革也有着重要影响,它是当下利用人工智能技术探索最佳疾病预防及治疗方案的最勇敢的尝试。用 IBM 负责人的话说,该系统的远期目标是实现医疗知识民主化,如此一来,无论每个患者身处何处抑或是收入如何,都能够获得最好的医疗护理。


不过,话虽如此,在癌症的实际治疗中 Watson 却走得步履艰难。


STAT 之所以针对 Watson for Oncology 进行调查,是因为它才是其临床护理业务最为长远的目标,尽管 Watson 也有对基因信息进行分析、为患者提供对应临床解决方案的功能。除了上述功能以外,Watson 还可以做其他工作,比如完善预防医学工作、阅读医学图像等等。


不同医院的医生对 Watson for Oncology 的依赖程度有所不同。部分拥有较少专家的医院会更多地借鉴 Watson 给出的建议,而其他的则会把它置于二线,像律师助理一般,主要做一些现有知识的研究工作。


在费用方面,医院会为患者向 Watson for Oncology 和 Watson 的其他服务支付费用。据 DiSanzo 表示,具体的金额会根据医院购买的产品数量来恒定,从 200 美元/每人到 1000 美元/每人不等。系统有时候会产生咨询费用,使用电子医疗记录资源是非常昂贵的。在那些没有将自己医疗记录连入 Watson 的医院中,多数时候都必须手动输入患者的信息。


在福罗里达州 Jupiter 医疗中心,这项工作落在了护士 Jean Thompson 身上,她每周要花 90 分钟时间将数据录入计算机。当录入成功之后,只要她点击「询问 Watson」这个按键,机器就会给出治疗患者的建议。


就在不久之前的一个早晨,Watson 对一位 73 岁老年肺癌患者的建议并不尽如人意,系统向患者推荐了医生早已认定不能使用的化疗疗法。


不过肿瘤学家 Sujal Shah 博士却在和同事讨论完之后表示,Watson 的治疗建议「还不错」。


他随后表示,Watson 提供的医学期刊等背景信息对他很有帮助,给他更多的信心,认为使用特殊的化疗方案是个好主意。不过,系统并没有直接帮他做出这个决定,也没有告诉他任何新的东西。


Jupiter 是美国仅有的两家使用了 Watson for Oncology 的医院之一。该系统在印度和东南亚的用户更多一些。那里的很多医生表示 Watson 帮助他们节省了时间,并且也让更多患者得到了有质量的治疗。但是,他们同时也认为,在面对不同医疗问题和社会经济环境的客观条件下,Watson 的精确度和总体上的能力还是有所局限性。


尽管 IBM 在近年来积极进行推广,Serena Williams、Bob Dylan、Jon Hamm 等名人都曾为 Watson 高调宣传,但是公司高层却并不总是持乐观态度。在面对 STAT 的采访时他们承认,系统目前面临着很多挑战,需要更好地整合电子医疗记录以及获取更多的真实患者数据才能找到合适的模式,进而给出最好的治疗方案。


「随着 Watson 变得更加智能,它可以通过更加自动化的方式为人们提供建议,到时候我们直接启动开关便能得到答案。」在今年 8 月上旬离开公司的前 IBM 健康副主管 Andrew Norden 博士说道,「就像我说的一样,你肯定会感觉到,这的确非常困难,而且需要细致入微的工作才能完成。」


但是,这种「细致入微」却与 IBM 在销售 Watson 时所进行的精心描述有所不同。


在 Watson for Oncology 的设计过程中,并没有一个独立的第三方研究机构来进行监督。IBM 并没有将自己的产品向外界的科学家或者是临床实验展示,也没有请他们来评估 Watson for Oncology 的效用从而并给出建设性的意见。


虽然在过去,公司不愿外界介入自己产品研发的情况也存在,但是 IBM 与此还有所区别,因为 Watson for Oncology 还未完成开发,就已经部署在全世界了。


韩国一位风险投资人兼研究者 Yoon Sup Choi 写了一本有关医疗卫生中的人工智能的书,其中提到,IBM 在其将系统卖给医院之前并没有被监管机构要求在韩国或者美国进行临床试验。考虑到医院已经开始使用这个系统,再去进行临床试验似乎也不太可能改变目前的现状。


「这很冒险,不是吗?」Choi 说,「如果临床试验的结果不是特别好,那么对于整个 IBM 来说绝对是个坏消息。」


Pilar Ossorio 是威斯康辛大学法学院的法律与生物伦理学教授,她表示,Watson 应该受到更加严格的约束,因为它在扮演着治病救人的角色。「作为一个伦理学和科学问题,你有必要在开始执行之前证明你所做的是安全且有效的,」她说。


Norden 反对上述要求 IBM 在商业化 Watson 前需要进行临床试验的声音,他强调,很多在市场上大卖的药物也没有接受随机对照试验。


「难道曾经有针对空降兵的降落伞进行随机试验吗?」他问道,「显然没有。因为里面存在着很强的直觉性。所以我认为,通过获取最佳信息来进行医学决策的可行性是显而易见的。」


IBM 方面表示,从申明可以看到,他们已与产业界和同行评审期刊进行合作研究,并展示了数据。有部分医生认为,他们不需要去看更多的研究来了解这个系统是否有价值。「在未来,人工智能肯定会在所有医疗领域施展拳脚。」韩国嘉泉大学 Gil 医疗中心负责运营 Watson 项目的 Uhn Lee 博士说道。「就像我说的,如果这种改变不可避免,那么为什么我们不早点开始呢?」


到目前为止,惟一能看见的 Watson for Oncology 研究只有会议摘要。完整结果还没有在同行评议杂志上发表——在作者名单上可以发现,每一项研究不是付钱找人负责,就是由 IBM 自己的员工领导,当然也有二者合作完成的。大部分非常积极的结论都显示,Watson 节省了医生的时间,并且其给出的结果和医生的治疗建议也高度契合。


「契合度」的调查由 Watson for Oncology 绝大多数的公开研究所组成。医生们会询问 Watson,让它给出大量治疗不同病人的建议。然后,人们将所得到的建议与肿瘤学家给出的进行比较。在一份来自丹麦的未发表调查中可以看到,人机诊断的一致度只有大约 33%——所以医院决定不够买这套系统。然而在其他国家,Watson 对有些癌症的诊断契合度竟然可以达到 96%。话虽如此,但即便表明了 Watson 的判断与医生一致,也只能证明它有能力胜任现有的治疗方案,而不是说它就可以改进它们。


IBM 高层表示,虽然照目前看来还遥遥无期,但是他们正在推进研究检验这种影响会如何施加在医生和患者身上。


对 Watson 的质疑已经开始出现在公众的视野,包括最近一篇 Gizmodo 上的头条文章「为何人人都在反感 IBM Watson——包括那些助力创造它的人。」最轰动的一次发生在二月份,当时隶属于德克萨斯大学的 MD Anderson 癌症中心取消了自己同 Watson 的合作关系。


本质上讲,MD Anderson 联盟负责了早期 Watson 在医疗健康领域的开发。Houston 医院曾是 IBM 的第一批合作伙伴,当时他们使用该系统来创造自己的肿瘤专家建议系统,和 IBM 当时正与 Memorial Sloan Kettering 联合开发的系统类似。但是后来这个项目因为内部超支、延误以及管理不善等原因而告终。从统计来看,MD Anderson 失败之前在该项目上投入了 3 年时间,花费了近 6000 万美金,其中有一大部分花销来自聘请咨询师。


对此,医院拒绝做出任何回应。但是该项目前主管 Lynda Chin 博士在她关于这一话题的首次采访中向 STAT 透露了她当时遭遇的挑战。Chin 在 MD Anderson 项目失败之前离开了公司,后续审计表明,在她的领导下,项目曾有几项违反采购规则的行为。


据 Chin 透露,Watson 的技术的确十分强劲,但是要在医疗健康领域有所功效却是异常困难的一件事。她和自己的团队遭遇了大量困难,其中有一些至今也没有被 IBM 在 MD Anderson 或其它地方的团队攻破。


当时团队遇到的第一个重大挑战与机器处理特异性医疗记录有关:缩写、人为错误、速记、以及不同人的记录风格。「教一个机器去阅读一份记录远超任何人想象,」她说道。她的团队在这个问题上花费了大量时间,力图让 Watson 能够从医疗记录中提取有价值的信息,用于自己的诊断结果。


Chin 表示,在临床应用中部署该系统也非常具有挑战性。和医药业一样,即便在医生的指导下,作为机器的 Watson 要为人类患者提供治疗建议也会带来很多复杂的问题。比如,如何检验数字治疗建议机器人的安全性,如何确保机器人是按照规章行事,以及医生和护士在日常工作中应该如何与其合作。


「重要的是,」Chin 说,「我们应该建立怎样的环境才能确保医药行业最重要的原则不被打破呢,这个原则是『机器人的决定不能对人造成伤害吗?』」


于是最后,该项目陷进了一个更大的泥潭:即便你可以让 Watson 理解不同患者的情况并给出相应的治疗建议,但是要获得足以显著提升治疗水平的知识,又应该如何从足够多的资源那里获取足量的患者数据呢?


Chin 表示这的确非常困难。Watson 没有一个可以获取源源不断患者数据的网络资源。「你可能只有 10000 个肺癌患者,这个数字其实没有很大。」


她继续说道,如果能有更多患者数据的话,就可以从中找出模式——不同类别的患者数据可以找到不同的特征,这对针对性治疗与精确用药很有帮助。但是如果不能扩大现有数据集,上述愿景是无法实现的。


IBM 告诉 STAT,Chin 的工作与 Watson for Oncology 的开发没有关系,Watson for Oncology 在前期是经 Memorial Sloan Kettering 中心的癌症专家验证过的。IBM 表示,Watson for Oncology 能够从患者数据中提取并归纳出最重要的内容,之后临床医生会对其进行验证。通过这种方式,人们可以获得更多的数据来提升 Watson 的性能,效果显著。另外,IBM 与医疗健康出版商 Elsevier 和分析研究公司 Doctor Evidence 都有合作关系。


到目前为止,五大洲内已经有超过 50 家医院或技术公司认可 IBM,并将 Watson for Oncology 用于治疗病人。此外,也有其他人在使用 Watson 的基因与临床试验产品。


但是,IBM 在与 Memorial Sloan Kettering 中心进行的合作中所催生的产品却为双方带来了麻烦。目前,IBM 已经用精心编辑的申明和误导性的市场营销对此进行了掩盖。


韩国人 Tae-hyun Cho (右)在 Gachon 大学 Gil 医疗中心与肿瘤学家查看Watson for Oncology 系统上的医疗信息


在新闻发布会中,IBM 仅将 Memorial Sloan Kettering 描述为 Watson 系统的训练者,并给予了高度评价。毕竟,有谁能比全球最好的癌症中心的医生更好地训练这个系统呢?


但是,有一些医生却表示,Memorial Sloan Kettering 的训练给系统参入了偏见,因为他们放入 Watson 的治疗建议与世界上其他地方的医生工作不符。


在同样的临床问题下,医生们可以(其实经常如此)不同意 Watson 给出的最佳建议,无论是推荐手术,或者是化疗,抑或是更换治疗方案。这些被否定的方案一般会在首次治疗失败之后,在第二或者第三论治疗中被使用,因为在这种情况下,支持某种治疗方案的证据度变弱了,一切都变得比较模糊。


对此,IBM 高层在营销和采访中都否定了这个悖论,他们淡化了这个问题。在接受 STAT 的采访时,DiSanzo 明确否认 Memorial Sloan Kettering 中心的参与为系统参入了任何偏见。


她表示:「我们使用的数据都已经剔除了所谓的偏见。」这里的数据指的是患者的数据和数以百万计的论文和研究成果。


但她的这番话与 Watson for Oncology 的实际情况不符。(IBM 后来称,Dizanzo 其实指的是总体上的 Watson。)


Watson for Oncolog 本质上是 Memorial Sloan Kettering 癌症中心的便携式系统。它的治疗建议完全建立在医生所提供的训练的基础上,即医生决定着 Watson 制定建议所需的信息,也决定着它究竟该给出何种建议。


当用户向 Watson 寻求建议时,这个系统还会搜索已发表的文献,利用一些相关研究与背景信息来使自己有据可依,其中一些文献出自 Memorial Sloan Kettering 癌症中心。但其建议本身则来自该院医生的训练,而非搜索来的文献。


Memorial Sloan Kettering 癌症中心的医生承认对 Watson 存在影响。Andrew Seidman 是该中心训练 Watson 的主要成员之一,他说道:「我们非常乐意插入我们的偏见,因为我认为它建立在前瞻性随机试验所得出的最佳结果的基础上,而这个结果颇富经验。所以这个偏见十分的『没有偏见』。」


Seidman 表示,医院会十分谨慎地使训练保持在以临床证据为依据的状态,但若它偏离了这个状态,系统仍旧会给出建议。他说道:「我们希望癌症护理得以民主化,而不愿看到医生由于在罕见的癌症方面临床因经验不足而束手束脚。我们想要分享这个知识库。」


最近,在曼哈顿上东区举行的 Watson 训练讨论会中,系统的开发过程得以全面展示。现场有 STAT、Seidman 带领的 Memorial Sloan Kettering 医生团队,以及一些训练 Watson 治疗膀胱癌的 IBM 工程师。五位 IBM 工程师坐在桌子的一侧,他们对面是三位肿瘤学家——一个专攻手术,一个专攻放射,还有一个专攻化疗与靶向药物。


讨论几分钟后,大家提出了一个问题,面对那些已经经历了六轮化疗但仍有癌症的患者来说,应该给他们推荐怎样的治疗方案呢?这种情况下的选择余地其实如同支撑那些方案的证据一般稀少。Watson 应该建议进行根治外科手术来切除膀胱吗?肿瘤学家 Tim Donahue 博士强调说,照他的经历看,这种手术鲜有能治愈患者的,而且对提升患者的生存几率可能性也不大。


那如果让患者接受化疗与放射的组合式治疗可行吗?


当 Watson 给出建议时,会以不同颜色来区分优先级,建议度最高为绿色,可选方案为橙色,不推荐方案呈红色。


但是,在真实的临床情况下,要对方案分级其实很困难。


肿瘤学家 Marisa Kollmeier 博士表示,这正是整个 Watson 系统进行诊断的一大难题。「在缺少证据的情况下,你完全不知道是否应该推荐某种方案。我们并没有一个随机试验去支撑每个决定。」


不过现在,医生的任务就是提前做好备案,所以他们考察了一系列临床病例。有些案例中可以找到很多证据来支撑治疗决定,但是更多的却并非如此,充斥着由于患者特异性而带来的不可避免的变数。


这次会议仅仅是长达数月研究中的一次,该研究力图将加速 Watson 在膀胱癌诊断中的应用。其中一些重要的会议涉及到了将 Memorial Sloan Kettering 中心的真实患者数据录入 Watson,然后医生才能通过反复训练来增强 Watson 的学习能力。


但是这些训练并不是让 Watson 根据患者的最终情况来决定自己的诊断建议,相反,Watson 会基于 Memorial Sloan Kettering 中心内科医生的选择来作出自己的判断。


在一些使用 Watson 的机构那里,由于 IBM 方面未澄清上述癌症中心在背后的工作,人们会产生一些困惑。有些人还以为他们得到的建议是来全球范围内其他医生给出的。


「就像我们跟患者们说的一样,这就像是另一次诊断,不过是在世界范围内进行的。」Jupiter Medical Center 中心的的胸腔肿瘤医疗主管 K. Adam Lee 博士在 STAT 六月份的采访中表示。


「的确是世界范围的,」医院的肿瘤护士 Kerri Ward 补充道,「它来自临床数据库中的 300 份肿瘤期刊。目前为其提供临床信息的是国家临床数据库、各类期刊、教科书以及 Sloan Kettering 癌症中心。」


美国新泽西州的 Hackensack Meridian Health 中心目前正在使用 Watson for Oncology,其 CEO Robert Garrett 表示,Watson 使用的数据来自全球。「如果你是一个结肠癌患者,据我所知,他们的数据库中存有全球范围不同医生对内结肠癌的不同治疗方法,同时也有不同阶段结肠癌最有效的治疗方法。


不过上述人均无法清楚地讲出了 Watson for Oncology 的工作方式。


其它一些国家考察过 Watson 的医生告诉 STAT,Memorial Sloan Kettering 中心在这里扮演的角色让他们无法正常工作。丹麦和荷兰的研究者说,在他们的国家没有医院使用 Watson,因为系统的建议过于偏向美国医生的喜好了。


荷兰阿姆斯特丹大学附属医院 Academic Medical Center 流行病副教授 Martijn van Oijen 表示,虽然 Memorial Sloan Kettering 中心拥有全世界最顶尖的专家,但是他们并不能垄断癌症治疗技术。「这是一家有着和世界其他医院不同治疗方法的美国医院,这一点不好。」他说。van Oijen 参与了国家发起的评估类似 Watson 的系统的计划,他坚信人工智能可以用于帮助癌症医生。


丹麦一家医院的肿瘤学家称,当他们发现当地医生对 Watson 给出的治疗建议的一致度仅有 33% 时,他们便放弃了该项目。


「我们已经同 IBM 进行了一次讨论,并告诉他们其系统在全球化语境中非常受限,基本来说,就是他们把过多精力放在了美国的相关研究上,而没有太多考虑更广泛的国际情况,如欧洲和世界其他地方的研究,」Leif Jenson 博士说,他是哥本哈根国王医院的主管,该医院有肿瘤科。


如果一些国家的医生曾在美国进行过训练,或者他们的治疗方式类似于 Memorial Sloan Kettering 中心的医生,那么 Watson for Oncology 对他们来说就是有用的。中国台湾的治疗方式就和美国一样,所以 Watson 在这里给出的建议就是有用的,台北医学大学癌症中心副主管 Jeng-Fong Chiou 表示。今年七月,他们已开始将 Watson for Oncology 用于患者治疗。


但他同时也表示,台湾患者和美国患者之间还是存在差异。为了最小化副作用,台湾患者的用药剂量一般会小一些。所以当他们的肿瘤医生在开药时一般会对 Watson 给出建议做些许调整。即便是在 Memorial Sloan Kettering 就诊的丰富人群也不能代表全世界的多样性。因此,用于训练 Watson 的那些数据没有考虑经济和社会问题,它们不适用于那些贫困国家的患者,威斯康辛大学法学教授 Ossorio 强调道。


「需要进一步研究的是不同种族、性别与阶层之间的差异,」她说,「我们正将社会差异不加区分地掺入进去,同时我们也在生成偏见,即便它们不那么明显,不太容易被人发现。」


有时候,Watson 会做出和医生差异巨大的决定,其依据的理由可能完全与科学无关,比如医保问题。在韩国 2017 乳腺癌大会的一张海报上可以看到,研究人员报告称,Watson 最常给乳腺癌患者开出的治疗方案,其费用国家医保制度完全无法覆盖。


IBM 表示,为了提高 Watson 的性能,他们已经组建了一支国际咨询团队,来收集输入数据。同时他们也表示,系统可以对治疗的实际情况,药物有效性的差异以及财政情况等多方面进行考量,此外,IBM 最近也引入了新工具,用于帮助用户更快且更低成本地适应 Watson。


Memorial Sloan Kettering 中心在接受 STAT 的采访时表示,训练 Watson 的数据中包含了国际性的期刊,比如 Lancet、European Journal of Cancer、Annals of Oncology 和 BMJ。「就像我们在所有癌症研究领域做的那样,我们将继续观察、研究如何让 Watson for Oncology 的治疗变得国际化。我们将与 IBM 合作优化这个系统。」该中心如此表示。


为了适应自己的病人,有些国家的医院在对该系统进行本地化,他们向其添加本地的治疗数据。泰国 Bumrungrad International Hospital 医院 Watson for Oncology 项目负责人 Nan Chen 表示,他们的肿瘤学家在治疗胃癌的时候使用的是日本的标准,而非美国。


但是他同时也表示,那里的医生会认为这种本地化是多余或者不必要的:他们交给 Watson 治疗方案,然后在治疗过程中听到 Watson 给出同样的方案,这不是明显多余吗,他们不感兴趣。


「我们的医生表示,这些治疗方法本来就是我们的,我们自己很清楚,」Chen 说,「你不需要辗转一圈,将这些方法输入 Watson,然后让 Watson 来告诉医生他们在医院应该使用什么治疗方案。」


Chen 说,这样经过本地化的系统的确非常好,但是对于一家蒙古医院的肿瘤专家来说,却完全没有任何用处。


UB Songdo Hospital 医院,Chen 的公司是该医院的最大股东,医生们几乎 100% 地按照 Watson 给出的建议来治疗病人。那些过去本应该接受全科医生(没有或者有一点点癌症训练的医生)治疗的病人,现在也可以得到顶级专家的意见了。


Chen 表示,「这正是 IBM 所畅想的那种场景。」


在韩国,釜山国立大学医院肺癌肿瘤学家 Warwoo Kang 博士提出了另一个 Watson 需要解决的重要问题。到目前为止,Watson 可以为自己诊断建议提供支撑证据,但是它不能解释对特定患者给予特定治疗建议的理由。


Kang 表示,有时候他会针对一个癌症还未扩散到淋巴结的患者的情况向 Waston 寻求建议,Watson 会给他推荐一种叫 taxane(紫杉烷)的化疗药物。但是他说,这种疗法一般只有当癌症已经扩散道淋巴结才会使用。然而,为了支撑自己的治疗建议,Watson 会向 Kang 提供研究材料,证明 taxane 对于治疗癌症扩散到淋巴结的患者是有效的。


于是,Kang 产生了疑惑,不明白为什么 Watson 会给他推荐一个他平时不会对患者使用的药物,而不告诉他原因。


IBM 健康部门发言人 Louisa Roberts(左)与默克总经理 Oliver Maschinsky(右) 于芝加哥召开的 2017 ASCO 会议中的 Waston 展位前。


在各种声音中,世界上还有部分使用 Watson 的医生坚持认为,人工智能将来一定会变革医疗健康事业。他们表示,临床医生正在获得很多实在的好处——节省了宝贵的搜索文献时间;可以更好地教育患者;削弱了临床治疗中的层级差异,让那些需要证据支持的治疗不再成为干扰因素。


在台湾,Chiou 表示 Watson 可以立即从治疗某种疾病的知识库中调出「最佳数据」——比如生存率——这可以方便医生,无需专门询问系统去搜索比较每种可能的治疗方案。


不仅如此,Watson 也可以为患者提供信息,帮助他们更好的认识自己的病情,韩国 Gil 医学中心负责 Watson 项目的医生 Lee 表示。以前,医生会向患者解释不同的治疗选项。而现在,内科医生可以给患者一个由 Watson 准备好的内容详尽的信息包,里面包含了可能的治疗方案以及相关的科学文献。患者可以自行对这些方案进行研究,甚至可以不同意医生给出的治疗方案。


Lee 表示:「这是那些最重要且颇具影响力的改变之一。」


此外,Watson 还可以让医生用数据而非资历说话。在 Gil 医学中心,患者坐在一间屋子中,里面有五位医生以及 Watson,屏幕上显示着「Watson 中心」。Lee 表示,Watson 的出现深刻改变了医生的决策过程,让过去那种凭资历说话的现象少了很多。


Watson 可以让年轻医生方便、快速地接触到那些可能证明其前辈判断是错误的数据。这些数据可以显示在屏幕上,比如在推荐的治疗方案旁附带生还率等等。在这种有证据支撑的情况下,如果资深医生还要强行执行另一种治疗方式,那么会显得很丢脸,Lee 说道。


印度 Manipal 医院的 S.P. Somashekhar 博士表示,尽管 Watson 对直肠癌和乳腺癌患者的建议会根据地域而有所区别,但是这些都是极少数的情况:对于大部分患者,系统会比对由医院肿瘤科给出的治疗建议——一般而言,一支 20 人组成的内科医生团队会花一周来研究患者的病例,然后用 1 小时来进行讨论。


这意味着,Watson 可以在很短时间内就完成 20 名医生需要 1 周时间才能完成的任务。「这非常珍贵,而且具有很高价值,」Someshekhar 表示,「我们的内科医生不可能去讨论所有的案例。我们每就一个案例展开讨论会导致错过另外五个案例的讨论。」


尽管这些优势十分显著,但是它们缺乏能够预测和根除疾病的突破性发现。


IBM 高层表示,这不意味着 Watson 就不能完成这些壮举。Watson for Oncology and Genomics 的前副主管 Norden 说,最终的目标是将临床试验数据和真实患者数据结合,以便 Watson 可以开始凭借自己的力量找出最佳治疗方案。


「我个人相信,我们可以更好地测量以及报告患者的症状,并且这些数据将会愈发重要,」他说,「对今天的癌症问题来说,我不认为有任何系统可以不借助人类专家的帮助就能开始对患者进行治疗诊断。」


对 IBM 而言,更大的问题是,医疗健康事业是否能见证人工智能的革命呢?究竟谁会推动它呢?


一位前 IBM 雇员表示,公司会成为其市场成功的受害者——因为设置不切实际的期望会掩盖真正的成就。


「IBM 应该放弃癌症治疗,」IBM 前品牌经理 Peter Greulich 表示,他已经写了关于 IBM 的历史以及现代挑战的书。「他们让市场失控,失去了建立、制造一个产品的规则。」


Greulich 称,IBM 需要为 Watson 投入更多的资金并雇佣更多的人。他表示,在上世纪 60 年代,IBM 能以其年收入 11.5 倍的资金来开发其大型计算机以及一系列至今还能提供大量收益的业务。


如果今天要以同样的比例来投资 Watson 的话,IBM 需要大约 1370 亿美金。「为此,IBM 只有回购股票才行,」Greulich 说。


IBM 在一份申明中称,是他们创造了人工智能市场。他们很高兴看到随着 Watson 的成长,有很多新的业务得以发展,并在过去的三年中,其价值已经超过了 200 亿美金。「Facebook 和 Amazon 需要超过 13 年才能有 200 亿美金的的增收。」


自从 Watson 在 2011 年「Jeopardy」比赛中出现以后,已经有成百上千家公司开始使用人工智能技术开发医疗健康产品,包括许多创业公司,IBM 也会面对产业巨头的强劲挑战,比如 Amazon、Microsoft、Google 以及 Optum division of UnitedHealth Group。


以 Google 的 DeepMind 为例,其开发的程序「AlphaGo」于去年 3 月击败了围棋世界冠军。


尽管 DeepMind 遭遇了隐私问题,但它仍选择与伦敦的医院合作来学习如何检测眼部疾病,并加快了对于头颈部癌症的靶向治疗进程。


同时,Amazon 成立了一个健康护理实验室,来探寻从电子健康记录中挖掘数据的机会,并有望开发出虚拟医生助理。


最近,一家名为 Jefferies 的金融公司在报告中指出,IBM 的竞争力正在飞速下跌。他们总结道:「看起来,IBM 在这场人工智能的人才争夺战中处于下风,并有可能面临愈发激烈的竞争。」


这篇报告虽然并不针对 Watson 的健康护理产品,但它确实表明,由于 Watson 的实施伴随着高昂的咨询成本,它的潜在客户正慢慢对该系统敬而远之。报告还指出,Amazon 的工作清单是 IBM 的 10 倍,而最近 IBM 在收购 Truven 后,并未与一些承包商续约。去年,Truven 以 26 亿美元的重金获得了一亿病例的访问权限。


IBM 在声明中称工人合同已经终止,并且正在为马萨诸塞州剑桥市的 Watson Health 及其他单位广纳贤人,在美国开设了 5000 多份岗位。


不过,那些肿瘤领域的相关人员表示,Watson for Oncology 的前景仍颇具挑战性。Kris 表示,这个系统有实现改善并能保证更多病人得到专业治疗的潜力。但 Watson 还处于初级阶段,在现实世界仅仅是一名初学者。


Kris 说道:「没有人愿意听到这个消息。他们唯一想听的就是『Watson 便是答案』。人们希望 Waston 不仅能够物美价廉,还可以人性化。」


登录查看更多
0

相关内容

IBM 开发的继深蓝之后的新一代大型计算机。 Watson得名于IBM创始人Thomas J. Watson,是当下人工智能的最高端应用。
AI创新者:破解项目绩效的密码
专知会员服务
33+阅读 · 2020年6月21日
《人工智能2020:落地挑战与应对 》56页pdf
专知会员服务
196+阅读 · 2020年3月8日
IBM《人工智能白皮书》(2019版),12页PDF,IBM编
专知会员服务
20+阅读 · 2019年11月8日
BioMind ™:勇做神经影像AI领域的探路者
医谷
4+阅读 · 2019年4月23日
Hinton最新专访:别让AI解释自己,AI寒冬不会再来
GAN生成式对抗网络
3+阅读 · 2018年12月17日
IBM沃森会成为第一个被抛弃的AI技术吗?
AI前线
7+阅读 · 2018年9月14日
半路转型做人工智能,谁说不可行?
AI前线
3+阅读 · 2018年2月28日
【智能医疗】如何利用深度学习诊断心脏病?
产业智能官
8+阅读 · 2017年10月3日
Arxiv
136+阅读 · 2018年10月8日
Arxiv
7+阅读 · 2018年6月1日
VIP会员
Top
微信扫码咨询专知VIP会员