Petuum 专栏
作者:Yuan Yang、Pengtao Xie、Xin Gao、Carol Cheng、Christy Li、Hongbao Zhang、Eric Xing
机器之心编译
在过去一年中,我们看到了很多某种人工智能算法在某个医疗检测任务中「超越」人类医生的研究和报道,例如皮肤癌、肺炎诊断等。如何解读这些结果?他们是否真正抓住医疗实践中的痛点、解决医生和病人的实际需要? 这些算法原型如何落地部署于数据高度复杂、碎片化、异质性严重且隐含错误的真实环境中?这些问题常常在很多「刷榜」工作中回避了。事实上,从最近 IBM Watson 和美国顶级医疗中心 MD Anderson 合作失败的例子可以看出,人工智能对医疗来说更应关注的任务应该是如何帮助医生更好地工作(例如生成医疗图像报告、推荐药物等),而非理想化地着眼于取代医生来做诊断,并且绕开这个终极目标(暂且不论这个目标本身是否可行或被接受)之前各种必须的铺垫和基础工作。因此与人类医生做各种形式对比的出发点本身有悖严肃的科学和工程评测原则。这些不从实际应用场景出发的研究,甚至无限放大人机对战,对人工智能研究者、医疗从业者和公众都是误导。
知名人工智能创业公司 Petuum 近期发表了几篇论文,本着尊重医疗行业状况和需求的研究思路,体现出了一种务实风格,并直接应用于他们的产品。为更好地传播人工智能与医疗结合的研究成果,同时为人工智能研究者和医疗从业者带来更加实用的参考,机器之心和 Petuum 将带来系列论文介绍。本文是该系列第三篇,介绍了使用深度学习在就诊时间预测出院用药的方法。
随着美国电子健康档案(EHR)的普及以及医疗健康数据新来源的快速发展,一场医疗与健康数据的海啸已经出现。随着数据的数量增长和复杂度增加,医疗分析和决策正变得越来越耗时、易出错、结果不理想。在各种临床决策中,制定理想的治疗方案是至关重要并且很有难度的一个。即使在确诊的前提下,医生仍需要伴随患者病程不断优化治疗方案。例如并发慢性心力衰竭和高血压的慢性肾病患者,因心衰恶化入院,医生则需要已经使用的抗高血压药物进行调整,比如改变利尿剂的种类和剂量等。因此对于新确诊的病人,根据入院就诊时得到的有限信息预测该病人在出院时的药物治疗方案对医生来说是一件具有挑战的事情。在入院时,医生会了解病人的就诊原因, 病史(包括共病情况, co-morbidities)等,进行相关实验室或影像学检查等并记录在入院病历中(admission note)。借助先进的机器学习与深度学习技术,我们从上万份的患者入院病历记录中提取关键信息,对出院用药实现了更准确的预测。
精准的出院用药预测能向医生提供指导,帮助医生及时发现用药偏差(medication discrepancy)。用药偏差是指在患者入院,转院,出院过程中用药方案在记录过程中发生的非计划性的改变。在美国 70% 的患者受到用药偏差的影响,其中⅓可能对患者造成中度至重度的危害。为了解决用药偏差可能带来的问题,药物核对(medication reconciliation)作为一个保证患者治疗安全的重要环节,要求医生在患者入院及出院环节对药物方案进行仔细核实与比对。入院时对出院用药的预测可以帮助医生及时发现用药偏差,避免由于药物重复或遗漏可能造成的病人安全风险问题,同时这种预测可以作为一种有效的早期预警工具帮助医生尽早监控管理药物的处方,并及时减少不必要的用药疏失(medication error)。
在利用深度学习方法在入院就诊时间对出院药物进行预测的过程中,主要有有两方面的困难。首先,可用的就诊信息大多数都是非结构化的病历记录(称为入院记录),比如既往病史、家族史、过敏等情况。与实验室检测数据和体征数据等结构化信息相比,这些自由形式的文本更难被机器处理和理解。此外,这些记录还包含了同义词、缩写和拼写错误。因此,从这些非结构化且有噪声的文本中有效提取语义模式是我们需要解决的第一个问题。其次,在临床上,为了快速并有效的治愈疾病,达到治疗目的,常常会使用两种或两种以上的药物,许多联合用药的方案在临床治疗指南或专家共识中被广泛认可。例如,对已服用阿司匹林的中风病人,为了有效预防再次中风的发生,医生会推荐双联抗血小板治疗(dual anti-platelet therapy),既同时服用阿司匹林和氯吡格雷。大量研究表明多重药物的联合治疗对疾病的进展,预后及死亡事件的发生都有一定的影响。如何自动发现和利用药物之间的这种相关性,对于更准确的多药物预测是至关重要的,这也是非常有价值的。
论文:基于深度学习在就诊时间预测出院用药(Predicting Discharge Medications at Admission Time Based on Deep Learning)
论文链接:https://arxiv.org/abs/1711.01386
摘要:在病人入院就诊时预测其出院用药可以帮助医生更好地计划和核对用药方案、发现用药偏差、降低用药安全风险。由于病人在住院期间病情进展不尽相同,仅利用就诊时可用的有限信息对病人出院情况进行预测会较为困难。本文研究了如何使用深度学习技术来协助医生根据病人就诊记录中的健康信息来预测其出院用药。在实现上,我们设计了一种卷积神经网络来分析就诊记录然后预测病人在出院时的用药。该模型可以从非结构化和有噪声的文本中提取语义表征,并能自动学习不同药物之间的药理相关性。我们在 2.5 万份病人就诊记录上对该模型进行了评估,并与 4 种基准模型进行了比较。在宏平均 F1 分数上,该方法相对于最好的基准模型有 20% 的提升。
贡献
本文提出了一种以电子健康档案为输入,预测一种或多种出院用药的卷积神经网络(CNN)模型。该模型可以从原始文本中学习到丰富的语义表征,并且可以自动获得药物之间的相关性。我们在 2.5 万份病人就诊记录上对抗高血压药这一特定药物类别上对该模型进行了评估。在平均 macro F1 分数上,我们的方法比最好的基准好 20%。
方法
研究设计
我们在之前收集到的重症监护病房(ICU)病人的电子健康档案进行了回顾性研究(retrospective study),根据就诊记录构建了一个预测出院用药的深度学习模型。我们对比了该模型和其他四个基准模型所预测的药物与医生给出的药物的区别,从而评估了模型的性能。
数据预处理
该研究使用了 MIMIC-III 数据集并且重点关注了其中出现的 8 种抗高血压药:美托洛尔(metoprolol)、呋塞米(furosemide)、赖诺普利(lisinopril)、氨氯地平(amlodipine)、阿替洛尔(atenolol)、氢氯噻嗪(hydrochlorothiazide)、地尔硫卓(diltiazem)、卡维地洛(carvedilol)。
图 1:8 种抗高血压药物在 MIMIC-III 数据集中的频率,Hctz 是氢氯噻嗪的简写
表 1:左栏显示 8 种就诊时可用的信息类型,右栏每行显示了 MIMIC-III 中对应的提取此类信息的标题字符串
模型设计
我们开发了一个可基于就诊时可用的信息来预测出院用药的深度学习模型。该模型的输入为就诊记录,输出是病人的出院用药(一种或多种)。该模型具备两种功能:1)能有效地从有噪声的和非结构化的原始文本中提取高层次的语义并能适当地考虑连续词汇之间的序列结构;2)其次,该模型能学习不同药物之间的药理相关性。
为了同时实现这两个目标,我们开发了一种基于卷积神经网络(CNN)的模型。从高层面看,该模型:1)使用了多个堆叠的隐藏单元层来获取输入记录的隐含语义;2) 使用了不同窗口大小的卷积算子来获取 n-gram 中存在的局部语义和序列结构;3) 可发现常见的隐含因子,从而学习得到药物之间的药理相关性。
图 2:CNN 模型的网络架构
结果
从宏平均和微平均两种 F1 分数上来看,CNN 有远高于其他所有基准模型的准确率。在两种平均 F1 分数之间,CNN 在宏平均上的提升更为显著。CNN 在 7 种药物上都得到了最好的 F1 分数。呋塞米是唯一的例外,其中随机森林(RF)的表现优于 CNN。CNN 相对于基准的提升主要体现在召回率(recall)上,而其准确率则与基准模型相当。在各类基准模型中,只使用就诊药物作为输入的 多层感知机(MLP)在宏平均和微平均 F1 上的表现最差;另外,非线性支撑向量机(SVM)和 RF 的表现优于线性的逻辑回归模型(LR)。
CNN 相较于其它基准较高的得分来源于它的分层的隐藏层结构。这样的结构使得 CNN 能在多种粒度(单词层面、短语层面和文本层面)上提取相关的语义信息。
表 2:CNN 和 4 个基准模型在 5 次实验中对每一类药物的准确率(P)、召回率(R)和 F1 的平均分数。药物从上到下按照频率降序排列。模型整体的分数分别通过以上所有分数的宏平均(Macro Avg)和微平均(Micro Avg)得到。
表 3:在单词嵌入空间中一些词(Query)和它在空间中的最近邻(NN)。两个词之间的「相似程度」对应它们的嵌入向量之间的欧式距离。
扩展阅读:
本文为机器之心经授权编译,转载请联系本公众号获得授权。
✄------------------------------------------------
加入机器之心(全职记者/实习生):hr@jiqizhixin.com
投稿或寻求报道:content@jiqizhixin.com
广告&商务合作:bd@jiqizhixin.com