摘要: 电子病历是医院信息化发展的产物, 其中包含了丰富的医疗信息和临床知识, 是辅助临床决策和药物挖掘等的重要资源.因此, 如何高效地挖掘大量电子病历数据中的信息是一个重要的研究课题.近些年来, 随着计算机技术尤其是机器学习以及深度学习的蓬勃发展, 对电子病历这一特殊领域数据的挖掘有了更高的要求.电子病历综述旨在通过对电子病历研究现状的分析来指导未来电子病历文本挖掘领域的发展.具体而言, 综述首先介绍了电子病历数据的特点和电子病历的数据预处理的常用方法;然后总结了电子病历数据挖掘的4个典型任务(医学命名实体识别、关系抽取、文本分类和智能问诊), 并且围绕典型任务介绍了常用的基本模型以及研究人员在任务上的部分探索;最后结合糖尿病和心脑血管疾病2类特定疾病, 对电子病历的现有应用场景做了简单介绍.
https://crad.ict.ac.cn/CN/10.7544/issn1000-1239.2021.20200402
在过去的几十年里,互联网信息技术蓬勃发展, 使得数据的管理与传输变得更为高效,同时医疗机 构也构建了大量的电子病历信息库.在众多的现代 化医疗数据中,电子病历数据是最重要的医疗数据 资源之一.每天都有海量的电子病历数据在各级医 院产生,形成了医疗大数据的重要组成部分.电子病 历以患者为主体,比较完整地记录患者长期的医疗 信息,并且经过计算机技术的整理、储存、共享和分 析,是纸质病历的升级版本.电子病历的特性使得相 关信息库中同时包含着结构化数据和非结构化数 据,结构化数据如表格数据,非结构化数据如文本数 据和医学图像等.
对电子病历进行数据挖掘有巨大的应用前景, 然而电子病历数据量大、非结构化数据多的特点使 得数据挖掘十分困难.虽然早期部分研究人员利用 一些简单的电子病历数据挖掘方法如决策树[1]等辅 助诊断,但是由于技术和方法的限制,对医疗数据的 信息挖掘效果十分有限.而近年来,机器学习和深度 学习在其他领域展现的巨大潜力给电子病历的挖掘 带来了新的希望[2].本文主要针对电子病历中的文 本数据部分,结合国内外的研究现状,分析电子病历 数据挖掘面临的挑战以及现有的解决方案
专知便捷查看
便捷下载,请关注专知公众号(点击上方蓝色专知关注)
后台回复“电子病历” 就可以获取《电子病历文本挖掘研究综述》专知下载链接