阿里健康夺冠中文电子病历实体识别评测任务

2018 年 8 月 17 日 AI掘金志



雷锋网《AI掘金志》频道:只做 AI +「安防、医疗、零售」三大传统领域的深度采访报道。


雷锋网AI掘金志消息,全国知识图谱与语义计算大会(CCKS 2018)于 8 月 14 日至 17 日在天津举行。在中文电子病历命名实体识别评测任务中,阿里健康团队夺得冠军。


CCKS 是由中国中文信息学会语言与知识计算专业委员会(CIPS)定期举办的全国年度学术会议,致力于促进中国语言与知识计算领域的学术研究和产业发展,为从事相关领域理论和应用研究的学者、机构和企业提供广泛交流的平台,已经成为国内知识图谱、语义技术、语言理解和知识计算等领域的核心会议。


这一事件在雷锋网旗下学术频道AI科技评论数据库产品「AI 影响因子」中获得相应加分。


CCKS2018 的电子病历命名实体识别任务基于 600 份标注好的电子病历文本,参赛者需通过识别并抽取出其中与医学临床相关的实体,并将它们归类到预先定义好的类别中,包括解剖部位、独立症状、症状描述、手术和药物等五类实体。


阿里健康团队以两种序列标注算法为基础,首次在医疗文本领域采用了 cw2vec 的方法构建词向量矩阵,基于全部的非标注文本和标注文本集训练词向量,以解决新字无法识别的问题;同时改进了汉字结构和拼音的特征的一般方案。最终,团队以严格指标 0.8913 的成绩取得了第一名。


「医疗命名实体识别只是我们团队工作的一小部分,也是我们面向医院和医生提供医疗人工智能服务的基础。」阿里健康人工智能实验室主任范绎表示,阿里健康团队长期专注通过实体识别、实体链接、关系提取等手段从电子病历中识别信息,并在此基础上对信息进行融合和整合,以知识图谱的呈现形式,为其他服务提供数据基础。


据了解,基于电子病历数据,阿里健康打造了大数据科研平台、临床辅助决策引擎等针对医院和医生的多款产品,为广大医生和用户提供更加智能的用户体验,帮助其提升专业水平和工作效率。


电子病历结构化是让计算机理解病历、应用病历的基础。基于对病历的结构化,可以计算出症状、疾病、药品、检查检验等多个知识点之间的关系及其概率,构建医疗领域的知识图谱,进一步优化医生的工作。


长按二维码,关注雷锋网旗下「AI掘金志」


登录查看更多
40

相关内容

阿里健康是阿里巴巴集团“Double H”战略(Health and Happiness)在医疗健康领域的旗舰平台,是阿里巴巴集团投资控股的公司之一。
目前,阿里健康开展的业务主要集中在产品追溯、医药电商、医疗服务网络和健康管理等领域。
专知会员服务
160+阅读 · 2020年4月21日
中文知识图谱构建技术以及应用的综述
专知会员服务
312+阅读 · 2019年10月19日
医疗知识图谱构建与应用
专知会员服务
384+阅读 · 2019年9月25日
评测 | 2020 年全国知识图谱与语义计算大会评测任务征集
多因子融合的实体识别与链指消歧
AI科技评论
10+阅读 · 2019年8月20日
SMP2018中文人机对话技术评测
哈工大SCIR
12+阅读 · 2019年3月6日
OD-GCN: Object Detection by Knowledge Graph with GCN
Arxiv
4+阅读 · 2019年9月30日
Domain Representation for Knowledge Graph Embedding
Arxiv
14+阅读 · 2019年9月11日
Arxiv
10+阅读 · 2018年4月19日
Arxiv
7+阅读 · 2018年4月11日
Arxiv
3+阅读 · 2018年4月3日
VIP会员
相关VIP内容
专知会员服务
160+阅读 · 2020年4月21日
中文知识图谱构建技术以及应用的综述
专知会员服务
312+阅读 · 2019年10月19日
医疗知识图谱构建与应用
专知会员服务
384+阅读 · 2019年9月25日
Top
微信扫码咨询专知VIP会员