本文转载在公众号:OMAHA联盟。
今年新型冠状病毒肺炎爆发期间,大数据、云计算、人工智能等新一代信息技术支撑着我国建立和健全疫情防控机制。知识图谱作为机器认知智能实现的基础之一,是人工智能的重要组成部分,在“抗疫”行动中赋能政府管理、公众健康、交通运输、公共安全等多个领域,为疫情防控助力。
目前,虽然我国疫情传播已基本阻断,但境外疫情警报持续拉响,“外防输入,内防反弹”仍是我国防疫策略的重点。国务院联防联控机制科研攻关组专家组组长钟南山院士在9月18日疫情防控策略视频中提到,今年冬天或明年春天疫情应该还会继续存在,同时很可能发生局部地区的爆发。为了助力防控新型冠状病毒肺炎,2020年11月,OMAHA联盟联合OpenKG发布“新型冠状病毒肺炎”诊疗知识图谱,该知识图谱由OMAHA联盟与浙江树人学院树兰国际医学院附属树兰杭州医院、浙江大学传染病诊治国家重点实验室、中国科学院大学宁波华美医院的临床专家协作构建,受国家科技重大专项(2017ZX10204401)和浙江省自然科学基金应急重大项目(编号:LED20H260001)资助。
“新型冠状病毒肺炎”诊疗知识图谱采用CC-by SA协议,向行业开放共享。
数据来源
基于国家卫生健康委发布的《新型冠状病毒肺炎诊疗方案(试行第八版)》和《新型冠状病毒肺炎重型、危重型病例诊疗方案(试行第二版)》,构建了“新型冠状病毒肺炎”诊疗知识图谱的Schema,并依照Schema从文献中抽取三元组知识。
图1 “新型冠状病毒肺炎”诊疗知识图谱Schema
构建方法
通过自然语言处理与文本挖掘技术,采用机器与人工相结合的方式进行构建,最终所有数据都由专业人员进行了审核,确保内容的正确性。
数据标准化与概念化
实体通过与“七巧板”医学术语集中的概念进行映射的方式来实现概念化和标准化。
实体数量
“新型冠状病毒肺炎”诊疗知识图谱包含700个实体,实体语义类型的统计见图2。
图2 “新型冠状病毒肺炎”诊疗知识图谱实体语义类型统计
关系数量
“新型冠状病毒肺炎”诊疗知识图谱包含3032条关系,部分关系类型的统计见图3。
图3 “新型冠状病毒肺炎”诊疗知识图谱部分关系类型统计
资源下载
用户可以登录HiTA知识图谱服务平台(hita.omaha.org.cn)下载数据包。下载地址:https://hita.omaha.org.cn/knowledge/kgDownload?num=502
特别鸣谢
汤灵玲(浙江树人学院树兰国际医学院附属树兰杭州医院)
彭 薇(浙江树人学院树兰国际医学院附属树兰杭州医院)
顾钰丹(浙江树人学院树兰国际医学院附属树兰杭州医院)
龚忆雯(浙江大学传染病诊治国家重点实验室)
张佳颖(浙江大学传染病诊治国家重点实验室)
王晶霞(浙江大学传染病诊治国家重点实验室)
金鹏锋(中国科学院大学宁波华美医院)
“汇知”医学知识图谱是OMAHA联盟发布的医学知识图谱资源的总称,主要切入疾病、手术操作、检验检查、药品的知识,在每个季度第二个月20号定期发布。截止2020年11月,“汇知”已发布“药品适应证”、“临床路径”、“疾病科室”、“心血管专科疾病”、“新型冠状病毒肺炎”领域的知识图谱,共包含8.5万实体、63.0万关系,其中5.4万实体与“七巧板”医学术语集建立了映射,使图谱实体概念化,而非简单的文本堆砌。
联系我们
HiTA服务:hita@omaha.org.cn
数字医学知识中心负责人徐美兰:meilan.xu@omaha.org.cn
OpenKG
开放知识图谱(简称:OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。
点击“阅读原文”,立即下载““新型冠状病毒肺炎”诊疗知识图谱”!