开源开放 | OMAHA 联合 OpenKG 发布新冠诊疗图谱数据

2020 年 11 月 26 日 开放知识图谱

本文转载在公众号:OMAHA联盟。



今年新型冠状病毒肺炎爆发期间,大数据、云计算、人工智能等新一代信息技术支撑着我国建立和健全疫情防控机制。知识图谱作为机器认知智能实现的基础之一,是人工智能的重要组成部分,在“抗疫”行动中赋能政府管理、公众健康、交通运输、公共安全等多个领域,为疫情防控助力。

 

目前,虽然我国疫情传播已基本阻断,但境外疫情警报持续拉响,“外防输入,内防反弹”仍是我国防疫策略的重点。国务院联防联控机制科研攻关组专家组组长钟南山院士在9月18日疫情防控策略视频中提到,今年冬天或明年春天疫情应该还会继续存在,同时很可能发生局部地区的爆发。为了助力防控新型冠状病毒肺炎,2020年11月,OMAHA联盟联合OpenKG发布“新型冠状病毒肺炎”诊疗知识图谱,该知识图谱由OMAHA联盟与浙江树人学院树兰国际医学院附属树兰杭州医院、浙江大学传染病诊治国家重点实验室、中国科学院大学宁波华美医院的临床专家协作构建,受国家科技重大专项(2017ZX10204401)和浙江省自然科学基金应急重大项目(编号:LED20H260001)资助。

 

“新型冠状病毒肺炎”诊疗知识图谱采用CC-by SA协议,向行业开放共享。




  • 数据来源


基于国家卫生健康委发布的《新型冠状病毒肺炎诊疗方案(试行第八版)》和《新型冠状病毒肺炎重型、危重型病例诊疗方案(试行第二版)》,构建了“新型冠状病毒肺炎”诊疗知识图谱的Schema,并依照Schema从文献中抽取三元组知识。



图1 “新型冠状病毒肺炎”诊疗知识图谱Schema


  • 构建方法


通过自然语言处理与文本挖掘技术,采用机器与人工相结合的方式进行构建,最终所有数据都由专业人员进行了审核,确保内容的正确性。


  • 数据标准化与概念化


实体通过与“七巧板”医学术语集中的概念进行映射的方式来实现概念化和标准化。


  • 实体数量


“新型冠状病毒肺炎”诊疗知识图谱包含700个实体,实体语义类型的统计见图2。


图2 “新型冠状病毒肺炎”诊疗知识图谱实体语义类型统计


  • 关系数量


“新型冠状病毒肺炎”诊疗知识图谱包含3032条关系,部分关系类型的统计见图3。


图3 “新型冠状病毒肺炎”诊疗知识图谱部分关系类型统计


  • 资源下载


用户可以登录HiTA知识图谱服务平台(hita.omaha.org.cn)下载数据包。下载地址:https://hita.omaha.org.cn/knowledge/kgDownload?num=502


特别鸣谢

汤灵玲(浙江树人学院树兰国际医学院附属树兰杭州医院)

彭   薇(浙江树人学院树兰国际医学院附属树兰杭州医院)

顾钰丹(浙江树人学院树兰国际医学院附属树兰杭州医院)

龚忆雯(浙江大学传染病诊治国家重点实验室)

张佳颖(浙江大学传染病诊治国家重点实验室)

王晶霞(浙江大学传染病诊治国家重点实验室)

金鹏锋(中国科学院大学宁波华美医院)



“汇知”医学知识图谱


“汇知”医学知识图谱是OMAHA联盟发布的医学知识图谱资源的总称,主要切入疾病、手术操作、检验检查、药品的知识,在每个季度第二个月20号定期发布。截止2020年11月,“汇知”已发布“药品适应证”、“临床路径”、“疾病科室”、“心血管专科疾病”、“新型冠状病毒肺炎”领域的知识图谱,共包含8.5万实体、63.0万关系,其中5.4万实体与“七巧板”医学术语集建立了映射,使图谱实体概念化,而非简单的文本堆砌。


联系我们

HiTA服务:hita@omaha.org.cn

数字医学知识中心负责人徐美兰:meilan.xu@omaha.org.cn





OpenKG

开放知识图谱(简称:OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。




点击“阅读原文”,立即下载““新型冠状病毒肺炎”诊疗知识图谱”


 
登录查看更多
0

相关内容

2019新型冠状病毒 (Novel coronavirus),为新兴传染病“严重特殊传染性肺炎”病原,由世界卫生组织命名为2019-nCoV,又名武汉冠状病毒(Wuhan coronavirus)、武汉肺炎(Wuhan pneumonia)等,是一种具有包膜的正链单股RNA冠状病毒。2019-2020年新型冠状病毒肺炎事件爆发期间,研究人员在对肺炎阳性患者样本进行核酸检测以及基因组测序后发现了这一病毒。 https://zh.wikipedia.org/wiki/2019%E6%96%B0%E5%9E%8B%E5%86%A0%E7%8B%80%E7%97%85%E6%AF%92
《AI新基建发展白皮书》,国家工信安全中心
专知会员服务
182+阅读 · 2021年1月23日
《2020人工智能医疗产业发展蓝皮书》发布
专知会员服务
112+阅读 · 2020年9月11日
基于多来源文本的中文医学知识图谱的构建
专知会员服务
52+阅读 · 2020年8月21日
专知会员服务
26+阅读 · 2020年3月6日
广东疾控中心《新型冠状病毒感染防护》,65页pdf
专知会员服务
18+阅读 · 2020年1月26日
史上最大规模:这有一份1.4亿的中文开源知识图谱
机器之心
25+阅读 · 2019年10月17日
史上最大规模1.4亿中文知识图谱开源下载
专知
39+阅读 · 2019年10月14日
领域应用 | HiTA知识图谱 “药品-适应证”图谱数据发布!
Github六个知识图谱实战项目推荐
专知
379+阅读 · 2019年6月2日
CNCC技术论坛 | 知识图谱赋能数字经济
中国计算机学会
4+阅读 · 2018年9月28日
【知识图谱】CCKS-2017 行业知识图谱构建与应用-下篇
Arxiv
0+阅读 · 2021年2月1日
Few-shot Learning: A Survey
Arxiv
362+阅读 · 2019年4月10日
Arxiv
6+阅读 · 2018年1月14日
VIP会员
Top
微信扫码咨询专知VIP会员