项目名称: 基于自然语言处理技术的生物实体语义网络研究和应用

项目编号: No.61202304

项目类型: 青年科学基金项目

立项/批准年度: 2013

项目学科: 计算机科学学科

项目作者: 魏小梅

作者单位: 华中农业大学

项目金额: 25万元

中文摘要: 本项目研究并抽取生物文献中命名实体(蛋白质、基因和疾病)之间的语义关系,并建立面向疾病的语义关系网络,将网络以可视化的形式展示。我们需要做的工作有:标注相关的实体关系资源;研究和建立实体关系抽取模型;抽取关系并建立实体语义关系网络;研究发现新的实体关系的方法;研究关系网络随语料时段变化的演化趋势,发现生物研究热点;将实体关系网络应用于乳腺肿瘤的诊断和研究。根据研究领域和研究对象的特点,为了实现以上目标,我们采用基于自然语言处理的方法结合多核学习的机器学习技术研究本项目。具体是以开放的生物文献为研究对象,首先采用自然语言处理技术对文本进行处理,获得句法解析树和依存图,然后利用解析结果得到合适的句法和语义特征,采用基于Simth-Waterman算法的复合核函数抽取实体之间的语义关系,构建语义网络,我们将对抽取的语义网络应用到乳腺肿瘤的早期辅助诊断。我们还将对结果利用公开数据进行评估。

中文关键词: 生物文本;名称实体;语料;关系抽取;知识库

英文摘要: We focus on the extraction of semantic relations between biomedical entities such as proteins, gene and disease in this project. And on the basis of semantic relations a semantic network is created and visualized. Our research takes the following procedures: annotating resources based on entity relations; building extraction model of entity relations;extracting relations and building semantic relation network;exploring novel approaches in discovering entity relation;pursuing the evolving tendency of relation network changing with the corpus along the timeline and discovering new dimensions in biomedicine; applying entity relation network in the diagnosis of breast cancer. In accordance with the characteristics of the domain and the object of research, we integrate the techniques of natural language processing and multi-kernel learning in this project. We adopt the open-ended biomedical texts as the corpus of the research. First we process the texts by the techniques of natural language processing. After initial processing, we acquire the syntax parsing tree and dependency graph. Then we extract the features from the sentence parsing outcomes. We adopt Smith-Waterman algorithm to extract semantic relations out of entities. The semantic network is built on the semantic relations. Finally, we will apply the semanti

英文关键词: biomedical text;named entity;corpus;relation extraction;knowledge base

成为VIP会员查看完整内容
2

相关内容

知识图谱研究现状及军事应用
专知会员服务
192+阅读 · 2022年4月8日
专知会员服务
195+阅读 · 2020年10月14日
最新《知识图谱:构建到应用》2020大综述论文,261页pdf
专知会员服务
289+阅读 · 2020年10月6日
专知会员服务
143+阅读 · 2020年8月21日
实体关系抽取方法研究综述
专知会员服务
176+阅读 · 2020年7月19日
【新书】自然语言处理表示学习技术,349页pdf,清华大学
专知会员服务
173+阅读 · 2020年7月11日
COVID-19文献知识图谱构建,UIUC-哥伦比亚大学
专知会员服务
42+阅读 · 2020年7月2日
知识图谱最新研究综述
深度学习自然语言处理
45+阅读 · 2020年6月14日
知识图谱构建-关系抽取和属性抽取
深度学习自然语言处理
26+阅读 · 2020年3月1日
基于知识图谱的文本挖掘 - 超越文本挖掘
专知
38+阅读 · 2019年8月18日
阿里健康夺冠中文电子病历实体识别评测任务
AI掘金志
40+阅读 · 2018年8月17日
漆桂林 | 知识图谱的应用
开放知识图谱
37+阅读 · 2017年9月26日
漆桂林 | 知识图谱之语义网络篇
开放知识图谱
19+阅读 · 2017年8月12日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
7+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月17日
小贴士
相关VIP内容
知识图谱研究现状及军事应用
专知会员服务
192+阅读 · 2022年4月8日
专知会员服务
195+阅读 · 2020年10月14日
最新《知识图谱:构建到应用》2020大综述论文,261页pdf
专知会员服务
289+阅读 · 2020年10月6日
专知会员服务
143+阅读 · 2020年8月21日
实体关系抽取方法研究综述
专知会员服务
176+阅读 · 2020年7月19日
【新书】自然语言处理表示学习技术,349页pdf,清华大学
专知会员服务
173+阅读 · 2020年7月11日
COVID-19文献知识图谱构建,UIUC-哥伦比亚大学
专知会员服务
42+阅读 · 2020年7月2日
相关资讯
知识图谱最新研究综述
深度学习自然语言处理
45+阅读 · 2020年6月14日
知识图谱构建-关系抽取和属性抽取
深度学习自然语言处理
26+阅读 · 2020年3月1日
基于知识图谱的文本挖掘 - 超越文本挖掘
专知
38+阅读 · 2019年8月18日
阿里健康夺冠中文电子病历实体识别评测任务
AI掘金志
40+阅读 · 2018年8月17日
漆桂林 | 知识图谱的应用
开放知识图谱
37+阅读 · 2017年9月26日
漆桂林 | 知识图谱之语义网络篇
开放知识图谱
19+阅读 · 2017年8月12日
相关基金
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
7+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员