项目名称: 融合指代消解和迁移学习的蛋白质交互关系抽取的研究
项目编号: No.61173101
项目类型: 面上项目
立项/批准年度: 2012
项目学科: 计算机科学学科
项目作者: 李丽双
作者单位: 大连理工大学
项目金额: 55万元
中文摘要: 蛋白质交互关系的研究是后基因组时代的主要任务,为疾病的诊断、预防、治疗和新药的发现提供依据和启发。目前其文本挖掘的方法主要是从生物医学文献的摘要中抽取关系,但摘要中包含的信息有限,同时指代消解和语料库的领域适应问题都没有得到很好解决,致使抽取的性能较低。本项目针对生物医学文献全文并采用指代消解技术和迁移学习方法进行蛋白质交互关系抽取。内容主要包括:1.蛋白质名识别及标准化;2.建立基于全文和针对蛋白质交互关系的指代消解模型;3.选择句子级和篇章级特征,组合含有领域知识的语义核建立基于全文的关系抽取模型;4.引入迁移学习思想并与主动学习相结合,解决蛋白质交互关系抽取中的领域适应问题。最终获得高性能的蛋白质交互关系抽取模型。并与领域专家合作,构建肝癌的蛋白质交互关系数据库及可视化,为肝癌的研究提供分子生物学知识,同时验证蛋白质交互关系抽取模型的真实有效性。
中文关键词: 蛋白质交互关系;指代消解;迁移学习;语义核;文本挖掘
英文摘要:
英文关键词: Protein-Protein Interaction;Coreference Resolution;Transfer Learning;Semantic Kernel;Information Extraction