项目名称: 基于生物医学文献和领域本体的蛋白质复合物预测方法研究

项目编号: No.61300088

项目类型: 青年科学基金项目

立项/批准年度: 2014

项目学科: 自动化技术、计算机技术

项目作者: 张益嘉

作者单位: 大连理工大学

项目金额: 23万元

中文摘要: 预测蛋白质网络中的蛋白质复合物是探索各种生命活动机理的重要基础,对于人们深入了解生命系统意义重大。当前公开的蛋白质网络数据仅能表示蛋白质间的拓扑结构信息,这使得复合物预测研究中无法利用复合物重要的功能特性。本项目针对这一核心问题,利用自然语言处理方法,抽取生物医学文献中蕴含的蛋白质相互作用类别信息,整合基因本体资源,构建蛋白质生物属性网络;基于属性图聚类理论,建立生物属性网络的距离模型,融合生物属性网络中的网络拓扑和生物属性两种异构信息;并结合Core-Attachment结构理论,建立高效的蛋白质复合物预测模型。本项目从挖掘并整合生物医学文献和基因本体领域知识入手,不仅为复合物预测研究提供了重要的生物属性信息,而且提出了一种整合多元领域知识进行复合物预测的理论框架,使蛋白质复合物预测研究能将复合物的结构特征和功能特性有机地结合,为建立高效的复合物预测方法提供了新的思路和理论依据。

中文关键词: 自然语言处理;关系抽取;文本挖掘;蛋白质复合物识别;生物信息学

英文摘要: Protein complex prediction in protein networks is an important foundation for exploring various life activities and significant in enhancing understanding about living system. Current protein networks only contain topology information among proteins, which makes protein complex prediction cannot exploit the functional features of protein complex. To solve the core problem, this project extracts categorization information of protein-protein interaction in biomedical literature based on natural language processing methods and integrates the gene ontology resource. Based on the biological information, we construct protein biological attributed networks. Furthermore, we propose distance model of protein biological attributed networks based on attributed graph clustering theory to combine the two heterogeneous information of network topology information and biological attribute information. Ultimately, we build efficient model for protein complex prediction in protein biological attributed networks based on core-attachment theory. This project starts by mining biological literatures and integrating gene ontology resource, which provides vital biological attribute information for protein complex prediction and a theoretical framework for integrating diverse domain knowledge to predict protein complex. This project can

英文关键词: Natural language processing;Relation extraction;Text mining;Protein complex identification;Bioinformatics

成为VIP会员查看完整内容
0

相关内容

自然语言处理(NLP)是语言学,计算机科学,信息工程和人工智能的一个子领域,与计算机和人类(自然)语言之间的相互作用有关,尤其是如何对计算机进行编程以处理和分析大量自然语言数据 。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
ICLR2022 | OntoProtein:融入基因本体知识的蛋白质预训练
专知会员服务
28+阅读 · 2022年2月20日
NeurIPS 2021 | 通过动态图评分匹配预测分子构象
专知会员服务
21+阅读 · 2021年12月4日
专知会员服务
85+阅读 · 2021年10月11日
专知会员服务
28+阅读 · 2021年8月27日
元学习-生物医学中连接标记和未标记数据
专知会员服务
29+阅读 · 2021年8月3日
专知会员服务
25+阅读 · 2020年12月17日
知识图谱本体结构构建论文合集
专知会员服务
106+阅读 · 2019年10月9日
靶向蛋白质降解的蛋白-蛋白相互作用预测
GenomicAI
4+阅读 · 2022年3月5日
深度学习预测蛋白质-蛋白质相互作用
机器之心
5+阅读 · 2022年1月15日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
Arxiv
3+阅读 · 2022年4月18日
Arxiv
46+阅读 · 2021年10月4日
Arxiv
16+阅读 · 2021年7月18日
Arxiv
26+阅读 · 2018年2月27日
小贴士
相关VIP内容
ICLR2022 | OntoProtein:融入基因本体知识的蛋白质预训练
专知会员服务
28+阅读 · 2022年2月20日
NeurIPS 2021 | 通过动态图评分匹配预测分子构象
专知会员服务
21+阅读 · 2021年12月4日
专知会员服务
85+阅读 · 2021年10月11日
专知会员服务
28+阅读 · 2021年8月27日
元学习-生物医学中连接标记和未标记数据
专知会员服务
29+阅读 · 2021年8月3日
专知会员服务
25+阅读 · 2020年12月17日
知识图谱本体结构构建论文合集
专知会员服务
106+阅读 · 2019年10月9日
相关基金
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
微信扫码咨询专知VIP会员