项目名称: 基于集成学习的全基因组水平上大规模高可信蛋白质相互作用网络构建及其功能研究
项目编号: No.61373086
项目类型: 面上项目
立项/批准年度: 2013
项目学科: 自动化技术、计算机技术
项目作者: 尤著宏
作者单位: 深圳大学
项目金额: 73万元
中文摘要: 随着人们对蛋白质相互作用在生命过程中的重要性认识的不断提高,在全基因组水平上准确构建和分析各模式生物的蛋白质相互作用网络已成为生物信息学领域的一个热点问题。对其研究将有助于更加深入的理解生命现象的本质,并对生命科学的发展起到强有力的推动作用。本项目从蛋白氨基酸序列出发,在序列特征编码、蛋白质相互作用及功能预测方面进行深入研究,以探索蛋白质相互作用及其功能行使的规律与本质。 首先,利用氨基酸残基的理化性质,并结合蛋白质序列的全局和局部特征信息对蛋白质序列进行编码;然后,运用旋转极限学习机森林和并行极限学习机集成这两种特征属性组合和样本组合的集成技术手段,来进行全基因组水平上大规模高可信蛋白质相互作用网络图谱的构建研究。在此基础上,使用基于蛋白质相互作用网络全局拓扑结构信息的随机游走模型对蛋白质功能进行预测和注释。本项目的研究成果将加深对生命的认识,为疾病机理的揭示及新药研发提供理论上的依据。
中文关键词: 生物信息学;极限学习机;蛋白质组学;智能计算;集成学习
英文摘要: Protein-protein interactions play a central role in life processes at the molecular level.Construction and function analysis of high-quality large-scale protein-protein interaction networks on a genome-wide scale is a hot issue in bioinformatics today. Th
英文关键词: Bioinformatics;Extreme learning machine;Proteomics;Computational intelligence;Ensemble learning