项目名称: 集成多组学数据的关键蛋白质识别方法研究
项目编号: No.61402423
项目类型: 青年科学基金项目
立项/批准年度: 2014
项目学科: 自动化技术、计算机技术
项目作者: 张雪
作者单位: 淮阴工学院
项目金额: 26万元
中文摘要: 随着全基因组蛋白质关键性实验数据的增加和蛋白质互作(PPI)数据的丰富,从网络水平上研究蛋白质关键性越来越受到重视。PPI数据的不完整性和不精确性使得基于网络拓扑特性的关键蛋白质识别极具挑战性,特别是面向远亲缘关系的跨物种关键蛋白质识别则缺乏深入研究。本项目拟以PPI网络为立足点,分析基因组、蛋白质组、转录组、代谢组等多组学数据与PPI数据之间的互补性,挖掘出对蛋白质关键性表征能力更强的集成多组学信息的组合特征;对比分析多种模式生物中关键蛋白质的共性与特质,探索蛋白质的关键性在不同物种之间迁移的内在机制,以及多组学导出的特征和组合特征对蛋白质关键性的表征能力随物种进化的变化规律,以此为基础,研究基于迁移学习和元集成学习的面向远亲缘关系的跨物种关键蛋白质识别方法,使在缺乏实验验证的物种内高精度地识别关键蛋白质成为可能。研究成果将为寻找新药靶标提供理论基础,加速新药的设计与开发进程。
中文关键词: 关键蛋白质识别;多组学数据;蛋白质互作网络;中心性指标;机器学习
英文摘要: With the increase of genome-wide experimental data for protein essentiality and the great abundance in protein-protein interaction (PPI) data, researchers have paid more attention to the discovery of essential proteins from the network level. However, the
英文关键词: essential protein discovery;multi-source omics data;protein-protein interaction network;centrality measure;machine learning