项目名称: 基于集成学习的蛋白质相互作用界面热点残基预测方法研究

项目编号: No.31301101

项目类型: 青年科学基金项目

立项/批准年度: 2014

项目学科: 生物科学

项目作者: 夏俊峰

作者单位: 安徽大学

项目金额: 18万元

中文摘要: 热点残基是蛋白质相互作用界面上贡献绝大部分结合自由能的极少数关键氨基酸残基,对蛋白质结合的稳定性起着关键的作用。但是通过生物实验技术检测热点残基费时费力且代价昂贵,利用计算方法预测热点残基则可以有效弥补这一不足。本项目将从蛋白质序列和结构特征出发,在热点残基的数据整合、特征编码和分类模型构建等方面进行深入研究。首先,通过整合各种热点残基数据源,并结合文献检索提取的热点残基数据,建立一个完整的热点残基数据库;然后从蛋白质的氨基酸序列和空间结构出发,提取多种与热点残基可能相关的特征并利用特征选择方法,去除其中的噪声和不相关的特征以降低计算复杂度和提高分类精度;最后应用旋转森林和元学习分类器这两种集成算法来预测蛋白质相互作用界面热点残基,并结合遗传算法优化参数,从而最终建立高可靠性的热点残基预测模型。本项目的研究将为我们理解蛋白质相互作用机制和治疗相关疾病的药物设计提供理论上的依据。

中文关键词: 热点残基预测;特征表示;集成学习;数据库;

英文摘要: Hot spots are residues contributing the most of the binding free energy in protein-protein interaction yet accounting for a small portion of interface residues. These residues are observed to be crucial for maintaining the stability of protein association. Experimental hot spots detection methods are not applicable on a large scale since they are time consuming and expensive. Therefore, reliable and efficient computational methods for identifying hot spots are greatly desired and urgently required. In this project,we will first perform a comprehensive survey of previous hot spot databases,including the verified data extracted from peer-reviewed published literature,and develop a continually updated database that collects, curates and manages hot spots data. Second,we will extract a wide variety of features from a combination of protein sequence and structure information and apply feature selection to remove noisy and irrelevant features,with the purpose of reducing the computational complexity and improving the classification accuracy. Finally,we will employ the ensemble classifier approaches,including the rotation forest and meta learning predictor, to identify hot spots. The genetic algorithm will also be used to tune various parameters to further improve the prediction accuracy of hot spots. The implementatio

英文关键词: hot spot prediction;feature representation;ensemble learning;database;

成为VIP会员查看完整内容
2

相关内容

多模态深度学习在生物医学数据融合中的应用研究进展
专知会员服务
59+阅读 · 2022年5月31日
【ICML2022】药物结合结构预测的几何深度学习
专知会员服务
25+阅读 · 2022年5月24日
人工智能到深度学习:药物发现的机器智能方法
专知会员服务
35+阅读 · 2022年5月6日
【干货书】数据挖掘药物发现,347页pdf
专知会员服务
130+阅读 · 2021年9月20日
专知会员服务
39+阅读 · 2021年9月7日
专知会员服务
92+阅读 · 2021年5月25日
专知会员服务
44+阅读 · 2021年1月31日
【元图(Meta-Graph):元学习小样本连接预测】
专知会员服务
62+阅读 · 2020年5月31日
深度学习预测蛋白质-蛋白质相互作用
机器之心
5+阅读 · 2022年1月15日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
Arxiv
0+阅读 · 2022年6月1日
Arxiv
0+阅读 · 2022年5月27日
Arxiv
35+阅读 · 2022年3月14日
Arxiv
28+阅读 · 2021年9月18日
小贴士
相关VIP内容
多模态深度学习在生物医学数据融合中的应用研究进展
专知会员服务
59+阅读 · 2022年5月31日
【ICML2022】药物结合结构预测的几何深度学习
专知会员服务
25+阅读 · 2022年5月24日
人工智能到深度学习:药物发现的机器智能方法
专知会员服务
35+阅读 · 2022年5月6日
【干货书】数据挖掘药物发现,347页pdf
专知会员服务
130+阅读 · 2021年9月20日
专知会员服务
39+阅读 · 2021年9月7日
专知会员服务
92+阅读 · 2021年5月25日
专知会员服务
44+阅读 · 2021年1月31日
【元图(Meta-Graph):元学习小样本连接预测】
专知会员服务
62+阅读 · 2020年5月31日
相关资讯
深度学习预测蛋白质-蛋白质相互作用
机器之心
5+阅读 · 2022年1月15日
相关基金
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
微信扫码咨询专知VIP会员