项目名称: 基于多标记学习的蛋白质亚细胞多位置预测方法研究
项目编号: No.61402422
项目类型: 青年科学基金项目
立项/批准年度: 2014
项目学科: 自动化技术、计算机技术
项目作者: 王晓
作者单位: 郑州轻工业学院
项目金额: 25万元
中文摘要: 蛋白质亚细胞多位置预测是生物信息学中的新兴重要研究方向。传统的两类或多类机器学习方法很难适应蛋白质同时拥有多个亚细胞位置的新情况。本课题拟从多位置蛋白质数据的特点入手,以提高预测性能为目标,以多标记学习为主要技术手段,研究新的亚细胞多位置预测方法。首先,提出蛋白质数据的关键特征去噪方法,减少噪声对建模效果的影响;其次,引入集成学习技术,提出融合多源特征的最优多标记集成算法,提高多源蛋白质数据的亚细胞多位置预测性能;再次,结合半监督学习,提出利用无位置标注蛋白质的归纳式半监督多标记算法,提高少量标注情况下的亚细胞多位置预测性能;最后,基于上述研究成果,构建在线蛋白质亚细胞多位置预测服务平台,为领域研究人员服务。本课题研究将极大地提升蛋白质亚细胞多位置预测的效果,同时为该领域的研究提供新的思路、方法和平台。
中文关键词: 蛋白质亚细胞定位;多位置;多标记学习;缺失数据补全;
英文摘要: Protein subcellular multi-locations prediction is an emerging and important research direction in bioinformatics. Traditional machine learning methods are difficult to deal with proteins with multiple subcellular locations. This research subject will deep
英文关键词: protein subcellular localization;multi-location;multi-label learning;imputation of missing data;