项目名称: 面向蛋白质功能预测的多标记学习方法研究与应用
项目编号: No.61402378
项目类型: 青年科学基金项目
立项/批准年度: 2014
项目学科: 自动化技术、计算机技术
项目作者: 余国先
作者单位: 西南大学
项目金额: 26万元
中文摘要: 蛋白质功能预测是生物信息学领域的关键问题。针对当前的预测方法通常假定已知蛋白质标注准确无缺失,不符合现实特征的缺点,本项目将蛋白质的领域信息与多标记学习相结合,考虑功能标注集合的缺失标注和噪声标注,结合弱标记学习和部分标记学习,探索能够有效去除噪声标记,精确补全蛋白质的缺失标记和预测其功能的计算方法,为蛋白质功能的利用、药物研发等提供参考信息,为机器学习方法在蛋白质功能预测中的应用奠定基础,指导相关生物实验,为其节省成本,推动生命科学研究的发展。同时,研究中通过生物学问题检验计算方法的效果,指导计算方法的改进,将推动多标记学习和部分标记学习研究进一步拓展和深化。本项目拟:(1)提出面向蛋白质功能预测的多标记弱标记学习方法、相关标记和不相关标记下多标记学习方法、多标记部分标记学习方法;(2)共享算法软件代码,推广应用到多物种蛋白质数据集和通用数据集上;(3)发表高水平期刊和会议论文6-8篇。
中文关键词: 蛋白质功能预测;多标记学习;不完整标注;噪声标注;数据集成
英文摘要: Protein function prediction is one of the key challenges in Bioinformatics. Current predictive techniques often assume the functional annotations of the labeled proteins are complete without any missing. However, this assumption is not realistic. In this
英文关键词: Protein Function Prediction;Multi-label Learning;Incomplete Annotations;Noisy Annotations;Data Integration