项目名称: 基于MapReduce的非编码RNA“从头预测”识别方法研究
项目编号: No.61370010
项目类型: 面上项目
立项/批准年度: 2013
项目学科: 无线电电子学、电信技术
项目作者: 邹权
作者单位: 天津大学
项目金额: 80万元
中文摘要: 非编码RNA识别是理解基因组信息的重要工作之一。但目前的研究还存在识别不准确、软件通用性差以及无法处理大规模数据的缺点。在前期的青年基金研究工作中,我们提出了优化反例训练样本和利用投票机制提高识别准确率。本项目是前期工作的继续。面对规模日益增大的测序数据,本项目利用MapReduce并行计算框架,快速准确地实现非编码RNA的识别和标注。 本项目的主要工作包括:1. 使用“局部-全局”比对算法提高同源搜索的敏感性,并用MapReduce框架降低时间开销;2. 利用MapReduce和集成投票策略提高大规模不平衡数据的分类效果;3.针对不同种类的非编码RNA研究并开发跨平台、并行的非编码RNA标注系统。 本项目是青年基金项目的延伸,将使青年基金的研究成果在大规模测序数据中得到应用。本项研究对开拓生物信息学方法、开发实用的计算生物学系统和研究非编码RNA分子功能都具有重要意义。
中文关键词: 微小RNA;非编码RNA;生物信息学;数据挖掘;机器学习
英文摘要: Non-coding RNA annotation is one of the most important work for understanding genome information. The current software tools are not accurate and easily used enough. Moreover, they can not deal with the scale sequencing data. In my previous NSFC project,
英文关键词: microRNA;noncoding RNA;bioinformatics;data mining;machine learning