项目名称: 多核系统下调控模式识别的MapReduce模型及算法研究
项目编号: No.61173025
项目类型: 面上项目
立项/批准年度: 2012
项目学科: 自动化技术、计算机技术
项目作者: 霍红卫
作者单位: 西安电子科技大学
项目金额: 55万元
中文摘要: 调控模式识别是生物信息学研究领域中的一个基本问题。研究表明,现有方法对保守模式预测的准确程度,无论在碱基水平还是在结合位点水平都较低。在本项目中,我们以改善调控模式的识别算法的准确度和性能为基本目标,充分利用当前多核系统的处理器所提供的高效的计算性能以及多线程和多进程的并行处理技术,提出一种基于多核系统的MapReduce模型;其次,引入位点之间的局部构象信息,建立TFBS与转录起始位点之间距离的分布特征及约束关系,从而建立调控模式的模体模型。提出一种调控模式识别的MapReduce算法,降低算法的时间复杂度,提高对于长序列和特征微弱模式识别的准确程度;最后,通过对JASPAR、TRANSFAC等数据库的统计特征分析,研究调控模式位点的分布特征,设计有效和精确的P-value计算方法。在此基础上,建立多核系统上有效解决数据密集型和计算密集型问题的一种新的计算模型。
中文关键词: 模体识别;精确算法;近似算法;MapReduce;正则表达式
英文摘要:
英文关键词: motif identification;exact algorithm;approximate algorithm;MapReduce;regular expression