项目名称: 高通量RNA-Seq测序数据的基因表达水平建模研究
项目编号: No.61170152
项目类型: 面上项目
立项/批准年度: 2012
项目学科: 计算机科学学科
项目作者: 刘学军
作者单位: 南京航空航天大学
项目金额: 56万元
中文摘要: 高通量RNA-Seq测序技术近年来大量应用于基因表达水平(GEL)的测量,GEL计算的准确性对后续分析正确得出生物学结论具有至关重要的作用,但该技术中各种系统噪声的存在为GEL的计算带来了挑战。现有方法均采用了离散型概率模型,尽管该类模型能够模拟数据的离散特性,但对系统噪声建模能力相对较弱,难以较好地同时解决RNA-Seq数据中读段非均匀分布和多源映射,以及双末端测序技术下的计算等问题。本项目拟设计连续型概率模型进行RNA-Seq数据GEL的计算,以克服现有方法的不足。重点研究:1)读段计数向模拟信号的转换方式,为连续型概率模型提供数据准备;2)读段模拟化信号的概率建模方法,以消除读段非均匀分布的影响;3)读段多源映射的概率建模,以准确模拟不同异构体的表达水平;4)GEL的概率分布表示,以有效整合不同异构体表达水平。本项目预期能进一步提高GEL计算的准确性,为后续分析打下良好的基础。
中文关键词: 概率模型;RNA-Seq;基因芯片;基因表达水平;差异基因
英文摘要:
英文关键词: probabilistic model;RNA-Seq;microarray;gene expression;differential expression