项目名称: 基于概率分布理论预测DNA调控元件的新方法研究
项目编号: No.31401141
项目类型: 青年科学基金项目
立项/批准年度: 2014
项目学科: 生物科学
项目作者: 卢一鸣
作者单位: 中国人民解放军军事医学科学院
项目金额: 20万元
中文摘要: 表观遗传调控作为细胞内一种重要的基因调控机制一直以来都受到研究人员的重视,而近年来ChIP-seq技术的逐步成熟则加速了表观遗传调控研究的进程。如何利用ChIP-seq数据准确预测DNA调控元件及其靶基因已成为表观遗传调控领域亟需解决的重要问题。已有的研究方法如CSI-ANN、ChromaGenSVM等仅关注表观遗传修饰的信号强度,忽视了信号的形状分布,造成预测准确性不高,迫切需要预测准确度高的新方法。本项目从统计学的基本假设出发,将随机变量概率分布统计量映射到信号峰的形状特征上,构建信号峰形状定量描述体系;并基于该体系利用机器学习方法对DNA调控元件进行预测及准确性评估。进一步,我们将利用多细胞系数据建立调控元件与基因之间的关联,明确其生物学功能。本项目的实施将有助于在ENCODE等大数据中准确地预测全基因组的DNA调控元件,同时也可以对单个基因的表达调控机制和功能研究提供重要参考。
中文关键词: 调控元件;基因组;非编码区域;机器学习;
英文摘要: As an essential regulatory mechanism in cells, epigenetic regulation of gene expression has been studies for decades. Recently, the emerging of ChIP-seq technique has greatly accelerated this researching progress. Accurately prediction of DNA regulatory e
英文关键词: regulatory elements;genome;noncoding regions;machine learning;