项目名称: 高通量RNA-Seq测序数据的基因表达水平建模研究

项目编号: No.61170152

项目类型: 面上项目

立项/批准年度: 2012

项目学科: 计算机科学学科

项目作者: 刘学军

作者单位: 南京航空航天大学

项目金额: 56万元

中文摘要: 高通量RNA-Seq测序技术近年来大量应用于基因表达水平(GEL)的测量,GEL计算的准确性对后续分析正确得出生物学结论具有至关重要的作用,但该技术中各种系统噪声的存在为GEL的计算带来了挑战。现有方法均采用了离散型概率模型,尽管该类模型能够模拟数据的离散特性,但对系统噪声建模能力相对较弱,难以较好地同时解决RNA-Seq数据中读段非均匀分布和多源映射,以及双末端测序技术下的计算等问题。本项目拟设计连续型概率模型进行RNA-Seq数据GEL的计算,以克服现有方法的不足。重点研究:1)读段计数向模拟信号的转换方式,为连续型概率模型提供数据准备;2)读段模拟化信号的概率建模方法,以消除读段非均匀分布的影响;3)读段多源映射的概率建模,以准确模拟不同异构体的表达水平;4)GEL的概率分布表示,以有效整合不同异构体表达水平。本项目预期能进一步提高GEL计算的准确性,为后续分析打下良好的基础。

中文关键词: 概率模型;RNA-Seq;基因芯片;基因表达水平;差异基因

英文摘要:

英文关键词: probabilistic model;RNA-Seq;microarray;gene expression;differential expression

成为VIP会员查看完整内容
0

相关内容

概率模型(生成模型)通过函数 F 来描述 X 和 Y 的联合概率或者条件概率分布。
ICLR 2022|化学反应感知的分子表示学习
专知会员服务
20+阅读 · 2022年2月10日
【干货书】数据挖掘药物发现,347页pdf
专知会员服务
134+阅读 · 2021年9月20日
专知会员服务
18+阅读 · 2021年9月19日
专知会员服务
36+阅读 · 2021年5月29日
专知会员服务
49+阅读 · 2020年8月27日
【经典书】统计学,806页pdf,解锁数据的力量
专知会员服务
79+阅读 · 2020年8月12日
【MIT-ICML2020】图神经网络的泛化与表示的局限
专知会员服务
42+阅读 · 2020年6月23日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Arxiv
0+阅读 · 2022年4月22日
Arxiv
54+阅读 · 2022年1月1日
小贴士
相关VIP内容
ICLR 2022|化学反应感知的分子表示学习
专知会员服务
20+阅读 · 2022年2月10日
【干货书】数据挖掘药物发现,347页pdf
专知会员服务
134+阅读 · 2021年9月20日
专知会员服务
18+阅读 · 2021年9月19日
专知会员服务
36+阅读 · 2021年5月29日
专知会员服务
49+阅读 · 2020年8月27日
【经典书】统计学,806页pdf,解锁数据的力量
专知会员服务
79+阅读 · 2020年8月12日
【MIT-ICML2020】图神经网络的泛化与表示的局限
专知会员服务
42+阅读 · 2020年6月23日
相关资讯
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
微信扫码咨询专知VIP会员