项目名称: 仅基于RNA-Seq数据拼装可变剪接转录组的计算方法研究

项目编号: No.61272016

项目类型: 面上项目

立项/批准年度: 2013

项目学科: 自动化技术、计算机技术

项目作者: 李国君

作者单位: 山东大学

项目金额: 60万元

中文摘要: 可变剪接是指从一个前体mRNA中通过不同的剪接方式产生不同的成熟mRNA的过程。可变剪接是调控基因表达和产生蛋白质组多样性的重要机制。在人类基因组中,大约95% 的多外显子基因中存在可变剪接。基因的异常剪接与疾病有着密切的关系;人类相当一部分疾病包括癌症被认为起因于基因的可变剪接。高通量cDNA 测序技术使得可变剪接转录组的计算预测成为可能。近两年,NATURE系列期刊上连续刊出数篇有关基于RNA-Seq数据计算预测可变剪接转录组的科技文章和软件,使得可变剪接转录组的计算预测成为国际生物信息学研究领域最具挑战的研究课题之一。最近我们发现:基因的外显子以及它们在基因中的线性顺序完全可以通过拼装RNA-Seq数据预测出来。这就意味着可变剪接转录组的计算预测不需要参考基因组序列,我们将由此设计一个高效可靠的计算预测可变剪接转录组的算法和软件,使该问题的计算预测推向一个全新的高度。

中文关键词: 转录组;RNA-seq 数据;剪接图;路覆盖;算法

英文摘要: Alternative splicing is a process by which the exons of the RNA produced by transcription of a gene are reconnected in multiple ways during RNA splicing. The resulting different mRNAs may be translated into different protein isoforms. Alternative splicing occurs as a normal phenomenon in eukaryotes, where it greatly increases the biodiversity of proteins that can be encoded by the genome. Thus, it is an important mechanism for gene regulation expression. In humans, about 95% of multiexonic genes are alternatively spliced. Mechanisms of alternative splicing are highly variable, and new examples are constantly being found, particularly through the use of high-throughput techniques. Researchers hope to fully elucidate the regulatory systems involved in splicing, so that alternative splicing products from a given gene under particular conditions could be predicted by a splicing code. Abnormal variations in splicing are also implicated in disease; a large proportion of human genetic disorders result from splicing variants. Abnormal splicing variants are also thought to contribute to the development of cancer. High throughput cDNA sequencing technologies make it possible to predict spliced transcripts computationally. A couple of articles regarding computational prediction of spliced transcripts have already been publ

英文关键词: transcriptome;RNA-seq data;splicing graph;path cover;algorithm

成为VIP会员查看完整内容
0

相关内容

【Nature. Mach. Intell. 】图神经网络论文汇集
专知会员服务
46+阅读 · 2022年3月26日
ICLR2022 | OntoProtein:融入基因本体知识的蛋白质预训练
专知会员服务
28+阅读 · 2022年2月20日
数据中心产业图谱研究报告,41页pdf
专知会员服务
53+阅读 · 2022年1月31日
元学习-生物医学中连接标记和未标记数据
专知会员服务
29+阅读 · 2021年8月3日
【WSDM2021】基于演化状态图的时间序列事件预测
专知会员服务
53+阅读 · 2020年12月1日
人工智能预测RNA和DNA结合位点,以加速药物发现
深度学习预测蛋白质-蛋白质相互作用
机器之心
5+阅读 · 2022年1月15日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
15+阅读 · 2021年2月19日
小贴士
相关基金
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员