核糖体是细胞中最重要的细胞器之一,负责将细胞转录出来的信使RNA(messenger RNA,简称“mRNA”)翻译成蛋白质。真核生物的核糖体,主要由4种核糖体 RNA(rRNA)和80多种核糖体蛋白组成。其中,45S rRNA基因位点通过转录加工可以产生18S、5.8S和25S rRNA;而5SrRNA基因位点行使5S rRNA的转录。随后,25S、5.8S以及5S RNA结合核糖体蛋白形成核糖体大亚基,同时18S RNA与其他核糖体蛋白形成核糖体小亚基,最终组装成细胞中的“蛋白加工工厂”。
在绝大多数真核生物的基因组内,不论45S rRNA基因还是5S rRNA基因都在染色体上以多拷贝串联重复的形式存在。然而,这种高度串联重复结构存在的生物学意义目前并没有明确结论。之前,唯一一项对于45S rRNA基因拷贝数变异的大规模研究发生在人类群体中,研究表明人基因组内45S基因位点在个体间存在广泛变异,并且发现其拷贝数与众多基因的表达调控显著相关。然而,对于45S rRNA基因拷贝数如何调控基因表达并没有任何阐述。
中国科学院遗传与发育生物学研究所陈明生研究组博士李博,通过利用玉米一个高多态性的育种群体(maize 282 diversity panel)重测序数据,对每个玉米的自交系的45S rRNA以及其它高度串联重复元件的基因拷贝数进行准确估算,发现玉米群体中45S rRNA存在广泛变异(1,061~17,347 copy),并且受到玉米群体结构的影响(图1)。广泛遗传力分析表明这些串联重复元件具有较高的遗传力,然而再利用GWAS分析时,却很难定位已知的遗传位点,表现出常见的“遗传力丢失”现象(missing heritability)。为了在玉米群体中重复人类核糖体拷贝数变异与基因表达的关系,研究人员利用该群体的7个不同组织材料大约2,100个转录组数据,对45S的拷贝数与基因表达水平进行了相关分析。然而,在所有7个组织内,并没有鉴定出大量受到45S拷贝数调控的基因。
研究人员随后将目光转向了45S rRNA基因的表达。众所周知,核糖体RNA的转录本占细胞总RNA的80%以上,在进行mRNA测序时,最重要的就是将rRNA污染去除。然而,通过一种3’mRNA-seq技术,可以无需对核糖体RNA预先进行分离,因为只有具有poly(A)尾的成熟mRNA才会被反转并测序。令人奇怪的是,研究人员却在测序数据中发现了大量来源于rRNA的序列数据。深入分析发现,这些数据应该是源于45S基因序列中存在许多类似于poly(A)的序列片段,通过与引物上的poly(T)不完全匹配后完成了对45S转录本的部分区域的测序(图2)。值得注意的是,这种现象在2100个测序文库的数据分析中完美重复,因此该数据可以用来对rRNA的表达水平进行定量分析。利用该数据,研究人员首次对rRNA的表达水平在群体、不同组织以及不同发育时期的差异表达进行了分析,发现核糖体RNA(45S rRNA)的表达并不像人们之前想象的那么保守,而是存在着广泛的变异。
研究人员随后又将45S rRNA的表达水平与各个组织中的基因表达水平进行了共表达分析,结果发现大量的与45S rRNA共表达的基因,GO分析显示与核糖体合成相关的基因数量显著,其中包括大量的核糖体蛋白基因(r-protein genes)。此外,不同组织中都存在与自身发育相关的共表达基因,比如在幼苗的根部和芽部,大量的抗性基因与45S rRNA表达量显著相关,表明在幼苗发育时期需要构建大量的防御系统来保护自身的生存。
最后,研究人员将45S rRNA的拷贝数以及表达水平与群体的田间性状进行了相关分析,发现两者都与开花相关性状显著相关;然而,后续分析表明两者可能是通过不同的途径对开花性状进行了干预。
该研究在8月30日的Genome Research在线发表(DOI:10.1101/gr.229716.117)。李博为文章第一作者,陈明生与李博为该论文的共同通讯作者。美国康奈尔大学教授Edward Buckler及其团队为该研究的顺利完成提供了支持。该论文得到国家自然科学基金项目的资助。
论文信息:Bo Li*, Karl Kremling, Penghao Wu, Robert Bukowski, Maria Romay, En Xie, Edward Buckler, and Mingsheng Chen* (2018) Co-regulation of ribosomal RNA with hundreds of genes contributes to phenotypic variations. Genome Research. doi:10.1101/gr.229716.117(*为共同通讯作者)
图1. 各种高度串联重复序列在玉米群体中的拷贝数变异。A)45S rRNA;B)5S rRNA,以及玉米knob区域中的两种串联重复序列;C)Knob 180; D)Knob TR1。
图2. 利用3’mRNA sequencing技术可以获得45S rRNA表达的定量分析。A)将RNA-seq数据比对到45S rRNA基因位点上可以发现5个明显的Peak区,这些都是来源于45S rRNA的测序reads;B)玉米45S的结构图;C)序列分析发现Peak区附近多AAA串联序列,可能是导致与poly(T)匹配并被测序的主要原因。
中国生物技术网诚邀生物领域科学家在我们的平台上,发表和介绍国内外原创的科研成果。
注:国内为原创研究成果或评论、综述,国际为在线发表一个月内的最新成果或综述,字数500字以上,并请提供至少一张图片。投稿者,请将文章发送至weixin@im.ac.cn。
本公众号由中国科学院微生物研究所信息中心承办
微信公众号:中国生物技术网 回复关键词“热点”可阅读热点专题文章,包括“施一公”、“肠道菌群”、“肿瘤”、“免疫”和“健康”