从2002年开始,美国国立医学图书馆(NLM)启动了一项工作:对PubMed数据库中涉及基因(或其编码蛋白)的结构、功能研究的文章进行标记,共统计了解析27000人类基因(包括RNA基因和假基因)的565000篇文献。
就职于哈佛大学医学院致力于研究基因组数据可视化的博士后Peter Kerpedjiev从中分析出一份特殊的榜单——研究最多的基因TOP10!这10个基因背后的学术论文数量远超4万篇。它揭示了生物医学研究的重要趋势,表明在跨学科、疾病领域占主导地位的基因。
热门基因TOP10(图片来源:Peter Kerpedjiev/NCBI-NLM)
热门基因的具体信息(翻译整理自Nature)
位列榜单之首的是TP53基因。3年前,当Peter Kerpedjiev正式开始这一统计研究时,关于TP53及其编码蛋白p53的研究论文就有6600篇。现在,这个数字达到8500篇。平均而言,每天会有两篇描述TP53基本生物学新细节的文章发表。
TP53是一种肿瘤抑制基因,被称为“基因组的守护者”,约一半的癌症都与该基因突变有关。这也是它成为基因界最大热门的原因。约翰斯•霍普金斯大学医学院的癌症遗传学家Bert Vogelstein认为,在癌症领域,没有其他基因比TP53更重要了。
图片来源:Peter Kerpedjiev/NCBI-NLM
上世纪40、50年代,生物化学家Linus Pauling(1954年诺贝尔化学奖获得者)、Vernon Ingram(1962年诺贝尔生理及医学奖获得者)开创性地从分子层面发现异常的血红蛋白(haemoglobin)会引发镰状细胞病(sickle-cell disease)。1962年,Max Perutz因为其在血红蛋白三维结构上的成就而获得诺贝尔化学奖。
美国国立卫生研究院的Alan Schechter教授认为,对血红蛋白基因的研究开启了从分子水平解析疾病的大门。他表示,在上世纪70年代和80年代初,这类基因是血液疾病、遗传学会议的一个讨论焦点。但是,随着测序技术的发展,科学家们开始关注其他基因、疾病,例如艾滋病。
在1983年HIV病毒被发现之前,包括David Klatzmann在内的临床医生已经注意到这一种奇怪的疾病。“患者体内没有T4细胞。” Klatzmann回忆道。他发现,HIV病毒会选择性地感染、破坏免疫细胞。
Klatzmann推断,CD4+T细胞表面的蛋白是HIV病毒感染入侵的关键受体。事实证明,他是对的。1984年12月,他发表了相关研究成果。在这段时间内,CD4成为研究最火热的基因。对CD4的研究大大促进了免疫学的发展。
1990年初,TP53开始进入大家视角。但是当时,科学家们更热衷于挖掘GRB2基因——编码生长因子受体结合蛋白2,参与细胞内各种受体激活后的下游调节。1992年,耶鲁大学医学院的生化学家Joseph Schlessinger发现,GRB2蛋白包含一个SH2结构域(结合目标细胞表面激活蛋白,向细胞核传递信号)以及两个参与细胞生存的区域。在某种程度上,GRB2是开启信号转导研究的热门分子。
但是,GRB2是一个“异类”:它并不是导致疾病的直接原因,也不是药物的靶标。所以,它仅仅在90年代初活跃了几年而已。“因为没有临床价值,这个新星很快就陨落了。” Karolinska研究所的Thierry Soussi研究员如此评价道。他认为,一个基因的重要性往往与其临床价值关联。
除了GRB2,影响TP53热门地位的还有载脂蛋白E(APOE)——参与脂蛋白的转化与代谢过程。20世纪70年代中期,APOE被认为是j预防心脏病的一种降脂疗法。随后,神经学家 Allen Roses团队发现,APOE蛋白参与阿尔兹海默症病斑的形成。1993年,他们鉴定出APOE4基因,证实它是阿尔兹海默症主要的风险遗传因子。
热门基因在染色体的位置分布(图片来源:Peter Kerpedjiev/NCBI-NLM)
除了人类,NLM还追踪了其他几十个物种的基因研究,包括小鼠、果蝇、病毒等。结果显示,过去50年研究最多的100个基因中,超2/3是人类基因。
图片来源:Peter Kerpedjiev/NCBI-NLM
End
参考资料:1)The most popular genes in the human genome
本文系生物探索原创,欢迎个人转发分享。其他任何媒体、网站如需转载,须在正文前注明来源生物探索。