Nature:人类基因组中最“热门”基因TOP10

2017 年 11 月 24 日 生物探索 Flora
生物探索
编者按

11月22日,Nature News推出“The most popular genes in the human genome”,罗列出过去50年研究最热门的10大基因,它们依次为:TP53、TNF、EGFR、VEGFA、APOE、IL6、TGFB1、MTHFR、ESR1、AKT1。




从2002年开始,美国国立医学图书馆(NLM)启动了一项工作:对PubMed数据库中涉及基因(或其编码蛋白)的结构、功能研究的文章进行标记,共统计了解析27000人类基因(包括RNA基因和假基因)的565000篇文献。


就职于哈佛大学医学院致力于研究基因组数据可视化的博士后Peter Kerpedjiev从中分析出一份特殊的榜单——研究最多的基因TOP10!这10个基因背后的学术论文数量远超4万篇。它揭示了生物医学研究的重要趋势,表明在跨学科、疾病领域占主导地位的基因。



热门基因TOP10(图片来源:Peter Kerpedjiev/NCBI-NLM)


1榜首:TP53



热门基因的具体信息(翻译整理自Nature)


位列榜单之首的是TP53基因。3年前,当Peter Kerpedjiev正式开始这一统计研究时,关于TP53及其编码蛋白p53的研究论文就有6600篇。现在,这个数字达到8500篇。平均而言,每天会有两篇描述TP53基本生物学新细节的文章发表。


TP53是一种肿瘤抑制基因,被称为“基因组的守护者”,约一半的癌症都与该基因突变有关。这也是它成为基因界最大热门的原因。约翰斯•霍普金斯大学医学院的癌症遗传学家Bert Vogelstein认为,在癌症领域,没有其他基因比TP53更重要了。


2不同的时间段,不同的“流行”基因



图片来源:Peter Kerpedjiev/NCBI-NLM


上世纪40、50年代,生物化学家Linus Pauling(1954年诺贝尔化学奖获得者)、Vernon Ingram(1962年诺贝尔生理及医学奖获得者)开创性地从分子层面发现异常的血红蛋白(haemoglobin)会引发镰状细胞病(sickle-cell disease)。1962年,Max Perutz因为其在血红蛋白三维结构上的成就而获得诺贝尔化学奖。


美国国立卫生研究院的Alan Schechter教授认为,对血红蛋白基因的研究开启了从分子水平解析疾病的大门。他表示,在上世纪70年代和80年代初,这类基因是血液疾病、遗传学会议的一个讨论焦点。但是,随着测序技术的发展,科学家们开始关注其他基因、疾病,例如艾滋病。


在1983年HIV病毒被发现之前,包括David Klatzmann在内的临床医生已经注意到这一种奇怪的疾病。“患者体内没有T4细胞。” Klatzmann回忆道。他发现,HIV病毒会选择性地感染、破坏免疫细胞。


Klatzmann推断,CD4+T细胞表面的蛋白是HIV病毒感染入侵的关键受体。事实证明,他是对的。1984年12月,他发表了相关研究成果。在这段时间内,CD4成为研究最火热的基因。对CD4的研究大大促进了免疫学的发展。


1990年初,TP53开始进入大家视角。但是当时,科学家们更热衷于挖掘GRB2基因——编码生长因子受体结合蛋白2,参与细胞内各种受体激活后的下游调节。1992年,耶鲁大学医学院的生化学家Joseph Schlessinger发现,GRB2蛋白包含一个SH2结构域(结合目标细胞表面激活蛋白,向细胞核传递信号)以及两个参与细胞生存的区域。在某种程度上,GRB2是开启信号转导研究的热门分子。


但是,GRB2是一个“异类”:它并不是导致疾病的直接原因,也不是药物的靶标。所以,它仅仅在90年代初活跃了几年而已。“因为没有临床价值,这个新星很快就陨落了。” Karolinska研究所的Thierry Soussi研究员如此评价道。他认为,一个基因的重要性往往与其临床价值关联。


除了GRB2,影响TP53热门地位的还有载脂蛋白E(APOE)——参与脂蛋白的转化与代谢过程。20世纪70年代中期,APOE被认为是j预防心脏病的一种降脂疗法。随后,神经学家 Allen Roses团队发现,APOE蛋白参与阿尔兹海默症病斑的形成。1993年,他们鉴定出APOE4基因,证实它是阿尔兹海默症主要的风险遗传因子。



热门基因在染色体的位置分布(图片来源:Peter Kerpedjiev/NCBI-NLM)


除了人类,NLM还追踪了其他几十个物种的基因研究,包括小鼠、果蝇、病毒等。结果显示,过去50年研究最多的100个基因中,超2/3是人类基因。



图片来源:Peter Kerpedjiev/NCBI-NLM

End

参考资料:1)The most popular genes in the human genome


本文系生物探索原创,欢迎个人转发分享。其他任何媒体、网站如需转载,须在正文前注明来源生物探索。


登录查看更多
0

相关内容

【ICML2020-哈佛】深度语言表示中可分流形
专知会员服务
12+阅读 · 2020年6月2日
斯坦福&谷歌Jeff Dean最新Nature论文:医疗深度学习技术指南
Nature 一周论文导读 | 2019 年 8 月 1 日
科研圈
8+阅读 · 2019年8月11日
Nature 一周论文导读 | 2019 年 5 月 30 日
科研圈
15+阅读 · 2019年6月9日
Nature 一周论文导读 | 2019 年 4 月 4 日
科研圈
7+阅读 · 2019年4月14日
Nature 一周论文导读 | 2019 年 2 月 28 日
科研圈
13+阅读 · 2019年3月10日
Nature 一周论文导读 | 2019 年 2 月 21 日
科研圈
14+阅读 · 2019年3月3日
Nature 一周论文导读 | 2019 年 2 月 14 日
科研圈
7+阅读 · 2019年2月24日
Nature 一周论文导读 | 2018 年 5 月 24 日
科研圈
11+阅读 · 2018年5月27日
Nature 一周论文导读 | 2018 年 3 月 29 日
科研圈
12+阅读 · 2018年4月7日
Arxiv
6+阅读 · 2018年10月3日
Hierarchical Deep Multiagent Reinforcement Learning
Arxiv
8+阅读 · 2018年9月25日
Arxiv
5+阅读 · 2018年4月22日
Arxiv
9+阅读 · 2018年4月20日
VIP会员
相关资讯
Nature 一周论文导读 | 2019 年 8 月 1 日
科研圈
8+阅读 · 2019年8月11日
Nature 一周论文导读 | 2019 年 5 月 30 日
科研圈
15+阅读 · 2019年6月9日
Nature 一周论文导读 | 2019 年 4 月 4 日
科研圈
7+阅读 · 2019年4月14日
Nature 一周论文导读 | 2019 年 2 月 28 日
科研圈
13+阅读 · 2019年3月10日
Nature 一周论文导读 | 2019 年 2 月 21 日
科研圈
14+阅读 · 2019年3月3日
Nature 一周论文导读 | 2019 年 2 月 14 日
科研圈
7+阅读 · 2019年2月24日
Nature 一周论文导读 | 2018 年 5 月 24 日
科研圈
11+阅读 · 2018年5月27日
Nature 一周论文导读 | 2018 年 3 月 29 日
科研圈
12+阅读 · 2018年4月7日
Top
微信扫码咨询专知VIP会员