Nature子刊：用机器学习揭露人类基因调控背后的“语法”

会员服务 ·

Nature子刊：用机器学习揭露人类基因调控背后的“语法”

2022 年 2 月 24 日 量子位

丰色发自凹非寺
量子位 | 公众号 QbitAI

AI又立功了。

这次，来自芬兰赫尔辛基大学的最新研究借助机器学习，破解了人类基因调控背后的“语法”。

而在此之前，科学家仅仅是知道DNA可以决定基因在某时某处进行表达，现在终于对它背后的逻辑有了深刻的理解。

这项成果将给癌症和遗传病研究带来新启发，现已登上Nature子刊（自然·遗传学）。

破解基因调控背后的“语法”

正式开始之前，先来一点背景知识。

基因调控（Gene regulation）是控制细胞内基因活性的重要过程，不正确的调控会导致疾病产生，比如癌症。

人类基因组的DNA包含为蛋白质编码的基因，这些蛋白质序列可赋予肌肉细胞力量，赋予脑细胞处理信息的能力等。

DNA中还包含调控基因的元素，决定基因何时何地表达，比如确保肌肉基因只在肌肉里表达，大脑基因在大脑中表达。

我们一直对决定基因调控的编码逻辑知之甚少，这是因为：

虽然人类基因组包含近30亿个碱基对，但基因组序列（genomic sequence）太短，无法用来学习背后的逻辑。

现在，芬兰科学院肿瘤遗传学高级研究中心的科学家们，采用了一种创新方法——不使用自然基因组序列，而是将随机合成的DNA序列引入人类细胞。

这些细胞读取新的DNA后，突出显出作为活性调控元素（active regulatory elements）的序列。

这些序列就是要研究的对象。

作者介绍，它们的空间加起来是整个人类基因组的100倍。

有了足够规模的数据集，就可以利用机器学习进行数据分析了。

都有哪些发现？

我们知道，基因表达受可结合DNA的转录因子（一种蛋白质的总称）调控。

这个机器学习模型则显示，单个转录因子以“加性”方式参与基因调控，且语法较弱（with weak grammar）。

在两个主要调控元件——增强子（增强转录作用）和启动子（定义转录的起始）之中，增强子会以一种不在转录因子之间产生相互作用的机制增加启动子的表达。

随后，研究人员比较了三种不同的人类细胞：结肠癌细胞、肝癌细胞以及来自视网膜的正常细胞。

他们发现只有少数转录因子在细胞中保持高度活性，但它们的活性与细胞类型无关，在哪里都是相似的。

这一结果表明，人类细胞中的基因调控元件可以根据染色质环境（context）分为两种：

要么位于DNA密集的封闭染色质区域，要么位于DNA没有紧密围绕组蛋白的更开放的染色质环境中。

染色质和染色体是同一种物质的两种形态。染色质是伸展的状态。有利于DNA信息的表达。

传统观点则认为，活性调控元件只位于开放的染色质区域内，在这里转录因子很容易接触到DNA。

因此，在封闭染色质区域内发现起作用的活性调节元件是该研究的核心新观察结果之一。

此外，研究人员还发现了依赖于染色质的调控元件。

这些元件在基因组中的正常位点具有活性，但如果将它们从原始位置移出并转移到另一个基因附近，它们的活性就会大大降低。

论文地址：
https://www.nature.com/articles/s41588-021-01009-4

参考链接：

https://phys.org/news/2022-02-uncovers-grammar-human-gene.html

— 完 —

「人工智能」、「智能汽车」微信社群邀你加入！

欢迎关注人工智能、智能汽车的小伙伴们加入我们，与AI从业者交流、切磋，不错过最新行业发展&技术进展。

ps.加好友请务必备注您的姓名-公司-职位哦~

点这里👇关注我，记得标星哦～

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见~

登录查看更多

相关内容

序列

关注 6

数学上，序列是被排成一列的对象（或事件）；这样每个元素不是在其他元素之前，就是在其他元素之后。这里，元素之间的顺序非常重要。

速看！上海交大卢策吾团队在Nature发表行为理解最新研究成果！

专知会员服务

40+阅读 · 2022年4月12日

【Nature通讯】结合深度学习和分子动力学模拟探索蛋白质的长程相互作用模式和酶活性

专知会员服务

19+阅读 · 2022年4月7日

【Nature. Mach. Intell. 】图神经网络论文汇集

专知会员服务

47+阅读 · 2022年3月26日

MIT设计深度学习框架登Nature封面，预测非编码区DNA突变

专知会员服务

15+阅读 · 2022年3月18日

计算机视觉和人类视觉有更多的共同点？MIT研究人员解读【周边视觉对机器的好处】

专知会员服务

21+阅读 · 2022年3月7日

【干货书】贝叶斯推理和机器学习，610页pdf

专知会员服务

258+阅读 · 2021年10月8日

【Nature通讯】深度神经网络模型中的个体差异

专知会员服务

14+阅读 · 2020年11月16日

【Cell 2020】神经网络中的持续学习

专知会员服务

62+阅读 · 2020年11月7日

【2020新书】从Excel中学习数据挖掘，223页pdf

专知会员服务

93+阅读 · 2020年6月28日

【PNAS2020-斯坦福】自监督训练的人工神经网络中的涌现语言结构

专知会员服务

20+阅读 · 2020年6月5日

MIT设计深度学习框架登Nature封面，预测非编码区DNA突变

专知

0+阅读 · 2022年3月18日

基因突变不是随机的？！Nature最新论文挑战进化论

量子位

1+阅读 · 2022年1月14日

Nature：人类因何「生而为人」？MIT领衔发现人脑与众不同的新线索

新智元

0+阅读 · 2021年12月15日

Nature：人类因何“生而为人”？MIT领衔发现人脑与众不同的新线索

学术头条

0+阅读 · 2021年11月17日

中科院DeepMind联手，用深度学习揭示大脑如何识别人脸｜Nature子刊

量子位

0+阅读 · 2021年11月14日

Nature 一周论文导读 | 2019 年 2 月 28 日

科研圈

13+阅读 · 2019年3月10日

基于植物胁迫响应基因表达数据和GO术语结合的特征选择及调控网络研究

国家自然科学基金

0+阅读 · 2014年12月31日

基因转录爆发的产生机制及其生物学功能研究

国家自然科学基金

1+阅读 · 2014年12月31日

新型分子伴侣蛋白Spy内在无序区域的功能研究及机制探索

国家自然科学基金

0+阅读 · 2013年12月31日

基于概率分布理论预测DNA调控元件的新方法研究

国家自然科学基金

1+阅读 · 2013年12月31日

淋巴瘤中ABIN家族基因表达和基因突变分析及其突变体的功能研究

国家自然科学基金

0+阅读 · 2012年12月31日

大脑皮层同克隆兴奋性神经元与中间神经元形成环路的发育特性

国家自然科学基金

0+阅读 · 2012年12月31日

拟南芥叶绿体蛋白DG1参与PEP型基因表达调控分子机制的研究

国家自然科学基金

0+阅读 · 2009年12月31日

苹果GPP和MIPP基因的功能及其与抗坏血酸合成调控的关系

国家自然科学基金

0+阅读 · 2009年12月31日

UGT基因簇进化及调控研究

国家自然科学基金

0+阅读 · 2009年12月31日

蓝氏贾第鞭毛虫表面抗原基因转录调控的研究

国家自然科学基金

0+阅读 · 2008年12月31日

Random Graphs by Product Random Measures

Arxiv

0+阅读 · 2022年4月20日

An attack on Zarankiewicz's problem through SAT solving

Arxiv

0+阅读 · 2022年4月19日

Accelerating Inhibitor Discovery for Multiple SARS-CoV-2 Targets with a Single, Sequence-Guided Deep Generative Framework

Arxiv

0+阅读 · 2022年4月19日

Low c-differentially uniform functions via an extension of Dillon's switching method

Arxiv

0+阅读 · 2022年4月19日

Low Degree Testing over the Reals

Arxiv

0+阅读 · 2022年4月18日

End-to-End Differentiable Molecular Mechanics Force Field Construction

Arxiv

0+阅读 · 2022年4月18日

Explore and Match: A New Paradigm for Temporal Video Grounding with Natural Language

Arxiv

0+阅读 · 2022年4月18日

Mining Disinformation and Fake News: Concepts, Methods, and Recent Advancements

Arxiv

16+阅读 · 2020年1月2日

Deep learning in agriculture: A survey

Arxiv

11+阅读 · 2018年7月31日

Deep Reinforcement Learning: An Overview

Arxiv

15+阅读 · 2018年6月23日

VIP会员