“基因编辑婴儿”惹争议,那你知道机器学习在脱靶效应中的作用吗?

2018 年 11 月 30 日 CSDN

作者 | 琥珀

出品 | AI科技大本营

又一次,计算机科学家和生物学者站在一起,对抗人类向内探索的挑战——用机器学习预测基因编辑 CRISPR 中的脱靶效应。

今年年初,发表在《自然》生物工程杂志上的一篇论文描述了 Elevation 这项工具。该工具由微软研究员 Nicolo Fusi、加州大学伯克利分校的 Jennifer Listgarten 和 Broad 研究所副主任 John Doench 合作研发,可在 CRISPR 编辑基因时预测脱靶效应。

那么何为“脱靶”?何为“CRISPR”?何为“基因编辑技术”?

首先,让我们来认识这项关键技术“CRISPR”(Clustered regularly interspaced short palindormic repeats),也被称为“CRISPR/Cas9 基因编辑技术”。

根据维基百科上的介绍来看,CRISPR 是存在于细菌中的一种基因组,该基因组中含有曾经攻击过该细菌的病毒的基因片段。细菌透过这些基因片段来侦测并抵抗相同病毒的攻击,并摧毁其 DNA 的特定部分。目前 Cas9 是首个被掌握且广泛应用的核酸酶。

该系统主要由两部分构成:一个负责剪切的 Cas9 蛋白,一个负责识别基因组中特定序列的“向导RNA”(sgRNA)

通过该序列,科学家们可以准确且有效地编辑生命体内的部分基因(通俗来讲,就是在特定基因的特定位点切割和改变 DNA)。该技术可能会带来突破性应用,如改造细胞生产高产耐寒作物,甚至还可能帮助人类大规模消除癌症、艾滋等疾病。


机器学习预测脱靶效应


不知大家是够还记得 2017 年 5 月发表在《Nature Methods》杂志上的一篇题为“Unexpected mutations after CRISPR-Cas9 editing in vivo”的论文研究?尽管后续调查发现研究存在的实验漏洞导致了错误判断,但也侧面反映出 CRISPR/Cas9 基因编辑系统存在的技术安全上诸多挑战。

其中一个重要问题就是发生在基因组中的脱靶效应,不仅在其目标序列切割,还对相似序列进行切割,导致产生潜在突变及危害。这一现象被称为“脱靶效应”。

为此,研究人员现在有多种方法来改善这一问题。本文开头提到的 Elevation 工具正是试图通过机器学习手段予以预测。

首先,他们在生成的数据上训练出了第一层机器学习模型。这些数据报告了所有可能的靶向区域的活动,只有一个核苷酸与向导 RNA 不匹配。

然后,通过团队哈佛医学院和马塞诸塞州总医院附属医院给出的公开数据,机器学习专家训练了第二层模型,该模型将第一层模型改进并推广到模型存在多个错配核苷酸的案例中。

"第二个模型非常重要,因为脱靶效应可以发生在不止一次向导 RNA 与靶向 DNA 之间的错配",伯克利大学分校 Lisgarten 教授表示。在他看来,一些模型特征是直观的,例如向导 RNA 与核苷酸序列之间的错配问题。

最后,该团队在其他几个公开数据集上验证了他们的双层模型,这其中还包括哈佛医学院和马塞诸塞州总医院附属医院生成的数据集。

通过计算工具,研究人员可以输入他们想要修改的基因名称,搜索结果将反馈出预测的脱靶效应,研究人员据此再进行排序。研究人员面临的首要挑战是为特定的实验选择何种 RNA。在每个向导 RNA 上大约有 20 个核苷酸,因此在每组实验中,每个靶向 DNA 基因上都匹配有数百种潜在的向导 RNA。

目前 Elevation 和另一篇用于预测靶向效应的工具 Azimuth 合起来使用,现已开源代码。(链接:https://www.crispr.ml/)


一场始料未及的风波


实际上,“脱靶效应”这个早就让研究人员们“草木皆兵”的研究话题自始至终都没有妥善的解决方案,而今却因另一件尚未确认的“突破性”进展骤然掀起了世界范围内包括学术研究者在内的热议。

挑起人们兴趣的来源于 11 月 26 日的一则公开消息。

“一对基因经过修改的双胞胎婴儿已于 11 月健康诞生,基因编辑使她们将来可能具有天眼抵抗艾滋病的能力。这是世界首例免疫艾滋病的基因编辑婴儿,也意味着中国在基因编辑技术用于疾病预防领域实现历史性突破。”

来自中国深圳的科学家贺建奎在第二届国际人类基因组编辑峰会召开前一天表示。

图:贺建奎

然而,这个“历史性突破”却未迎来掌声,而是更多人对该起事件的谴责。就连该技术发明人 Jennifer Doudna 也紧急回应称:“假定这个新闻得到证实,这使得对基因编辑技术的使用限制更为紧迫,我们应该限制对人类胚胎细胞的基因编辑仅仅用于确切的未被满足的医学需求。”

基因编辑技术,无论是用在人类医学、动植物育种还是药物筛选领域,都存在技术与伦理道德层面的双重考验。

那么如果在可接受的伦理道德和医学需求范围之内,研究人员对基因编辑技术的探索仍旧不会终止。

这不禁让笔者想起了“进击的巨人”中描述的那样:破墙而入捕食人类的巨人,实际上在数百年前是人类自己所创造。

微信改版了,

想快速看到CSDN的热乎文章,

赶快把CSDN公众号设为星标吧,

打开公众号,点击“设为星标”就可以啦!

征稿啦

CSDN 公众号秉持着「与千万技术人共成长」理念,不仅以「极客头条」、「畅言」栏目在第一时间以技术人的独特视角描述技术人关心的行业焦点事件,更有「技术头条」专栏,深度解读行业内的热门技术与场景应用,让所有的开发者紧跟技术潮流,保持警醒的技术嗅觉,对行业趋势、技术有更为全面的认知。

如果你有优质的文章,或是行业热点事件、技术趋势的真知灼见,或是深度的应用实践、场景方案等的新见解,欢迎联系 CSDN 投稿,联系方式:微信(guorui_1118,请备注投稿+姓名+公司职位),邮箱(guorui@csdn.net)。


推荐阅读:

登录查看更多
0

相关内容

是加州大学伯克利分校 EECS系 和 计算生物学中心的教授, 伯克利AI研究(BAIR)实验室指导委员会成员 ,以及 Chan Zuckerberg研究人员。
【ACL2020-Google】逆向工程配置的神经文本生成模型
专知会员服务
17+阅读 · 2020年4月20日
专知会员服务
28+阅读 · 2020年3月6日
【学科交叉】抗生素发现的深度学习方法
专知会员服务
25+阅读 · 2020年2月23日
机器学习在材料科学中的应用综述,21页pdf
专知会员服务
49+阅读 · 2019年9月24日
Nature 一周论文导读 | 2019 年 8 月 1 日
科研圈
8+阅读 · 2019年8月11日
Nature 一周论文导读 | 2019 年 6 月 6 日
科研圈
7+阅读 · 2019年6月16日
Nature 一周论文导读 | 2019 年 5 月 30 日
科研圈
15+阅读 · 2019年6月9日
《科学》(20190426出版)一周论文导读
科学网
5+阅读 · 2019年4月27日
Nature 一周论文导读 | 2019 年 4 月 4 日
科研圈
7+阅读 · 2019年4月14日
Science:脂肪细胞外泌体对巨噬细胞发挥调节功能
外泌体之家
19+阅读 · 2019年3月7日
Nature 一周论文导读 | 2019 年 2 月 14 日
科研圈
7+阅读 · 2019年2月24日
外泌体相比干细胞的优势是什么?
外泌体之家
43+阅读 · 2018年11月15日
Nature 一周论文导读 | 2018 年 3 月 29 日
科研圈
12+阅读 · 2018年4月7日
Arxiv
24+阅读 · 2019年11月24日
Physical Primitive Decomposition
Arxiv
4+阅读 · 2018年9月13日
Arxiv
12+阅读 · 2018年9月5日
Feature Selection Library (MATLAB Toolbox)
Arxiv
7+阅读 · 2018年8月6日
VIP会员
相关资讯
Nature 一周论文导读 | 2019 年 8 月 1 日
科研圈
8+阅读 · 2019年8月11日
Nature 一周论文导读 | 2019 年 6 月 6 日
科研圈
7+阅读 · 2019年6月16日
Nature 一周论文导读 | 2019 年 5 月 30 日
科研圈
15+阅读 · 2019年6月9日
《科学》(20190426出版)一周论文导读
科学网
5+阅读 · 2019年4月27日
Nature 一周论文导读 | 2019 年 4 月 4 日
科研圈
7+阅读 · 2019年4月14日
Science:脂肪细胞外泌体对巨噬细胞发挥调节功能
外泌体之家
19+阅读 · 2019年3月7日
Nature 一周论文导读 | 2019 年 2 月 14 日
科研圈
7+阅读 · 2019年2月24日
外泌体相比干细胞的优势是什么?
外泌体之家
43+阅读 · 2018年11月15日
Nature 一周论文导读 | 2018 年 3 月 29 日
科研圈
12+阅读 · 2018年4月7日
Top
微信扫码咨询专知VIP会员