AI一小时预测出奥密克戎变体结构,误差仅半个原子直径

2022 年 1 月 12 日 量子位
金磊 发自 凹非寺
量子位 报道 | 公众号 QbitAI

就在这两天,“天津迎战新冠变异病毒奥密克戎 (Omicron)”引发了高度关注。

奥密克戎最早发现于南非,并且席卷了大半个世界,在被发现时已经传播三代。

天津作为此次防疫“主战场”,截至昨日12时,已经累计97例阳性。

抗击疫情,刻不容缓。

而与此同时,全球科学家对奥密克戎的研究也没有停滞。

来自北卡罗来纳大学夏洛特分校的Colby Ford研究团队,便在近日发布了其最新研究成果:

利用AI技术,几乎准确地预测了奥米克戎的复杂结构

他们的工作可以说是“站在巨人的肩膀上”,具体而言,就是利用 AlphaFold2RoseTTAFold,由此预测出了3D蛋白质结构。

在论文中,Ford对研究结果是这样总结的:

奥密克戎受体结合域(RBD)的一些结构变化,可能会减少抗体相互作用,但不会完全避开现有的中和性抗体。

简单来说,就是现有疫苗对奥密克戎病毒有用,但由于其结构的改变,降低了抗体的识别能力。

这就能解释,为何现有的奥密克戎感染病例中有已经打过疫苗的患者了。

但这项研究所提供更深远的意义,正如《连线》杂志评价的那样:

可以为未来的药物指明方向。

AI一小时预测奥密克戎结构

关于这项研究,还得追溯到去年的11月27日。

当日凌晨,世卫组织将这个新冠“最凶变种”正式命名为Omicron

而就在第二天,不列颠哥伦比亚大学(UBC)Sriram Subramaniam 便火速下载了发布在网上的基因序列组,还安排把奥密克戎的DNA 样本运送到实验室中。

他们想采用的方法是通过显微镜来揭示奥密克戎的蛋白质3D结构。

与此同时,Colby Ford也在密切关注着这件事情。

也是在世卫组织正式命名的前后脚,他尝试用免费的AI软件,从奥密克戎基因组编码的氨基酸序列中预测其结构。

仅仅1小时之后,Ford便得到了他的第一个结果,并且很快将它们发布到了网上。

Subramaniam则是在12月21日,发表了他们通过显微镜得到的结果。

最终结果表明,Ford用AI技术预测的2个蛋白质结构中,有一个被证明是与Subramaniam真实观测结果高度接近——

中心原子的位置误差只有约半埃(大约是氢原子的半径)

不过Ford认为,对于新冠这类病毒,研究上的时效显得格外重要,毕竟其传播的凶猛程度也是有目共睹的。

至于Ford所采用的AI方法,也正如刚才提到的,是基AlphaFold2和RoseTTAFold。

整体而言,他的研究主要包含三大方面。

第一步,是监测变种 (VBM)关切变种 (VOC)的序列比较。

Ford团队下载了新冠病毒的参考基因组,以及各种VOC和VBM的前100个全基因组序列。

对这些基因组再进行一个“对齐”和“修剪”的工作,最终留下了1026条序列。

基于此,Ford对这1026条序列进行“注释”,再根据序列相似性确定了该序列上的受体结合基序。

然后,他们用MEGA11.0.10版计算每对序列之间的成对p-距离,再使用标准翻译表将尖峰蛋白的这个变体核苷酸序列翻译成氨基酸。

最终对该序列进行修剪,使其只包含穗状蛋白的RBD(第319至541位)

第二步,是RBD的结构预测

Ford在这一步中,基于上面得到奥密克戎衍生RBD氨基酸序列,使用AlphaFold2和RoseTTAFold创建了预测的3D蛋白质结构。

基于AlphaFold2的预测,是在 “单一序列 “模式下使用PTM方法(predicted TM-score)运行。

而基于RoseTTAFold的预测,则是用 “mmseqs2 “模式运行的。

这两个系统都产生了奥密克戎的预测RBD结构,以及围绕多序列比对覆盖率、预测比对误差(PAE)和预测置信度(pLDDT)等指标。

第三步,是 中和抗体相互作用模拟

在这个步骤中,Ford团队基于上面得到的奥密克戎RBD预测结构,模拟了与四个现有中和抗体结构的相互作用(分别为C105, CC12.1, CC12.3, and CV30)

在这个过程中,他们只使用抗体结构的一个单片段抗原结合(Fab)区域,作为对接的位置。

接下来,他们用到了生物分子建模软件HADDOCK,来预测RBD表位与中和抗体结构的副体之间的结合亲和力。

最后,Ford团队将实际复合物(即真正的RBD结构和Fab)与奥密克戎的预测RBD结构(有相同的Fab)的指标进行了比较。

……

而从实验结果上来看,现有的中和抗体可能仍然会与奥密克戎变异的突变刺突蛋白结合。

然而,与参考RBD结构相比,奥密克戎的RBD对中和抗体的亲和力似乎降低了。

AlphaFold2和RoseTTAFold的结果都表明,以前感染的抗体至少会对奥密克戎提供一些保护。

而也正因如此,加之此次奥密克戎患者的症状并没有此前德尔塔那般严重,许多人都把它比作“大号感冒”。

但事实是否真的如此呢?

张伯礼:奥密克戎并非“大号感冒”

也就在天津这两天天津疫情被高度关注之际,国内专家已经站出来对“大号感冒”的说法做出了解释。

国家传染病医学中心主任张文宏认为:

对于已经获得免疫力的人来讲,它是个“大号流感”。

如果你的免疫力不够强大,奥密克戎不是“大号流感”;如果没有很好的医疗资源,奥密克戎是会“咬人”的。

中国工程院院士张伯礼也表示:

奥密克戎和“大号流感”并不一样,在国外大概有百分之五六十的病人出现了持续症状或后遗症,但一般的流感不会出现这么多。

而就在最近,世卫组织也对奥密克戎发出警告,称“尽管其毒性可能较弱,但不能低估了它”。

甚至还做出了“或在6到8周内感染半数以上欧洲人”的预测。

因此,做好防疫措施依然是重中之重。

对此,汕头大学病毒学专家常荣山建议,“没有准备N95或KN95口罩的天津市民,外出时应当戴双层外科口罩,或在布口罩外面套戴一个外科口罩增强密闭性”。

他表示:

叠加两个口罩的保护效果为90%,即可以减少90%的传染概率,而单个口罩的效果则为70%。

参考链接:

[1]https://www.wired.com/story/ai-software-nearly-predicted-omicrons-tricky-structure/
[2]https://www.biorxiv.org/content/10.1101/2021.12.03.471024v4.full
[3]https://baijiahao.baidu.com/s?id=1721544674645640819&wfr=spider&for=pc

「智能汽车」交流群招募中!

欢迎关注智能汽车、自动驾驶的小伙伴们加入社群,与行业大咖交流、切磋,不错过智能汽车行业发展&技术进展。

ps.加好友请务必备注您的姓名-公司-职位哦~


点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见~


登录查看更多
0

相关内容

数学上,序列是被排成一列的对象(或事件);这样每个元素不是在其他元素之前,就是在其他元素之后。这里,元素之间的顺序非常重要。
【干货书】预测原理与实战,Forecasting: Principles & Practice
专知会员服务
92+阅读 · 2022年4月11日
MIT设计深度学习框架登Nature封面,预测非编码区DNA突变
专知会员服务
13+阅读 · 2022年3月18日
NeurIPS 2021 | 通过动态图评分匹配预测分子构象
专知会员服务
21+阅读 · 2021年12月4日
专知会员服务
49+阅读 · 2021年6月2日
专知会员服务
27+阅读 · 2020年3月6日
奥密克戎新毒株XE出现!传播速度快10%
量子位
0+阅读 · 2022年4月1日
德尔塔克戎,新冠“双毒合一”变体首次证实
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2010年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年4月18日
Arxiv
0+阅读 · 2022年4月17日
Arxiv
13+阅读 · 2021年3月29日
VIP会员
相关基金
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2010年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员