提速1200倍！MIT开发新一代药物研发AI，吊打老模型

会员服务 ·

提速1200倍！MIT开发新一代药物研发AI，吊打老模型

2022 年 7 月 28 日 新智元

新智元报道

编辑：David 如願

【新智元导读】MIT研究人员开发了一个几何深度学习模型。该模型在成功将类药物分子与蛋白质结合方面，比最快的计算分子对接模型更快、更准确，减少了药物试验失败的机会和成本。

众所周知，整个宇宙充满着无数分子。

这些分子中又有多少具有潜在的类似药物的特性，可用于开发挽救生命的药物呢？是百万级？还是十亿级？又或是万亿级？

答案是：10的60次幂。

如此巨大的数字，大大延缓了新药的研发进度，像新冠等快速传播的疾病，目前迟迟未有特效药，也是因为分子种类和数量太大，远远超出了现有药物设计模型可以计算的范围。

MIT的一个研究团队偏不信这个邪。算不过来是吧，那把之前的模型加加速总可以吧？

这一加速，就是1200倍。

他们研究了一款名为「EquiBind」的几何深度学习模型，该模型比之前最快的计算分子对接模型「QuickVina2-W」快了1200倍，成功地将类药物分子与蛋白质结合，减少了药物试验失败的机会和成本。

研究论文即将发表在ICML 2022上。

初识「EquiBind」

「EquiBind」是基于其前身「EquiDock」研发的，「EquiDock」使用了已故的麻省理工学院AI研究员Octavian-Eugen Ganea开发的技术，去结合两种蛋白质。Ganea也是「EquiBind」论文的合著者。

在药物开发开始之前，研究人员必须找到有前途的药物样分子，这些分子可以在药物发现的过程中正确地结合或「停靠」在特定的蛋白质靶点上。

在与蛋白质成功对接后，结合药物（配体），可以阻止蛋白质发挥作用。如果这种情况发生在细菌的一种基本蛋白质上，它可以杀死细菌，从而保护人体。

然而，不论是从经济角度分析，还是从计算角度分析，药物发现的过程都可能是昂贵的，研发过程动辄耗资数十亿美元，并且在FDA最终批准之前，会进行超过十年的开发和测试。

更重要的是，90%的药物在人体试验后由于没有效果或副作用过多而失败。

所以制药公司收回这些成本的方法之一就是，提高最终成功研发药物的价格。

走进「EquiBind」

目前，寻找有希望的候选药物分子的计算过程是这样的：大多数最先进的计算模型依赖于大量的候选样本，再加上评分、排名和微调等方法，以获得配体和蛋白质之间的最佳「匹配」。

Hannes Stärk是MIT电子工程与计算机科学系的一年级研究生，也是这篇论文的主要作者，他把典型的「配体-蛋白质」结合方法比作「试图把钥匙放进有很多钥匙孔的锁中」。

典型的模型在选择最佳模型之前会花费时间对每个「拟合度」进行评分。相比之下，「EquiBind」无需事先了解蛋白质的目标口袋，只需一步就能直接预测出精确的关键位置，这被称为「盲对接」。

与大多数需要多次尝试才能找到配体在蛋白质中的有利位置的模型不同，「EquiBind」已经具有内置的几何推理功能，可帮助模型学习分子的潜在物理特性，并成功地进行归纳。以便在遇到新的或者无法识别的数据时成功泛化，以做出更好的预测。

EquiBind模型架构

这些发现的发布迅速引起了业内专业人士的注意，其中包括Relay Therapeutics首席数据官Pat Walters。

Walters建议，研究小组可以在一种现有的用于肺癌、白血病和胃肠道肿瘤的药物和蛋白质上去尝试他们的模型。尽管大多数传统的对接方法都未能成功地结合这些蛋白质上的配体，但是「EquiBind」成功了。

Walters说：「EquiBind为对接问题提供了一种独特的解决方案，它结合了姿态预测和结合位点识别。」

「并且这种方法利用了来自数千个公开的晶体结构的信息，有可能会以新的方式影响该领域。”

Stärk表示：「当其他所有方法都完全错误或仅有一个正确时，我们很惊讶，因为EquiBind能够把它放进正确的口袋，看到这个结果，我们是十分激动的！」

EquiBind解决的结构药物结合问题概览

助力「EquiBind」

尽管「EquiBind」已经收到了大量的来自业内专业人士的反馈，并且这些反馈帮助了团队考虑计算模型的实际用途，但Stärk仍希望在7月份即将举行的ICML上找到不同的观点。

Stärk表示：「我最期待的反馈是关于如何进一步改进该模型的建议。」

「我想和这些研究人员讨论，告诉他们我认为下一步可以怎么做，并鼓励他们继续前进，将模型用于他们自己的论文和方法中。目前已经有很多研究人员联系了我们，询问我们这个模型是否会对他们的问题有用。」

此外，这篇文章同样也是为了纪念Octavian-Eugen Gane，他为几何机器学习研究做出了至关重要的贡献，并慷慨地指导了许多学生，他是一个有着谦逊灵魂的杰出学者。

今年上半年，他在一次徒步旅行中永远离开了我们。

参考资料：

https://news.mit.edu/2022/ai-model-finds-potentially-life-saving-drug-molecules-thousand-times-faster-0712

https://arxiv.org/pdf/2202.05146.pdf

登录查看更多

相关内容

分子

关注 0

主动学习预测结合自由能进行分子优化

专知会员服务

15+阅读 · 2022年9月18日

基于人工智能(AI)的蛋白结构预测工具合集

专知会员服务

10+阅读 · 2022年8月25日

【2022新书】药物开发中的数据科学、人工智能和机器学习，335页pdf

专知会员服务

108+阅读 · 2022年8月19日

加速构建蛋白质元宇宙！分子之心借MoleculeOS引擎完成AI蛋白预测三级迭代

专知会员服务

6+阅读 · 2022年8月11日

MIT等十余位作者最新成果：教人工智能问临床问题（含源码）

专知会员服务

21+阅读 · 2022年7月18日

MIT最新成果【ICML 2022】：人工智能模型发现潜在药物分子的速度快了一千倍

专知会员服务

17+阅读 · 2022年7月17日

IBM | 增强配体与靶标契合的小分子图生成模型

专知会员服务

7+阅读 · 2022年7月5日

【MIT博士论文】分子图表示学习与生成的药物发现

专知会员服务

49+阅读 · 2022年6月28日

ICML 2022 | LIMO: 一种快速生成靶向分子的新方法

专知会员服务

4+阅读 · 2022年6月26日

【Nature子刊】ProteinGAN使用生成式对抗网络生成蛋白质变体，加速药物研发

专知会员服务

26+阅读 · 2021年4月6日

MIT博士也来卷的新风口？GNN如何发现新药？

图与推荐

0+阅读 · 2022年6月30日

许锦波团队开发蛋白逆折叠深度学习框架，用更少结构数据训练获得更准确序列预测

机器之心

0+阅读 · 2022年4月24日

AI for Science：人工智能改变化学领域，机器学习范式加速化学物质发现

机器之心

1+阅读 · 2022年3月6日

快80~500倍！人工智能快速预测两种蛋白质的结构互作方式

机器之心

1+阅读 · 2022年2月19日

新型结核分枝杆菌选择性抑制剂的构效关系及靶点鉴定研究

国家自然科学基金

0+阅读 · 2014年12月31日

以PI4KIIα为靶点抗肿瘤抑制剂的筛选及优化

国家自然科学基金

0+阅读 · 2014年12月31日

放射性核素标记的EphrinA1 配体类似物对非小细胞肺癌靶向治疗的实验研究

国家自然科学基金

0+阅读 · 2013年12月31日

利用多维药物筛选方法开发蛋白激酶先导化合物

国家自然科学基金

0+阅读 · 2013年12月31日

检测β-内酰胺酶的荧光小分子探针的设计、合成及其在结核杆菌检测中的应用

国家自然科学基金

0+阅读 · 2013年12月31日

利用免疫蛋白组SPRi芯片技术筛选阿尔茨海默症的类肽诊断探针

国家自然科学基金

0+阅读 · 2013年12月31日

基于PPARs多靶点的抗糖尿病药物设计、合成和活性研究

国家自然科学基金

0+阅读 · 2012年12月31日

作用于植物细菌群体感应信号分子的受体LuxR的化学抑制剂的合理设计

国家自然科学基金

0+阅读 · 2012年12月31日

胶质瘤干细胞的特异性核酸适体筛选及其在胶质瘤靶向药物治疗中的应用

国家自然科学基金

0+阅读 · 2012年12月31日

靶向细胞周期蛋白依赖性激酶11通路对骨肉瘤细胞的作用

国家自然科学基金

0+阅读 · 2012年12月31日

Zero-Shot 3D Drug Design by Sketching and Generating

Arxiv

0+阅读 · 2022年10月4日

Automated Medical Device Display Reading Using Deep Learning Object Detection

Arxiv

0+阅读 · 2022年10月4日

Bridging the Performance Gap between FGSM and PGD Adversarial Training

Arxiv

0+阅读 · 2022年10月3日

MultiGuard: Provably Robust Multi-label Classification against Adversarial Examples

Arxiv

0+阅读 · 2022年10月3日

Heatmap Distribution Matching for Human Pose Estimation

Arxiv

0+阅读 · 2022年10月3日

Community Learning: Understanding A Community Through NLP for Positive Impact

Arxiv

0+阅读 · 2022年10月2日

Retrieval-based Controllable Molecule Generation

Arxiv

0+阅读 · 2022年9月30日

Sphere-Guided Training of Neural Implicit Surfaces

Arxiv

0+阅读 · 2022年9月30日

A Continual Development Methodology for Large-scale Multitask Dynamic ML Systems

Arxiv

0+阅读 · 2022年9月30日

Towards a Human-like Open-Domain Chatbot

Arxiv

14+阅读 · 2020年1月27日

VIP会员