药物的发现是昂贵、耗时并且科学上具有挑战性的。为了提高临床前药物发现路径的效率,计算药物发现方法,尤其是最近的基于机器学习的方法,越来越多地被用作为早期药物发现的有力工具。 在这篇论文中,我展示了三种互补的计算机辅助药物发现方法,重点是为了帮助发现新的潜在药物和优化潜在药物的性质。此外,这篇论文特别关注用于特征化机器学习模型的不同分子表示方法,以探索如何最好地捕获关于蛋白质、配体和3D蛋白质-配体复合体的有价值信息,以构建更稳健、更可解释和更准确的机器学习模型。
首先,我使用高斯过程(GP)开发了基于配体的模型,作为一个简单易行的工具来指导化学空间的探索,以优化蛋白质-配体的结合亲和力。我探索了不同的拓扑指纹和自编码器表示法进行贝叶斯优化(BO),并表明BO是一个强大的工具,可以帮助药物化学家优先考虑哪些新化合物用于单目标和多目标优化。当在一个众所周知的药物靶标基质金属蛋白酶-12的基准数据集和一个针对四种细菌金属-β-内酰胺酶的实际正在进行的药物优化数据集上进行测试时,该算法实现了对顶级化合物的高度富集。
接下来,我展示了一种基于知识的药物设计方法,结合新的蛋白质-配体相互作用指纹和基于片段的药物发现方法,以理解SARS-CoV-2 Mpro-底物的特异性并在硅内设计新的小分子抑制剂。结合基于片段的药物发现方法,我展示了这种基于知识的相互作用指纹驱动的方法如何揭示有成果的片段增长设计策略。
最后,我扩展了基于知识的接触指纹,创建了一个配体形状的分子图表示法(蛋白质配体相互作用图,PLIGs),以开发新的基于图的深度学习蛋白质-配体结合亲和力评分函数。PLIGs在图的节点特征中编码了蛋白质-配体复合物中的所有分子间相互作用,因此它们是简单且完全可以解释的。我探索了与PLIGs结合的各种图神经网络架构,并发现图注意网络比其他GNN架构略微优越,其性能与最知名的蛋白质-配体结合亲和力评分函数相媲美。
牛津大学是一所英国研究型大学,也是罗素大学集团、英国“G5超级精英大学”,欧洲顶尖大学科英布拉集团、欧洲研究型大学联盟的核心成员。牛津大学培养了众多社会名人,包括了27位英国首相、60位诺贝尔奖得主以及数十位世界各国的皇室成员和政治领袖。2016年9月,泰晤士高等教育发布了2016-2017年度世界大学排名,其中牛津大学排名第一。