药物化学第一期::蛋白质与小分子对接算法总结

2022 年 3 月 3 日 GenomicAI

大多数情况,药物的活性成分是小分子和蛋白质结合体的部分,因此蛋白质与配体对接在药物研发过程中很常用。


对接算法将一个灵活的配体对接到蛋白质刚性结合位点,可以分为3类:


1 随机方法


随机方法:随机生成配体的构象,在结合位点进行平移和旋转。然后用打分函数给产生的姿势打分,为了确定好的姿势,不同的方法用来评估。由于随机旋转和平移以及这些不同的接受概率,后续对接运行的解决方案可能会有所不同,其中用这种策略最知名的三个算法包括AutoDock[2,3],GOLD[4,5],PLANTS[6, 7]。


AutoDock采用模拟退火去发现好的姿势。如果姿势打分比前一个构象有提升,则总是被接受。较低的姿势能否被接受,遵循的是Metropolis规则[8]。这是依赖于温度参数,该参数是逐步减少的(冷却)。因此在退火模拟开始时候,接受所有的姿势,在后续对接的步骤更严格。AutoDock Vina[9]是AutoDock的增强版,在结合模式预测有更高的准确率和更低的运行时间。


GOLD采用的遗传算法产生姿势。随机遗传算法将配体的构象,蛋白质的构象和氢键解释为单个染色体。然后染色体随机改变(突变)和组合(交叉)以产生新的溶液。fitness函数评估由染色体编码的对接姿势分数,并有利于那些具有较高fitness的姿势作为进一步突变的基础。


PLANTS使用启发式和迭代蚁群优化(iterative ant colony optimization,ACO)[10]方法来生成姿势。最初,将生成一组姿势,对其进行评分并进行局部优化。与沿着信息素路径到达食物来源的蚂蚁类似,ACO方法有利于在以前的迭代中显示出良好评分结果的姿势的平移,旋转和扭转。因此,姿势可以迭代优化。


2 基于片段的方法


基于片段的方法将配体切割在较小片段中的可旋转键处,以准确处理配体的构象灵活性。放置初始片段后,配体随后在蛋白质的活性位点重建。每个片段在构建过程中都会被评分。与模拟退火和GA等随机方法相比,构建过程是确定性的,因此可以再现结果。FlexX[11]和eHiTS[12]是两个典型的工具用了这个策略。


FlexX将初始片段放入蛋白质活性位点中,从这个基础片段开始,FlexX随后重建配体。在增量构建过程中使用贪婪的方法,将解决方案的数量限制为几百个具有合理高分的解决方案。因此,该算法本质上是启发式的。


LeadIT[13]对FlexX做了优化,提供改进的对接算法和更复杂的评分以及图形用户界面。


eHiTS将配体分解成刚性片段并连接柔性链。刚性片段独立的靠在活性位点中,群组检测算法可以识别兼容的片段姿势集合。由于此时已经计算了单独放置的片段的分数,因此可以确定最初放置的刚性片段的全局最佳组合。最后,将柔性链拟合到刚性片段上以形成粗糙的结合姿势,然后通过局部能量最小化进行细化。



3 构象融合方法


构象融合的方法在第一步中生成多构象配体库。然后将这些构象置于蛋白质的活性位点中。采用此策略的工具包括Glide[14, 15],FRED[16,17],TrixX[18,19]。


Glide通过详尽地枚举配体扭转角空间中全局能量最小值来生成构象。这些低能量构象用于蛋白质活性位点的快速预筛选。预筛选的最佳姿势在第一步中能量最小化,然后进行蒙特卡洛搜索过程来识别附近的扭转最小值。最后,通过评分函数、将分子力学能量和配体应变能的组合对最佳姿势进行评分。


FRED使用OMEGA[20]作为构象发生器。对于每个构象,所有的旋转和平移都以指定的分辨率系统地生成。与刚性蛋白质碰撞或离活性位点太远的姿势被移除。对剩余的姿势进行评分,并通过应用最小平移和旋转对前100个得分姿势进行局部优化。


TrixX使用内置的构象生成器。对于每个构象以及蛋白质的活性位点,计算基于形状和相互作用的描述符。符合构象的索引描述符存储在数据库中。活性位点的描述符用于查询数据库以标识有效的姿势。这些姿势最终使用FlexX评分函数进行评分。


考虑蛋白质的柔性

虽然这些现代对接工具都解决了配体灵活性的问题,但蛋白质灵活性往往被忽视,因此它大大增加了搜索空间。


目前有两种不同的方法来模拟蛋白质的柔性[21]:


第一种直接的方法是生成蛋白质构象的集合,并将配体分别对接到每个构象中,此方法称为集成对接(ensemble docking,ED)。原则上,每个对接工具都可用于ED,然而产生正确的蛋白质构象和选择最佳姿势是困难的。


第二种模拟蛋白质柔性的方法将配体放入蛋白质腔体中,然后允许蛋白质调整其构象以最佳地适合配体。这种方法称为诱导拟合对接(induced fit docking,IFD)。


FITTED[22]是考虑蛋白质柔性对接工具的一个例子。它同时实现了ED和IFD,并通过GA限制搜索空间。尽管取得了这些进展,但仍然需要更准确,更快速的解决方案,以允许完全灵活的蛋白质-配体常规对接。


应用化学第一期分享:蛋白质与小分子对接打分函数总结。


参考文献

[1] Applied Chemoinformatics Achievements and Future Opportunities-Wiley-VCH(2018)

[2]  Goodsell, D.S. and Olson, A.J. (1990) Proteins, 8 (3), 195–202.

[3]  Morris, G., Goodsell, D., Halliday, R., Huey, R., Hart, W., Belew, R., and

Olson, A.J. (1998) J. Comput. Chem., 19, 1639.

[4]  Jones, G., Willett, P., and Glen, R.C. (1995) J. Mol. Biol., 245, 43–53.

[5]  Verdonk, M.L., Chessari, G., Cole, J.C., Hartshorn, M.J., Murray, C.W.,

Nissink, J.W.M., Taylor, R.D., and Taylor, R. (2005) J. Med. Chem., 48,

6504–6515.

[6]  Korb, O., Stuetzle, T., and Exner, T.E. (2006) Lect. Notes Comput. Sci., 4150,

247–258.

[7]  Korb, O., Stuetzle, T., and Exner, T.E. (2009) J. Chem. Inf. Model., 49, 84–96.

[8]  Metropolis, N., Rosenbluth, A., Rosenbluth, M., Teller, A., and Teller, E.

(1953) J. Chem. Phys., 21 (6), 1087–1092.

[9]  Trott, O. and Olson, A.J. (2010) J. Comput. Chem., 31, 455–461.

[10]  Dorigo, M. and Stützle, T. (2004) Ant Colony Optimization, MIT

Press/Bradford Books, Cambridge, MA. ISBN: 0-262-04219-3

[11]  Rarey, M., Kramer, B., Lengauer, T., and Klebe, G. (1996) J. Mol. Biol., 261

(3), 470–489.

[12]  Zsoldos, Z., Reid, D., Simon, A., Sadjad, B.S., and Johnson, A.P. (2006) Curr.

Protein Pept. Sci., 7 (5), 421–435.

[13]  LeadIT, BioSolveIT GmbH, Germany, http://www.biosolveit.de/LeadIT

(accessed January 2018).

[14]  Friesner, R.A., Banks, J.L., Murphy, R.B., Halgren, T.A., Klicic, J.J., Mainz, D.T., Repasky, M.P., Knoll, E.H., Shelley, M., Perry, J.K., Shaw, D.E., Francis, P., and Shenkin, P.S. (2004) J. Med. Chem., 47, 1739–1749.

[15]  Halgren, T.A., Murphy, R.B., Friesner, R.A., Beard, H.S., Frye, L.L., Pollard,

W.T., and Banks, J.L. (2004) J. Med. Chem., 47, 1750–1759.

[16]  McGann, M.R., Almond, H.R., Nicholls, A., Grant, J.A., and Brown, F.K.

(2003) Biopolymers, 68, 76–90.

[17]  McGann, M.R. (2011) J. Chem. Inf. Model., 51 (3), 578–596.

[18]  Schellhammer, I. and Rarey, M. (2007) J. Comput.-Aided Mol. Des., 21 (5),

223–238.

[19]  Henzler, A.M., Urbaczek, S., Hilbig, M., and Rarey, M. (2014) J.

Comput.-Aided Mol. Des., 28 (9), 927–939.

[20]  Bostrom, J., Greenwood, J.R., and Gottfries, J. (2003) J. Mol. Graphics Mod- ell., 21 (5), 449–462.

[21]  Henzler, A.M. and Rarey, M. (2010) Mol. Inf., 29 (3), 164–173.

[22]  Corbeil, C.R., Englebienne, P., and Moitessier, N. (2007) J. Chem. Inf. Model.,

47 (2), 435–449.


登录查看更多
4

相关内容

ICLR 2022|化学反应感知的分子表示学习
专知会员服务
20+阅读 · 2022年2月10日
【AAAI2022】利用化学元素知识图谱进行分子对比学习
专知会员服务
27+阅读 · 2021年12月3日
【ICML2021】学习分子构象生成的梯度场
专知会员服务
14+阅读 · 2021年5月30日
最新「图机器学习药物发现」综述论文,22页pdf245篇文献
DeepMind《AlphaFold2蛋白质结构预测》CASP14介绍报告,42页ppt
ScienceDirect|AI 在3D化合物设计中的应用综述
GenomicAI
2+阅读 · 2022年2月9日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
0+阅读 · 2022年4月18日
Directional Graph Networks
Arxiv
27+阅读 · 2020年12月10日
VIP会员
相关资讯
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员