由于在计算机视觉和自然语言处理等领域的成功应用,深度学习方法经历了一场革命。在这篇论文中,我们描述了几种利用深度学习应用于临床前药物发现的新方法。
首先,我们提出了一种包含基本3D信息的生成式分子连接器设计方法。在大规模测试中,我们发现我们的方法在性能上大大优于基于数据库的方法,即之前解决这个问题的事实上的方法。通过一系列案例研究,我们展示了我们的方法在支架跳跃、片段连接和PROTAC设计中的应用。然后,我们扩展了这个框架,以包含物理上有意义的3D结构信息,为生成过程提供了更丰富的先验,并将我们的方法应用于分子细化任务,如R-group设计。
然后我们将注意力转向预测建模,特别是基于结构的虚拟筛选。我们发现,用于一般计算机视觉任务的卷积神经网络(CNNs)的进展适用于基于结构的虚拟筛选。此外,我们提出了两种技术来将领域特定的知识合并到这个框架中。首先,我们展示了对接的局限性,需要使用多姿势评分,并演示了平均评分策略的好处。其次,利用蛋白质家族之间的差异知识,提出了一种迁移学习方法来构建蛋白质家族特定模型。
最后,我们研究了生成方法如何用于改进基于结构的虚拟筛选中使用的训练和基准集。我们提出了一种深度学习方法,该方法根据用户偏好的规格生成诱饵,以控制诱饵偏差或构造具有定义偏差的集合。我们表明,我们的方法显著减少了这些集合中包含的偏差。我们验证了我们生成的分子在基于对接的方法中分离生物活性化合物时比之前的诱饵更具挑战性。此外,我们表明,基于CNN的基于结构的虚拟筛选方法可以训练这些化合物。