题目: The Synthesizability of Molecules Proposed by Generative Models
摘要: 功能性分子的挖掘是一个昂贵而耗时的过程,小分子治疗性挖掘的成本不断上升就是一个例证。新分子生成和优化是一类在早期药物发现中日益受到关注的技术,它是由新的深度学习方法的发展所催化的。1 .这些技术可以提出新的分子结构,目的是最大化多目标功能,例如,对特定目标的治疗适应性;2 .不依赖于对化学空间的强力探索。然而,这些方法的实用性由于忽视了可综合性而受到阻碍。为了强调这个问题的严重性,我们使用一个数据驱动的计算机辅助合成计划程序来量化由最先进的生成模型提出的分子不容易合成的频率。我们的分析表明,尽管这些模型在流行的定量基准上表现良好,但在一些任务中,这些模型产生了不现实的分子结构。合成复杂性启发法可以成功地使生成偏向于可合成处理的化学空间,尽管这样做必然会偏离最初的目标。分析表明,为了提高这些模型在实际挖掘工作流中的实用性,有必要开发新的算法。