逆合成设计是有机化学的关键问题之一。由于在反应的每一步理论上都有成千上万种可能的转化导致设计的搜索空间是巨大的,即使是有经验的化学家处理这个问题也是十分棘手的。
单步逆合成预测对给定产物可能的直接反应物列表的预测,尽管单步合成法不断得到改进,但现实世界中的大多数分子都无法在一步之内合成。合成步骤的数量可以达到60个甚至更多。单步逆合成法面临着巨大的搜索空间和性能测量及基准测试模糊性的挑战,为实现多步逆合成设计奠定基础。
在本文中,作者提出了一种新的基于学习的逆合成设计算法Retro*来学习以前的设计经验,该算法框架可以归纳出保证最优解的搜索算法。另外,作者提出了一种构建合成路线数据集的方法,用于对多步合成设计方法进行定量分析。其设计算法是通用的,它也可以应用于其他机器学习问题,如定理证明和分层任务设计,实验结果表明该算法的性能大大优于现有方法。
https://www.zhuanzhi.ai/paper/84dcdb8686f27852f81a0a23d48ce2dd