本周我们收到投稿,由北大博士,现MIT Coley组博士后吴广启解读最近由MIT的Klavs F. Jensen与Timothy F. Jamison课题组共同在ACS Central Science上报道的自动化合成工作,文章题为Bayesian Optimization of Computer-Proposed Multistep Synthetic Routes on an Automated Robotic Flow Platform[1]。作者以小分子药物Sonidegib为例,在自动化合成平台上实现了对计算机所提出的多步合成路线的整体优化,验证了自动化技术开展计算机辅助的化合物合成的可行性。

内容: * 背景 * 方法 * 结果与讨论 * 结论

背景

近年来,机器学习辅助的药物发现展现出了巨大的应用潜力,虚拟筛选所发现的大量新颖的小分子结构有望为诸多疾病的治疗提供新的解决方案。但是目前许多由算法所设计的药物分子由于资源有限以及结构特殊等原因短时间内难以被合成,进而阻碍了对其效果的进一步验证。自动化技术早在上世纪就用于组合化学以及高通量药物发现等研究,随着计算机辅助的合成路线设计(Computer-aided synthesis planning,CASP)的不断成熟,人们开始认识到可以结合自动化实现结构更为复杂的分子的化学合成,利用其高效与可控性进一步加速药物发现。Jensen课题组曾于2019年报道了基于流动化学的自动化合成平台[2],在本文中作者利用这一平台对计算机提出的合成路线进行了验证与优化,展示了将自动化、机器学习以及机器人等技术的综合应用在加速合成与发现的应用潜力。

方法

图 1 (A)打分最高的逆合成路线分析,(B)最终所选取的合成路线,其中红色与绿色所标注的是需要进行优化的连续与离散变量 作者选取了小分子药物Sonidegib作为模型分子,利用开源的逆合成分析软件ASKCOS进行了逆合成分析(图1A),选取了打分最高的策略并结合之前的经验设计了反应路线(图1B),在该路线中有许多变量会影响反应的产率,比如反应温度,当量比,卤代烃种类以及碱的种类等,需要通过实验对其进行优化。他们优化了此前的自动化平台(图2),提升了其运行速度;该平台可以自动并行执行多步反应,同时配备有多种分析与分离模块,为多步合成路线的优化奠定了良好的基础。作者选用了开源的软件包Dragonfly进行贝叶斯优化,该软件包支持多种输入参数类型,并且能够进行多目标优化。

图 2执行合成的自动化平台 整个合成优化过程的示意图如图3所示。第一步反应为1与2之间的SAr反应,该反应可以通过在线LC/MS直接进行监测;随后硝基的还原反应在填充有Pd催化剂的流动床反应器中进行,由于第一步反应的产物可能会对催化剂的效果产生影响,他们首先对固相催化剂的形态进行了筛选优化,并最终选取了3D打印的静态混合器作为流动床的填料。反应结束后,通过膜分离器将气体与液体进行分离,所得产物4直接用于与5的缩合反应,最后的总产率通过LC/MS进行监测分析。LC/MS以及FTIR等在线分析模块的引入对分析反应变量对产率的影响起到了至关重要的作用。

图 3 反应(A)仪器与(B)优化流程示意图。

结果与讨论

由于催化剂稳定性等因素,整个合成流程分成两步进行优化:在进行SAr反应后,将产物3进行离线分离,再进行后续两步反应的优化。 图 4 对SAr反应的优化。(A)仪器示意图,(B)需要优化的参数,(C、D)优化结果。 1与2的SAr反应有5个参数需要进行优化(图4B),分别是:反应时间、温度、化合物1的当量、碱的当量以及卤代烃的种类,作者选取了3个指标作为优化的目标(objective),包括产率、产能以及成本。在10个小时内,该平台闭环自动执行了30次实验,首先探究了预设的9个实验以对优化空间进行初步的了解,随后算法根据已有信息提出能够同时优化3个指标的实验方案。从结果可以看出,虽然在初始阶段反应产率较高,但是产能与成本并不理想,随着优化的进行有部分实验表现出了高产能低成本的理想特点(#27)。具体分析显示氟代物在反应中表现出了更高的鲁棒性,而氯代物与溴代物在低温的情况下反应效果的波动较大。

图 5 对后续反应的优化。(A)仪器示意图,(B)需要优化的参数,(C-E)优化结果 随后,作者对后续两步反应进行了优化(图5),包括了硝基还原、液气分离以及酰胺缩合。他们发现如果在最后一步的缩合反应中如果同时加入HATU与4,那么会有明显的副产物产生,为了解决这一问题,需要首先将HATU与羧酸5混合进行活化。为此,他们充分利用了该流动平台灵活性的特点,在还原硝基的同时活化5,并运用FT-IR对反应进行监测,在该流程中对5个变量(活化试剂的种类,活化时间,3的当量,缩合温度以及时间)进行优化,并以产率与产能作为优化目标。在13小时内,该平台总共进行了15次实验,算法最终选择了HATU作为缩合试剂,成功地将产能由最初的1.6 g/h提升至7.4g/h。

结论

总结来说,本文作者在自动化合成平台中实现了计算机所设计的合成路线,充分展示了流动合成平台对多步反应进行协同优化的能力,为化合物的自动化合成奠定了坚实的基础。值得注意的是,本文的工作仍然有许多提升的空间,比如文中仍然需要将第一步的产物进行分离才能进行后续的优化,同时反应的通量也有待提升,这些问题也代表着自动化合成在今后发展的方向与机遇。


Therapeutics Data Commons(TDC)致力于推动机器学习和生命医学领域的融合,让更多的机器学习/生物医药研究者可以无门槛参与到实用且有价值的数据驱动模型开发中来。我们核心团队决定不定期suí biàn gē在本公众号分享领域相关的文章的解读,希望能对读者有所帮助,有任何反馈,或者有希望解读的文章与专题,欢迎在公众号后台留言!我们也欢迎相关专题的投稿,有兴趣的请关注!


作者:吴广启 审稿:黄柯鑫 符天凡 编辑:高文昊

参考资料

[1] Nambiar, A. M., Breen, C. P., Hart, T., Kulesza, T., Jamison, T. F., & Jensen, K. F. (2022). Bayesian Optimization of Computer-Proposed Multistep Synthetic Routes on an Automated Robotic Flow Platform. ACS Central Science.[2] Coley, C. W., Thomas III, D. A., Lummiss, J. A., Jaworski, J. N., Breen, C. P., Schultz, V., ... & Jensen, K. F. (2019). A robotic platform for flow synthesis of organic compounds informed by AI planning. Science, 365(6453), eaax1566.

成为VIP会员查看完整内容
8

相关内容

医学领域的人工智能是使用机器学习模型搜索医疗数据,发现洞察,从而帮助改善健康状况和患者体验。 得益于近年来计算机科学和信息技术的发展,人工智能 (AI) 正迅速成为现代医学中不可或缺的一部分。 由人工智能支持的人工智能算法和其他应用程序正在为临床和研究领域的医学专业人员提供支持。
基于组合贝叶斯优化的自动化抗体设计
专知会员服务
13+阅读 · 2022年9月9日
逆合成预测的学习图模型
专知会员服务
5+阅读 · 2022年7月29日
PMO:比较25种分子优化方法的样本效率
专知会员服务
5+阅读 · 2022年7月18日
AI算法 | 基于原子环境的神经机器翻译用于逆合成预测
专知会员服务
3+阅读 · 2022年6月30日
综述分享 | 计算机辅助化合物逆合成预测
专知会员服务
10+阅读 · 2022年5月6日
专知会员服务
17+阅读 · 2020年9月6日
【ICML2020】通过神经引导的A*搜索学习逆合成设计
专知会员服务
16+阅读 · 2020年8月18日
计算机顶会论文投稿指南
极市平台
0+阅读 · 2021年12月29日
自动化所人工智能辅助诊断方法进入肿瘤诊疗指南
中国科学院自动化研究所
1+阅读 · 2021年9月3日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Arxiv
0+阅读 · 2022年10月6日
Arxiv
1+阅读 · 2022年10月3日
Arxiv
20+阅读 · 2019年11月24日
VIP会员
相关VIP内容
基于组合贝叶斯优化的自动化抗体设计
专知会员服务
13+阅读 · 2022年9月9日
逆合成预测的学习图模型
专知会员服务
5+阅读 · 2022年7月29日
PMO:比较25种分子优化方法的样本效率
专知会员服务
5+阅读 · 2022年7月18日
AI算法 | 基于原子环境的神经机器翻译用于逆合成预测
专知会员服务
3+阅读 · 2022年6月30日
综述分享 | 计算机辅助化合物逆合成预测
专知会员服务
10+阅读 · 2022年5月6日
专知会员服务
17+阅读 · 2020年9月6日
【ICML2020】通过神经引导的A*搜索学习逆合成设计
专知会员服务
16+阅读 · 2020年8月18日
相关资讯
相关基金
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
微信扫码咨询专知VIP会员