腾讯AI Lab「云深」与成都先导合作「AI+药物」,发布骨架跃迁新算法

2021 年 9 月 8 日 腾讯AI实验室

感谢阅读腾讯AI Lab微信号第131篇文章。本文将介绍腾讯AI Lab「云深」联合成都先导发布骨架跃迁新算法,实验合成7个有效化合物。


腾讯AI Lab「云深」平台在药物发现 AI 算法研究领域取得最新进展。8月下旬,腾讯 AI Lab 与成都先导药物开发股份有限公司(以下简称“成都先导”)合作,共同设计完成了业内首个经实验验证的骨架跃迁分子生成算法(GraphGMVAE),证明模型能高效并准确地寻找新的候选分子,为药物化学专家设计分子时提供更多启发。


GraphGMVAE 算法以 JAK1 抑制剂 Upadacitinib 为例(通常用于治疗中重度类风湿关节炎的药物),证明在保持分子侧链不变的情况下,能有效生成具有相似生物活性但骨架不同的分子。同时,研究还提出了一套对分子进行优先级排序的流程,可以缩小验证范围,从而提高效率。研究结果发表于最新一期美国化学学会杂志ACS Omega上。点击文末「原文链接」可查看论文全文。


图1. 该项成果发表于行业知名期刊ACS Omega上


骨架跃迁的意义


骨架跃迁是一种发现结构新颖化合物的策略。“骨架”概念广泛应用于药物化学和药物设计中,分析和比较活性化合物与衍生物的核心结构。骨架跃迁顾名思义,是以已知的活性化合物为起点,通过改变分子的核心结构,获得新颖的化学结构。就像用乐高积木建房子,改造建筑部件或结构,造出更多样化的建筑。



找到结构新颖的化合物对新药研发具有重要意义,也是骨架跃迁的主要目的:(1) 在已有的化合物分子结构上,产生新颖的化合物系列,增加药物研发成功率;(2)替换复杂天然产物的局部结构,产生更具选择性、更优活性的新颖分子;(3)通过改变分子的骨架,改善分子的药物代谢动力学性质


传统骨架跃迁算法需要基于现有骨架库设计新分子。受限于骨架库大小,新分子在活性和多样性方面表现不足,而不断更新骨架库的过程也耗时耗力。近年来,AI技术在分子生成领域取得进展,在探索更多更广的化学分子与骨架空间方面展示了更多潜力。


现有 AI 算法仍面临很多挑战,比如生成骨架缺少多样性、对骨架变化控制不好等。GraphGMVAE 算法在骨架提取方面结合了人工规则,更接近人类化学家的角色,通过学习化学知识更有效地生成新骨架。此外,算法采用高斯混合分布来区分骨架和侧链部分,满足了骨架变化而侧链保持不变的要求。应用在新药研发的先导化合物优化阶段,GraphGMVAE 算法将有望提升小分子设计效率,从而减少人力以及时间成本。


研究方法解读


图2. 利用 GraphGMVAE 进行骨架跃迁


骨架提取和聚类


构建 GraphGMVAE 之前需要提取分子的骨架。如图3所示,算法应用了ScaffoldGraph的算法提取了一个骨架集合,并结合人工规则删除了结构过于简单和常见的骨架,以及分子量过大的复杂骨架。


图3. BM 骨架与 ScaffoldGraph 骨架


GraphGMVAE 模型


模型的总体结构如下图4所示,使用了双通道信息传递神经网络来编码分子结构及其特性。将骨架嵌入到高斯混合分布的隐空间,保持同簇的骨架属于相同的高斯质心。最后,一个基于门控循环单元(GRU)的解码器用来将嵌入的编码恢复到 SMILES。


图4. GraphGMVAE 模型主要组成


假设骨架的隐空间符合高斯混合分布,侧链使用自编码器,这样就可以在不同的高斯核之间进行骨架的跃迁,但侧链保持不变。使用不同的跃迁率进行采样,可以从参考化合物所在参考簇、附近簇,以及较远的簇生成三组新分子,如下图5所示。


图5. 通过高斯混合分布从参考簇(绿色圆圈)、附近簇(红色圆圈)和远处簇(蓝色圆圈)采样生成的分子。分子下的数字代表与参考化合物的相似性。


对 GraphGMVAE 生成的分子进行优先级排序


为了缩小评估范围,我们提出了优先级排序流程(下图6)。通过GraphGMVAE生成的数以万计的的生成分子首先通过药物相似性和基于规则的 MedChem 过滤器进行过滤,以去除潜在的有毒性分子或具有反应性的官能团或较差的药物特性的分子。然后,进行药效团筛选、分子对接、3DCNN 活性预测。在上述流程之后,选择了 25 个具有高对接分数和 3DCNN 亲和力分数的分子,进行新颖性检查,根据合成可行性选择了其中的7个分子进行化学合成。


图6. 分子优先级的排序流程


JAK1 靶点的新型抑制剂


研究使用 Upadacitinib 作为参考化合物来进行骨架跃迁,以期找到新颖的 JAK1 靶点的新型抑制剂。具体来看,GraphGMVAE算法一共生成了3万个分子,其中的 97.9%的分子具有不同于已知 JAK 抑制剂的新型骨架。最后选择了其中7个分子进行合成和实验验证,具体的结果和生物活性如下图7。值得注意的是,其中 Ten01 和 Ten02 分子的活性甚至优于参考分子。


图7. 参考化合物与七个新合成化合物的结构和生物抑制活性


总结


GraphGMVAE 算法以 Upadacitinib 为例,展示了基于深度学习的分子生成算法在传统药化设计工具骨架跃迁中的有效性。未来,该算法将应用于腾讯 AI Lab“云深”平台助力新药研发,结合平台 ADMET 预测工具优化先导化合物,使新生成的分子既保持生物活性,还能满足特定的药代动力学性质。同时 GraphGMVAE 还将尝试用于复杂天然产物的结构改造,寻找化学上更易合成、生物活性和性质更优的苗头化合物。



团队简介


腾讯 AI Lab 


腾讯 AI Lab 是腾讯企业级人工智能实验室,于2017年开始“AI+医疗”探索,不断拓展和深化研究与应用,涵盖影像筛查、病理诊断、药物研发多个领域。


团队已有多篇论文入选 MICCAI、RSNA,CVPR,AAAI等顶级学术会议,并深度参与及主导多项应用落地,包括与合作伙伴合作研发中国首款获批进入临床应用的智能显微镜,发布AI驱动的药物研发平台「云深」,与钟南山团队联合发布新冠危重症预测模型等。在产业方面,腾讯与安必平、迈瑞等厂家进行了深入合作,推进AI在显微领域等广泛应用。



成都先导药物开发股份有限公司


一家从事新药研发的生物技术公司,总部位于中国成都,在英国剑桥、美国休斯顿设有子公司,并于2020年4月在上海证券交易所科创板挂牌上市(股票名称:成都先导,股票代码:688222.SH)。


成都先导并购了坐落于英国剑桥的Vernalis 公司,为小分子新药发现与优化建立了一个国际领先的,以DNA编码化合物库的设计、合成和筛选(DEL),以及基于分子片段和三维结构信息的药物设计(FBDD/SBDD)为核心的技术平台。目前,公司基于数千种不同的骨架结构,已经完成超10,000亿种结构全新、具有多样性和类药性DNA编码化合物的合成,并且已有多个案例证实了其针对已知生物靶点和新兴生物靶点筛选苗头化合物的能力及有效性。


参考文献

1. Yu, Y. et al. A Novel Scalarized Scaffold Hopping Algorithm with Graph-Based Variational Autoencoder for Discovery of JAK1 Inhibitors. ACS Omega (2021) doi:10.1021/acsomega.1c03613.


* 欢迎转载,请注明来自腾讯AI Lab微信(tencent_ailab)



登录查看更多
0

相关内容

腾讯AI Lab(Tencent AI Lab),即腾讯人工智能实验室,实验室的愿景是打造腾讯全面AI竞争力,让人工智能未来无处不在(Make AI Everywhere)。
腾讯等发布《2022产业互联网安全十大趋势》报告,34页pdf
AI药物研发发展研究报告(附报告)
专知会员服务
84+阅读 · 2022年2月11日
【干货书】数据挖掘药物发现,347页pdf
专知会员服务
130+阅读 · 2021年9月20日
【腾讯IDC】数实共生:未来经济白皮书2021,81页pdf
专知会员服务
73+阅读 · 2021年1月24日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2010年12月31日
国家自然科学基金
4+阅读 · 2009年12月31日
Tikhonov Regularization of Circle-Valued Signals
Arxiv
1+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
14+阅读 · 2020年9月1日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2010年12月31日
国家自然科学基金
4+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员