药物发现中的深度学习

2022 年 11 月 14 日 专知
来自巴基斯坦的研究团队在期刊Journal of Biomolecular Structure and Dynamics上发表综述论文Deep learning in drug discovery: a futuristic modality to materialize the large datasets for cheminformatics。论文全面总结了人工智能方法在药物发现中的应用,并针对Covid-19的药物发现过程进行了详细的分析。

1 摘要

人工智能的发展模仿了人脑的工作原理来理解现代问题。传统的方法,如高通量筛选(high-throughput screening, HTS)和组合化学,由于只能处理较小的数据集,这对制药业来说是漫长而昂贵的。深度学习是一种精巧的人工智能方法,它可以对特定系统进行全面的理解。

目前,制药业正在采用深度学习技术来加强研究和开发过程。多向算法在QSAR分析、药物从头设计、ADME评估、物理化学分析、临床前开发,以及临床试验数据精确性方面发挥着至关重要的作用。在这项研究中,作者调查了多种算法的性能,包括深度神经网络(deep neural networks, DNN)、卷积神经网络(convolutional neural networks, CNN)和多任务学习(multi-task learning, MTL)。研究表明,卷积神经网络、循环神经网络和深度信念网络(deep belief network)对于药效学属性的分子描述是兼容的、准确的和有效的。

在Covid-19中,现有的药理化合物也已经使用深度学习模型进行了重新设计。在没有Covid-19疫苗的情况下,药物瑞德西韦(remdesivir)和药物奥司他韦(oseltamivir)已被广泛用于治疗严重的SARS-CoV-2感染。总之,这些结果表明了在药物发现过程中采用深度学习策略的潜在好处。

2 介绍

20世纪末,化学信息学被引入药物研发过程。湿实验方法开发药物成功率低、耗时长、花费高,药物研发过程转向了新的范式。通常,生成精确的先导化合物,且具有良好的吸收、分布、代谢、排泄、毒性(ADMET)性质和物理化学性质是该行业面临的最大挑战。计算工具有提高药物开发过程的分析准确性的潜力。计算机辅助基于结构的药物设计(structure-based drug design, SBDD)和基于配体的药物设计(ligand-based drug design, LBDD)方法在计算药物设计过程中占有一席之地。
多年以来,机器学习方法被用于不同的领域,但存在冗余和过拟合等问题。这些问题阻碍了机器学习模型的应用。2006年,Hinton等人设计了一个深度信念网络(deep belief network, DBN)。DBN由一组非线性隐藏层组成。它有助于克服冗余和过拟合问题。在深度学习中,Frank Rosenblatt于1957年首次创建了神经网络模式,并将其称为深度神经网络(deep neural network, DNN)。神经网络如今可以处理以前不可能的图像识别问题。监督学习、无监督学习和半监督学习是使用基于梯度下降的反向传播策略来克服冗余和过拟合问题的常用工具。

2.1 医疗中的深度学习


人工智能技术可以应用于医疗领域的很多方面(如图1所示),并被认为有助于医生的临床诊断。在心脏病学、糖尿病、视网膜病变、抗生素耐药基因和阿尔茨海默病研究中,各种深度学习模型被开发用于预测疾病状况和药物的疗效。已有研究模型可以精确地将心肌病分为限制性和收缩性病理。除了心血管、代谢和其他疾病,人工智能还可以改善肿瘤诊断。深度学习模型有效地指示了新冠肺炎模式,并对疾病进行了分类。

图1 深度学习在药物发现和生物标志物开发中的潜力。每个药物发现时期的深度学习算法应用,包括临床评估、生物过程结合、化学修饰和开发、化合物的新合成。

2.2 药物设计中的深度学习


深度学习是机器学习的一个子类,更广泛地说是人工智能的一个子类。在机器学习中,新特征的处理和生成通常基于小数据集,通过支持向量机(SVM)、随机森林(RF)、k最近邻(KNN)、线性回归、逻辑回归、朴素贝叶斯、决策树等算法进行处理,这些算法仅在二分类中进行。人工神经网络(artificial neural network, ANN)是人工智能的最简单形式,如图2所示。ANN由2-3层组成,包括单个输入层和隐藏层,然后是作为神经元的单个输出层。深度学习将大脑功能模拟为ANN。它包含一组多个隐藏层以提取所需信息。深度学习是一个自动化过程,使用图形处理单元(GPU)和张量处理单元(TPU)加速来确保计算任务的自动化。为了执行专门的任务,深度学习中的开源编程语言包括torch、Deeplearning4j、CNTK、python和R。深度学习可分为监督学习、无监督学习和强化学习。
卷积神经网络(CNN)已经应用于自然语言处理(NLP)、图文摘要、图像分类和语音识别。CNN由三个基本层组成,称为卷积层、池化层和全连接层。CNN通过稀疏连接和共享权重融入卷积层提取特征。池化层完善了鲁棒性特征,并通过全连接层生成输出数据。另一方面,DNN架构是一种前馈算法,可以从输入数据中提取复杂特征,并将其映射到输出模式中。DNN有多个隐藏层网络,可以自动处理输入数据。深度生成算法(deep generative algorithm, DGA)模型是一种基于无监督学习结构的模型,可以从高维输入数据源中提取未标记的数据。深度信念网络(DBN)和受限玻尔兹曼机器(RBM)是类似模型的例子。循环神经网络(RNN)不仅基于输入数据,还基于先前事件的输入序列。RNN通过将单个元素保存在在隐藏层单元中并连接相邻的隐藏节点来为序列数据处理提供预测。RNN使用反向传播训练以最小化模型中的误差。长短期记忆神经网络(LSTM)是RNN另一种变体。这都是药物设计和开发过程中最常见的算法。
图2 (A)浅层人工神经网络(浅路径)和(B)深层神经网络之间的区别。 

专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“DDL12” 就可以获取【药物发现中的深度学习》专知下载链接

                       
专知,专业可信的人工智能知识分发 ,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取100000+AI(AI与军事、医药、公安等)主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取100000+AI主题知识资料

登录查看更多
3

相关内容

【UIUC博士论文】机器学习药物发现,109页pdf
专知会员服务
35+阅读 · 2023年1月12日
【牛津大学博士论文】深度学习临床前药物发现
专知会员服务
50+阅读 · 2022年9月30日
浙大最新《深度学习新药设计》综述论文
专知会员服务
44+阅读 · 2022年7月13日
【MIT博士论文】分子图表示学习与生成的药物发现
专知会员服务
47+阅读 · 2022年6月28日
综述分享 | 深度学习在分子生成和分子性质预测中的应用
深度学习在分子生成和分子性质预测中的应用
专知会员服务
34+阅读 · 2022年6月19日
深度学习药物发现综述
专知会员服务
57+阅读 · 2022年6月2日
人工智能到深度学习:药物发现的机器智能方法
专知会员服务
36+阅读 · 2022年5月6日
专知会员服务
85+阅读 · 2021年10月11日
深度学习药物发现综述
专知
5+阅读 · 2022年6月2日
GPU 计算和深度学习在药物发现中的转型作用
机器之心
2+阅读 · 2022年5月2日
使用深度学习,通过一个片段修饰进行分子优化
深度学习与医学图像分析
人工智能前沿讲习班
40+阅读 · 2019年6月8日
国家自然科学基金
7+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
10+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
4+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2023年1月13日
Arxiv
31+阅读 · 2023年1月8日
Arxiv
12+阅读 · 2021年7月26日
Arxiv
11+阅读 · 2021年3月25日
A Survey on Edge Intelligence
Arxiv
51+阅读 · 2020年3月26日
VIP会员
相关VIP内容
【UIUC博士论文】机器学习药物发现,109页pdf
专知会员服务
35+阅读 · 2023年1月12日
【牛津大学博士论文】深度学习临床前药物发现
专知会员服务
50+阅读 · 2022年9月30日
浙大最新《深度学习新药设计》综述论文
专知会员服务
44+阅读 · 2022年7月13日
【MIT博士论文】分子图表示学习与生成的药物发现
专知会员服务
47+阅读 · 2022年6月28日
综述分享 | 深度学习在分子生成和分子性质预测中的应用
深度学习在分子生成和分子性质预测中的应用
专知会员服务
34+阅读 · 2022年6月19日
深度学习药物发现综述
专知会员服务
57+阅读 · 2022年6月2日
人工智能到深度学习:药物发现的机器智能方法
专知会员服务
36+阅读 · 2022年5月6日
专知会员服务
85+阅读 · 2021年10月11日
相关资讯
深度学习药物发现综述
专知
5+阅读 · 2022年6月2日
GPU 计算和深度学习在药物发现中的转型作用
机器之心
2+阅读 · 2022年5月2日
使用深度学习,通过一个片段修饰进行分子优化
深度学习与医学图像分析
人工智能前沿讲习班
40+阅读 · 2019年6月8日
相关基金
国家自然科学基金
7+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
10+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
4+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员