该论文回答两个问题:使用哪些数据和方法来理解化合物的MOA如何探索新数据的安全性如蛋白质水解靶向嵌合体(PROTACs)等模式。

Figure:MoA研究中使用不同类型的数据/信息可以定义不同类型的MoA(Trapotsi et al[1])

分析的生物学层次包括Direct drug-target、Gene level、Proteome level、Metabolome level、Phosphoproteome level、Phenotype level、Biological pathway level,如下表。论文对这些点都进行了具体讨论,包括机器学习在这一块的应用。

特别的,作者对新数据新作用机制也进行了分析,包括PROTACs的数据、安全性与MoA。

第二章:“通过考虑实验不确定性,使用概率随机森林(Probabilistic Random Forest)改善生物活性的二分类预测”。

第三章:“通过比较结构化学和细胞形态信息,使用多任务学习对生物活性预测“。利用细胞涂饰分析中的细胞形态信息(以CellProfiler特征的形式)和化学结构信息(以Extend connectivity Fingerprints的形式)进行比较。比较表明,有一些靶点可以通过细胞形态学信息可以更好地预测,如b-catenin,还有一些靶点可以通过化学结构信息更好地预测,如属于G-蛋白偶联受体1家族的蛋白质。

第四章:“在PROTACs数据集上使用细胞绘制分析预测线粒体毒性”,探讨了使用细胞绘制分析成功分析新数据模式(PROTACs)的方法,并评估了该分析方法是否可用于理解这些新化合物的安全性。在PROTACs数据集中,细胞形态特征(以CellProfiler特征的形式)成功预测了线粒体毒性。这项工作产生了第一个使用基于细胞绘制的特征预测PROTACs线粒体毒性的ML模型,并扩展了我们对PROTACs安全性预测的知识。

图:分析与总结。PROTACs和非PROTACs化合物通过细胞涂饰分析进行分析,然后进行数据归一化和下游分析。

成为VIP会员查看完整内容
14

相关内容

浙大最新《深度学习新药设计》综述论文
专知会员服务
44+阅读 · 2022年7月13日
专知会员服务
252+阅读 · 2021年10月8日
【干货书】数据挖掘药物发现,347页pdf
专知会员服务
133+阅读 · 2021年9月20日
靶向蛋白质降解的蛋白-蛋白相互作用预测
GenomicAI
4+阅读 · 2022年3月5日
Nucleic Acids | PROTAC-DB:PROTAC在线数据库
GenomicAI
0+阅读 · 2022年1月25日
Nat. Mach. Intell. | 分子表征的几何深度学习
专知
0+阅读 · 2021年12月26日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年7月15日
Arxiv
101+阅读 · 2020年3月4日
A Comprehensive Survey on Graph Neural Networks
Arxiv
13+阅读 · 2019年3月10日
A Survey on Deep Learning for Named Entity Recognition
Arxiv
73+阅读 · 2018年12月22日
Arxiv
11+阅读 · 2018年5月21日
VIP会员
相关VIP内容
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员