翻译撰文:王雪洁 编辑:肖冉 介绍
今天介绍一篇由Andrés Sánchez-Ruiz和Gonzalo Colmenarejo于2022年8月在线发表在化学信息学老牌期刊Journal of Chemical Information and Modeling(IF: 6.162)上的文章。文章使用化学信息学统计模型 [相似性集成方法 (SEA),结合最大 Tanimoto 系数 (TC),标记为”SEA + TC”]预测食品分子与人类靶点的相互作用,并根据靶点类别和化合物类别、有利与不利的组合、丰富的骨架以及与已发表的数据进行比较来分析结果。
摘要
本文使用 FooDB 作为化合物集和 ChEMBL 作为相互作用的来源,检索和分析已发表的食物化合物与人类蛋白质的完整相互作用集。根据 19 个靶点类别和 19 个化合物类别对数据进行了分析,显示了化合物的一小部分靶点分配 (1.6%),并揭示了这些分子在化学生物学空间中的多个空白。通过使用成熟的化学信息学方法 [相似性集成方法 (SEA) 结合最接近的生物活性物质的最大 Tanimoto 系数,“SEA + TC”],实现了显着增强的靶点分配 (64.2%),填补了许多空白快速集中测试的靶点假设。
结果
食品化合物已发表的生物活性分析
在ChEMBL(一个生物活性数据库)中,对FooDB 中报告的食品化合物的所有生物活性进行了搜索。从这里,共鉴定了 4472 种与食物化合物的独特相互作用,来自 1138 种化合物和 759 种靶蛋白。靶标数量最多的化合物是槲皮素,有 84 个靶标,其次是鞣花酸,有 61 个。它们都主要与多种激酶、“其他”组中的靶标和裂解酶相互作用。
图 1. FooDB(蓝色条)、DrugBank(绿色条)和它们的交叉点(橙色条)中公布的化合物相互作用的靶点类别之间的靶点分布。
图 2. FooDB(蓝色条)、DrugBank(绿色条)及其交叉点(橙色条)中公布的化合物相互作用的靶点类别中化合物的分布
图3. 仅与 FooDB 化合物相互作用的靶点类别中靶点(红色条)和化合物(蓝色条)的分布
从这个分析中,可以得出结论,食物化合物的靶点空间大多未被充分研究。以 FooDB 为代表的绝大多数食品化合物 (98.4%) 在 ChEMBL 中缺乏靶点生物活性信息,该信息从化学生物学和药物化学领域的大量期刊中收集。因此,为了更好地表征这些分子的靶点空间,使用靶点预测方法为更大的 FooDB 部分提供一组假定的相互作用。
食品化合物的预测生物活性分析
作者将SEA算法与最大TC相似度相结合,为所有这些化合物提供靶点预测。这种方法最近证明比单独的方法具有更高的灵敏度和特异性。
通过化学型分析食品化合物的靶点空间
从人类代谢组学数据库(HMDB)中,FooDB是其中的一个子集,得出了19类食物化合物的分类,可应用于绝大多数FooDB化合物。图4显示了这些类的分布,按成员大小的减少排序。
图4.FooDB化合物在化合物类中的分布
如果将SEA+TC预测的相互作用添加到这些已发布的相互作用中,将获得图5A中显示的热图分布,其中多个先前空的或几乎没有填充的细胞现在出现在许多预测相互作用中。
图5. 已发布的 FooDB 分布以及复合类和靶点类之间的预测(总)相互作用。从 ChEMBL 中检索的已发布相互作用,以及使用 SEA + TC 方法获得的预测相互作用,如方法中所述。(A) 计数分布;(B) 调整残差(见方法)。后者的色带使用了对称的对数刻度,中心线性范围为 -5 到 +5。
SEA + TC 预测的实验验证
对于 75 种化合物的子集,TC 值 <1,这对应于基于不同化合物的预测。因此,图 9显示了这 75 个预测的分布直方图,其中可以观察到已确认的预测基于低至 0.4 的 TC 值(本文的 SEA + TC 方法设置允许的最低 TC)。
图6. 基于不同化合物 (TC < 1) 的 SEA + TC 预测相互作用的 TC 值分布柱状图,已在 ChEMBL 29 中确认。
通过分子对接验证 SEA + TC 预测
将 FDB002748(天竺葵素 3-半乳糖苷)与钠/葡萄糖协同转运蛋白 2 SLC5A2 对接。此外,它显示出与结合袋的良好配合,与袋中的氨基酸形成多个氢键。在这里,最低能量的结合位姿再次对结合袋具有良好的适应性,并形成了多个氢键。
讨论
作者公开提供完整的已发表的食品化合物相互作用,如 ChEMBL 中所示化学生物学数据库和使用 FooDB作为食品化合物集合。此外,该集合通过成熟的化学信息学方法增加了一组预测的相互作用,即(SEA + TC) 。这两组的结合可以通过作者在下文中描述的各种方式以及在药物发现领域的推定应用,加快对食品化合物化学生物学的全面阐明。
作者还确定了一组 131 个不与药物相互作用的食物化合物靶点。另一方面,88550 个预测相互作用的大集合提供了一个大大增强的假设集合来进行实验测试,这些假设与已发布的相互作用一起跨越了 FooDB 的 62.4% 和总共 982 个靶点。用于靶点预测的 SEA 方法因其改进的化学空间外推能力而特别强大通过使用集合相似性和统计测试而不是简单的复合相似性。
此外,预测将食品化合物特有的靶点数量增加到 301 个,并将与它们相互作用的相应食品化合物增加到 1857 个,从而大大扩展了上述可能性。有望通过提供这些分析和数据集作为资源来加速食品化合物化学生物学空间的完整表征,这些分析和数据集确定了基于稳健靶点假设的快速聚焦筛选的许多机会。
参考文献
Andrés Sánchez-Ruiz and Gonzalo Colmenarejo. Systematic Analysis and Prediction of the Target Space of Bioactive Food Compounds: Filling the Chemobiological Gaps.Journal of Chemical Information and Modeling. 2022 62 (16), 3734-3751. DOI: 10.1021/acs.jcim.2c00888
长按关注我们
微信号|FoodAI 合作/投稿|jiedong@csu.edu.cn