编辑 | 萝卜皮 啤酒酿造、化妆品制造、医疗保健等领域离不开酶的参与,酶可以与特定底物结合,起到高效的催化作用。我们身体细胞本身也离不开酶的参与,酶也真真切切地影响着人们的日常生活。米氏常数 Km 描述了酶对特定底物的亲和力,是酶动力学和细胞生理学研究的核心参数。由于 Km 的测量通常很困难且耗时,因此即使在模型生物中也仅存在少数酶-底物组合的实验估计值。在这里,瑞典查尔姆斯理工大学(Chalmers University of Technology)的一组研究人员,选择了一种独特的方法,使用 AI 从底物和酶的结构中预测米氏常数。构建并训练了一个独立于生物体的模型,该模型使用机器学习和深度学习方法成功预测了天然酶-底物组合的 Km 值。预测基于底物的特定任务分子指纹,使用图神经网络生成,以及使用酶氨基酸序列的深度数值表示。研究人员为 47 种模式生物提供基因组规模的 Km 预测,可用于将代谢物浓度与细胞生理学大致联系起来,并有助于细胞代谢动力学模型的参数化。该研究以「Deep learning allows genome-scale prediction of Michaelis constants from structural features」为题,于 2021 年 10 月 19 日发布在《PLOS BIOLOGY》。米氏常数Km米氏常数 Km 定义为酶以其最大催化速率的一半运行时的底物浓度;因此,它描述了酶对特定底物的亲和力。Km 值的知识对于定量理解酶和代谢物之间的酶促和调节相互作用至关重要:它将代谢物的细胞内浓度与其消耗率联系起来,将代谢组与细胞生理学联系起来。 由于 Km 的实验测量既困难又耗时,因此即使在模式生物中也不存在许多酶的实验估计值。例如,在大肠埃希氏菌这种生物化学特征最好的生物体中,只有不到 30% 的天然底物存在体外 Km 测量值,并且在体外仅对大约 2,000 个酶促反应中的约 10% 的转化率进行了测量。简介Km 值以及酶周转数 kcat 是解释代谢物浓度的细胞代谢模型所必需的。大规模动力学建模中的当前标准方法是在优化过程中估计动力学参数。这些优化通常会尝试估计比作为输入的测量值更多的未知参数,因此,由此产生的 Km 和 kcat 值具有广泛的置信范围,并且与实验观察值几乎没有联系。因此,人工智能对这些值的预测,即使只有一个数量级,也将代表朝着更现实的细胞代谢模型迈出的重要一步,并可以大大增加此类模型提供的生物学理解。
模型概述。
与 Km 预测相关的一个问题是药物-靶标相互作用的预测,这是药物开发中的一项重要任务。已经开发了多种预测药物靶标结合亲和力(DTBA)的方法。这些方法中的大多数是基于相似性、基于结构或基于特征的。基于相似性的方法依赖于类似药物倾向于与类似目标相互作用的假设;这些方法使用已知的药物-靶标相互作用来学习基于药物-药物和靶标-靶标相似性度量的预测函数。用于 DTBA 预测的基于结构的模型利用有关目标蛋白质 3D 结构的信息。这两种策略都不能很容易地推广到基因组规模的、独立于生物体的预测,因为许多酶和底物与充分表征的分子只有遥远的相似性,并且 3D 结构仅适用于少数酶。