为药物开发人员而不是计算机科学家写的,这一专论采用了一种系统的方法来挖掘科学数据源,涵盖了从化合物筛选到先导化合物选择和个性化药物的合理药物发现的所有关键步骤。第一部分明确地分为四个部分,讨论了不同的可用的数据来源,包括商业和非商业的,而下一节着眼于数据挖掘在药物发现中的作用和价值。第三部分比较了多药理学最常见的应用和策略,其中数据挖掘可以大大提高研究工作。书的最后一部分是致力于复合测试的系统生物学方法。
在整本书中,工业和学术药物发现策略被处理,贡献者来自两个领域,使一个知情的决定,何时和哪些数据挖掘工具使用自己的药物发现项目。
一般来说,从数据库中提取信息称为数据挖掘。数据库是一种数据集合,其组织方式允许方便地访问、管理和更新其内容。数据挖掘包括数字和统计技术,可以应用于许多领域的数据,包括药物发现。数据挖掘的功能定义是使用数值分析、可视化或统计技术来识别数据集中重要的数值关系,从而更好地理解数据并预测未来的结果。通过数据挖掘,我们可以得到一个模型,该模型将一组分子描述符与诸如功效或ADMET特性等生物关键属性联系起来。所得模型可用于预测新化合物的关键属性值,为后续筛选确定优先级,并深入了解化合物的构效关系。数据挖掘模型范围从简单的、由线性技术导出的参数方程到复杂的、由非线性技术导出的非线性模型。文献[1-7]提供了更详细的信息。
这本书分为四个部分。第一部分涉及药物发现中使用的不同数据来源,例如,蛋白质结构数据库和主要的小分子生物活性数据库。第二部分重点介绍数据分析和数据丰富的不同方法。在这里,我们提出了对HTS数据挖掘和识别不同目标命中的工业见解。另一章展示了强大的数据可视化工具在简化这些数据方面的优势,从而促进了它们的解释。第三部分包括多种药理学的一些应用。例如,在化学基因组学时代,数据挖掘可以为配体分析和目标捕捉带来积极的结果。最后,在第四部分,系统生物学方法被考虑。例如,读者被介绍到综合和模块化分析方法,以挖掘大分子和表型数据。结果表明,该方法能够降低高维数据的复杂性,并为整合不同类型的组学数据提供了一种方法。在另一章中,建立了一套新的方法,定量地衡量化学品对生物系统的生物影响。