**数字化、大规模和高通量技术的出现产生了前所未有的数据,为今天的药物发现利用机器学习(ML)提供了一个极好的机会。**通过识别ML中的相关问题和合适配置,我们可以将这些不断增加的数据转化为发现更好的药物,并缩短药物开发周期,从而为以前无法治愈的疾病提供更便宜的药物和治疗选择。**本文提出了四种机器学习方法来解决当今药物研发流程中的不同挑战,以快速为临床试验提供更可行的药物候选,并最终改善所有人的生活质量。**本文提出一种批均衡方法,利用风格迁移生成对抗网络来调节细胞图像中常见的批效果,以便可以更有效地将它们用于高通量体外筛选。描述了一个能量启发的SE(3)等变模型,以高效和准确地估计分子构象的分布,从而可以提高基于硅结构的筛选的准确性。提出了一个用于目标感知分子生成的3D全原子扩散框架,可以探索现有筛选库之外的新化学,并提出新的药物候选以结合挑战性疾病的靶点。描述了一种反应预测算法,将基于规则的系统(整数线性规划)和数据驱动的方法(图神经网络)结合在一起,可以从所描述的筛选管道或生成模型中有效地合成候选药物。最后,我们使用图神经网络对气味分子(而不是药物)进行建模,并找到许多物种共享的通用气味空间。我们假设,新陈代谢的生物学驱动了这种趋同进化,我们对这些与不同代谢过程相关的挥发性有机化合物的建模能力,可能对我们如何理解动物嗅觉和研究人类健康有很大的影响。综上所述,本文展示了机器学习在大数据时代改变药物发现和人类健康的潜力。