人工智能和机器学习在复杂科学问题中的应用正日益广泛,涵盖多个研究领域。科学推理的一个核心挑战在于推导出参数约束,这些约束既要有效 —— 即在有限样本下,在给定置信水平下包含真实参数,无论其(未知的)取值为何;又要精确 —— 即在特定数据生成过程中尽可能紧致。然而,标准的机器学习方法往往无法确保上述性质,从而限制了后续科学结论的可靠性。 在本论文中,我们提出了若干新颖方法,利用回归、分类和生成模型构建具有强统计保障的置信集。这些方法能够实现以下目标:(1)在整个参数空间中及有限样本下均具有效性;(2)对先验概率分布的变化具有鲁棒性;(3)当先验知识与目标分布一致时,具有尽可能高的精确度;(4)在计算上高效。通过将现代机器学习与经典统计工具相结合,我们为将人工智能融入科学推理与发现流程提供了一条有理论支撑的路径,从而推动天文学、高能物理学、生物学等领域的研究进展。