黑盒机器学习模型现在在高风险设置中经常被使用,如医学诊断,这要求不确定性量化以避免模型的重大失败。共形预测(又名共形推理)是一种用户友好的范式,用于为这类模型的预测创建统计上严谨的不确定性集/区间。关键是,这些集合在无分布的意义上是有效的:即使没有分布假设或模型假设,它们也具有明确的、非渐近的保证。人们可以使用任何预先训练的模型(如神经网络)进行共形预测,以产生保证以用户指定的概率(如90%)包含真实值的集合。它易于理解、易于使用,并且通用,自然适用于计算机视觉、自然语言处理、深度强化学习等领域中出现的问题。
这种动手介绍旨在为读者提供共形预测及相关无分布不确定性量化技术的工作理解,所有这些都包含在一个自包含的文档中。我们引导读者通过共形预测的实际理论和实例,并描述其在涉及结构化输出、分布转移、时间序列、异常值、放弃模型等复杂机器学习任务中的扩展。整个过程中,有许多解释性插图、实例和Python代码样本。每个代码样本都附有一个Jupyter笔记本,实现了对真实数据示例的方法;通过遵循代码脚注,可以轻松访问和运行这些笔记本。