本书介绍了共形预测(Conformal Prediction)及其相关推断技术,这些技术建立在置换检验和可交换性基础之上,广泛应用于包括假设检验和为机器学习系统提供不确定性量化保证在内的多种任务。共形预测之所以受到广泛关注,是因为它能够无缝集成到复杂的机器学习工作流中,在不对数据生成分布形式作任何假设的情况下,解决了构建预测集的问题。由于现代机器学习算法通常难以直接分析,共形预测的主要吸引力在于它能够与这些方法配对,为有限样本提供正式的理论保证。

本书的目标是向读者介绍研究共形预测及其相关分布无关推断问题时所涉及的基本技术论证。这些证明策略(尤其是较新的部分)散见于不同的研究论文中,使得研究者难以确定应该参考哪些结果、哪些结论最为重要,以及这些证明具体是如何构造的。本书旨在弥合这一差距,通过整理我们认为文献中最重要的一些结果,并以统一的语言、配有插图的形式呈现这些证明,同时注重教学性。 需要注意的是,本书并不专注于如何在实践中应用共形预测。如果读者对更实用和面向应用的共形预测入门感兴趣,可以参考《共形预测:温和的介绍》(“Conformal Prediction: A Gentle Introduction”,Angelopoulos 等,2022年)。

本书主要面向从事统计理论和方法开发的读者,广义而言,包括对有限样本模型无关界感兴趣的经典统计学家,以及希望找到适用于不断变化的机器学习算法模块化理论的机器学习研究者。读者需要的背景知识一般相当于理论统计学研究生一年级课程的水平;尽管偶尔会涉及一些测度论,但本书的大部分内容并不依赖于它。 我们希望本书能够为读者提供对该领域理论基础的深入理解,从而帮助他们为共形预测及其他分布无关推断领域的持续理论发展做出贡献。

** 本书的范围**

在本章的介绍之后,第 I 部分的其余内容将从数学的角度介绍可交换性,并提供一份术语表,列出对本书后续统计结果有用的性质和事实。我们特别关注置换检验,因为共形预测可以被重新表述为置换检验的反转。这些工具对于本书后续的许多证明和直觉发展至关重要。

第 II 部分深入探讨共形预测框架。具体而言,我们讨论了完全共形预测(Full Conformal Prediction),这是对之前提到的分割共形预测方法的一个推广,揭示了其中的基本统计逻辑。随后,我们描述了比边际覆盖(Marginal Coverage)更强的性质,包括对各种方法的积极结果和一些表明在不做更多假设的情况下所面临限制的难解性结果。

第 III 部分聚焦于共形预测方法的广泛扩展。包括基于交叉验证的共形预测方法、允许超越独立同分布(i.i.d.)假设的加权共形预测方法、为流数据设计的在线共形方法,以及用于加速共形预测的计算捷径。我们还简要介绍了一些额外主题,例如能够处理更广泛风险定义的共形预测变体,以及与选择性推断、多重检验和模型集成的关联。这些主题是该领域近期工作的缩影,暗示了许多可以继续研究的方向。 最后,在第 IV 部分,我们从预测推断的重点中转移,研究分布无关推断在其他问题上的应用。这些问题包括回归函数估计、概率估计的校准,以及条件独立性的检验。

成为VIP会员查看完整内容
42

相关内容

书籍在狭义上的理解是带有文字和图像的纸张的集合。广义的书则是一切传播信息的媒体。
【2023新书】基于模型的机器学习,428页pdf
专知会员服务
156+阅读 · 2023年11月14日
【干货书】概率论与数理统计,259页pdf
专知会员服务
57+阅读 · 2022年12月3日
【2022新书】基于模糊随机变量的模糊统计推理,295页pdf
专知会员服务
62+阅读 · 2022年10月17日
【干货书】高维统计学,572页pdf
专知会员服务
144+阅读 · 2021年12月3日
【经典书】贝叶斯强化学习概述,147页pdf
专知会员服务
110+阅读 · 2021年11月21日
【新书】感知和行动的贝叶斯模型,348页pdf
专知会员服务
72+阅读 · 2021年11月18日
【新书稿】数据科学的谱方法:统计的视角,168页pdf
专知会员服务
58+阅读 · 2021年10月28日
专知会员服务
122+阅读 · 2021年6月23日
【经典书】概率机器人,668页pdf
专知会员服务
78+阅读 · 2020年12月16日
专知会员服务
52+阅读 · 2020年12月10日
【2022新书】深度学习归一化技术,117页pdf
专知
24+阅读 · 2022年11月25日
【硬核书】树与网络上的概率,716页pdf
专知
23+阅读 · 2021年12月8日
【干货书】高维统计学,572页pdf
专知
15+阅读 · 2021年12月3日
【干货书】概率,统计与数据,513页pdf
专知
35+阅读 · 2021年11月27日
【干货书】计算机科学离散数学,627页pdf
专知
61+阅读 · 2020年8月31日
【新书册】贝叶斯神经网络,41页pdf
专知
28+阅读 · 2020年6月3日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
15+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
39+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
15+阅读 · 2013年12月31日
Arxiv
162+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
423+阅读 · 2023年3月31日
Arxiv
69+阅读 · 2023年3月26日
Arxiv
153+阅读 · 2023年3月24日
Arxiv
21+阅读 · 2023年3月17日
VIP会员
相关VIP内容
【2023新书】基于模型的机器学习,428页pdf
专知会员服务
156+阅读 · 2023年11月14日
【干货书】概率论与数理统计,259页pdf
专知会员服务
57+阅读 · 2022年12月3日
【2022新书】基于模糊随机变量的模糊统计推理,295页pdf
专知会员服务
62+阅读 · 2022年10月17日
【干货书】高维统计学,572页pdf
专知会员服务
144+阅读 · 2021年12月3日
【经典书】贝叶斯强化学习概述,147页pdf
专知会员服务
110+阅读 · 2021年11月21日
【新书】感知和行动的贝叶斯模型,348页pdf
专知会员服务
72+阅读 · 2021年11月18日
【新书稿】数据科学的谱方法:统计的视角,168页pdf
专知会员服务
58+阅读 · 2021年10月28日
专知会员服务
122+阅读 · 2021年6月23日
【经典书】概率机器人,668页pdf
专知会员服务
78+阅读 · 2020年12月16日
专知会员服务
52+阅读 · 2020年12月10日
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
15+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
39+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
15+阅读 · 2013年12月31日
微信扫码咨询专知VIP会员