带有覆盖保障的选择性预测集成模型 (Selective prediction-set models with coverage guarantees)

Though black-box predictors are state-of-the-art for many complex tasks, they often fail to properly quantify predictive uncertainty and may provide inappropriate predictions for unfamiliar data. Instead, we can learn more reliable models by letting them either output a prediction set or abstain when the uncertainty is high. We propose training these selective prediction-set models using an uncertainty-aware loss minimization framework, which unifies ideas from decision theory and robust maximum likelihood. Moreover, since black-box methods are not guaranteed to output well-calibrated prediction sets, we show how to calculate point estimates and confidence intervals for the true coverage of any selective prediction-set model, as well as a uniform mixture of K set models obtained from K-fold sample-splitting. When applied to predicting in-hospital mortality and length-of-stay for ICU patients, our model outperforms existing approaches on both in-sample and out-of-sample age groups, and our recalibration method provides accurate inference for prediction set coverage.

翻译：尽管黑箱预测器是许多复杂任务的最新技术,但它们往往无法适当量化预测不确定性,并且可能为不熟悉的数据提供不适当的预测。相反,我们可以通过让它们输出一个预测数据集来学习更可靠的模型,或者在不确定性高时不使用。我们提议使用不确定性-觉察损失最小化框架来培训这些选择性预测设定模型,该框架统一了决策理论和稳健最大可能性的理念。此外,由于黑箱方法不能保证输出经过良好校准的预测数据集,我们展示了如何计算任何选择性预测集模型真实覆盖的点估计和信任间隔,以及从 K 倍样本分割中获得的K 集模型的统一组合。当应用到预测ICU 病人的住院死亡率和停留时间长度时,我们的模型超越了目前对样本和绝缘组的现有方法,我们的校准方法为预测设定的覆盖提供了准确的推断。

相关内容

MoDELS

关注 43

ACM/IEEE第23届模型驱动工程语言和系统国际会议，是模型驱动软件和系统工程的首要会议系列，由ACM-SIGSOFT和IEEE-TCSE支持组织。自1998年以来，模型涵盖了建模的各个方面，从语言和方法到工具和应用程序。模特的参加者来自不同的背景，包括研究人员、学者、工程师和工业专业人士。MODELS 2019是一个论坛，参与者可以围绕建模和模型驱动的软件和系统交流前沿研究成果和创新实践经验。今年的版本将为建模社区提供进一步推进建模基础的机会，并在网络物理系统、嵌入式系统、社会技术系统、云计算、大数据、机器学习、安全、开源等新兴领域提出建模的创新应用以及可持续性。官网链接：http://www.modelsconference.org/

机器学习面试必备！这份18页精炼《机器学习面试速查表》帮你！英伟达高级机器学习工程Aqeel Anwar撰写

专知会员服务

109+阅读 · 2022年1月26日

深度概率图模型，Deep Probabilistic Models

专知会员服务

29+阅读 · 2021年8月2日

【干货书】机器学习速查手册，135页pdf

专知会员服务

127+阅读 · 2020年11月20日

【CVPR2020】用于图像超分辨率的深度展开网络，Deep Unfolding Network for Image Super-Resolution

专知会员服务

44+阅读 · 2020年3月26日