The masking-one-out (MOO) procedure, masking an observed entry and comparing it versus its imputed values, is a very common procedure for comparing imputation models. We study the optimum of this procedure and generalize it to a missing data assumption and establish the corresponding semi-parametric efficiency theory. However, MOO is a measure of prediction accuracy, which is not ideal for evaluating an imputation model. To address this issue, we introduce three modified MOO criteria, based on rank transformation, energy distance, and likelihood principle, that allow us to select an imputation model that properly account for the stochastic nature of data. The likelihood approach further enables an elegant framework of learning an imputation model from the data and we derive its statistical and computational learning theories as well as consistency of BIC model selection. We also show how MOO is related to the missing-at-random assumption. Finally, we introduce the prediction-imputation diagram, a two-dimensional diagram visually comparing both the prediction and imputation utilities for various imputation models.


翻译:掩蔽单点(MOO)方法——通过掩蔽一个观测条目并将其与插补值进行比较——是评估插补模型的一种常用方法。我们研究了该方法的优化问题,并将其推广至缺失数据假设,建立了相应的半参数效率理论。然而,MOO本质上是一种预测精度度量,并不完全适用于评估插补模型。为解决这一问题,我们基于秩变换、能量距离和似然原理,提出了三种改进的MOO准则,这些准则能够帮助选择能恰当反映数据随机性的插补模型。其中,似然方法进一步构建了一个从数据中学习插补模型的优雅框架,我们推导了其统计与计算学习理论,并证明了BIC模型选择的一致性。我们还揭示了MOO与随机缺失假设之间的关联。最后,我们引入了预测-插补图,这是一种二维可视化图表,用于直观比较不同插补模型在预测效用与插补效用两方面的表现。

0
下载
关闭预览

相关内容

【WWW2025】基于不确定性的图结构学习
专知会员服务
17+阅读 · 2月20日
专知会员服务
50+阅读 · 2021年6月2日
【NeurIPS2020】可处理的反事实推理的深度结构因果模型
专知会员服务
49+阅读 · 2020年9月28日
专知会员服务
30+阅读 · 2020年9月18日
详解常见的损失函数
七月在线实验室
20+阅读 · 2018年7月12日
条件概率和贝叶斯公式 - 图解概率 03
遇见数学
10+阅读 · 2018年6月5日
PCA的基本数学原理
算法与数学之美
11+阅读 · 2017年8月8日
EKF常用于目标跟踪系统的扩展卡尔曼滤波器
无人机
10+阅读 · 2017年7月25日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
0+阅读 · 11月5日
VIP会员
相关VIP内容
【WWW2025】基于不确定性的图结构学习
专知会员服务
17+阅读 · 2月20日
专知会员服务
50+阅读 · 2021年6月2日
【NeurIPS2020】可处理的反事实推理的深度结构因果模型
专知会员服务
49+阅读 · 2020年9月28日
专知会员服务
30+阅读 · 2020年9月18日
相关资讯
详解常见的损失函数
七月在线实验室
20+阅读 · 2018年7月12日
条件概率和贝叶斯公式 - 图解概率 03
遇见数学
10+阅读 · 2018年6月5日
PCA的基本数学原理
算法与数学之美
11+阅读 · 2017年8月8日
EKF常用于目标跟踪系统的扩展卡尔曼滤波器
无人机
10+阅读 · 2017年7月25日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员