General Approximate Cross Validation for Model Selection: Supervised, Semi-supervised and Pairwise Learning
作 者:朱博炜,刘勇
通讯作者:刘勇
论文概述:交叉验证(CV)是一种普遍应用于评估机器学习模型性能的工具。然而,特别是在数据量巨大的多媒体任务中,由于其需要进行多次训练,这种方法具有很高的复杂性。在本文中,我们提供了一个统一的框架来近似各种常见的多媒体任务的CV误差,可以广泛应用在有监督、半监督和成对学习任务中,且只需要训练一次。此外,我们研究了所提出的近似CV的理论性能,并给出了一个显式的有限样本误差界。在多个数据集上的实验结果表明,我们的近似CV与原始CV没有统计上的差异,但可以显著提高模型选择的效率,这在模型选择上有很大的优势。