现实生活中,许多情况下由于负类样本的获取比较困难或负类样本太过多样,因此模型训练时只有正样本和大量的未标注样本。为处理这种情况,PU学习(Positive and Unlabeled Learning,简称PU learning)被提出,以处理只有正类和未标注数据情况下的分类器训练问题。本文研究了实例相关的PU分类,具体是指其中一个正样本是否会被标注(由 s 表示)不仅与类别标签 y 相关,还取决于特征向量x 。换而言之,正样本被标注的概率并不满足以前工作的假设——即所有正样本以相同概率被均匀标注。因此,本文提出了标注偏差估计的方法来处理这种实例相关的PU学习问题。目前,该文已发表于人工智能国际顶级期刊《IEEE Transactions on Pattern Analysis and Machine Intelligence》。