弱监督学习是一种有效的机器学习方法,是当前机器学习研究的热门话题,它可以有效减少标注数据所需的人力与时间。该论文提出了一种新颖的基于相似置信度学习的算法,该算法建立了无需真实标签,仅利用成对的无标签样本以及它们之间的相似度构造分类风险无偏估计量,并从理论上证明了该方法的概率收敛误差上界。在大数据时代标签缺失的情况下,对提高数据利用效率方面有着十分重要的意义。
https://arxiv.org/abs/2102.06879