半监督学习(Semi-Supervised Learning,SSL)是模式识别和机器学习领域研究的重点问题,是监督学习与无监督学习相结合的一种学习方法。半监督学习使用大量的未标记数据,以及同时使用标记数据,来进行模式识别工作。当使用半监督学习时,将会要求尽量少的人员来从事工作,同时,又能够带来比较高的准确性,因此,半监督学习目前正越来越受到人们的重视。

VIP内容

半监督学习(SSL)由于成功地使用了未标记数据,在许多机器学习任务中受到了极大的关注,而现有的SSL算法在训练过程中要么使用所有未标记的示例,要么使用具有固定高置信度预测的未标记示例。然而,可能会有太多正确/错误的伪标签示例被删除/选择。在本工作中,我们提出一个简单但强大的训练示例子集,以便只使用与已标记数据相关的伪标签的未标记示例来训练模型。在每次更新迭代中,只保留损失小于给定阈值(通过迭代动态调整)的示例,从而执行选择。我们提出的Dash方法在无标记数据选择方面具有自适应性,并具有理论保障。具体地,我们从非凸优化的角度从理论上建立了Dash的收敛速度。最后,我们通过与最先进的基准比较,证明了该方法的有效性。

http://proceedings.mlr.press/v139/xu21e.html

成为VIP会员查看完整内容
0
10
Top