近年来,半监督算法在学术界和工业界都得到了广泛的关注。在现有的技术中,自训练方法可以说在过去几年里得到了更多的关注。这些模型被设计用来搜索低密度区域的决策边界,而不对数据分布做额外的假设,并使用一个学习过的分类器的无符号输出分数,或它的边缘,作为置信度的指标。自训练算法的工作原理是通过将伪标签分配给一组边缘大于某一阈值的未标记训练样本,迭代地学习分类器。然后使用伪标记的例子来丰富标记的训练数据,并结合标记的训练集训练一个新的分类器。我们提出了二分类和多分类的自训练方法及其变体,这些方法是最近使用神经网络发展起来的。最后,我们讨论了我们对未来自训练研究的想法。据我们所知,这是关于这个主题的第一次彻底和完整的综述。