在半监督领域自适应问题的目标域数据中对每个类别赋予少量有标签样本可引导其余的无标签目标域样本的特征聚集在它们周围。但是,如此经过训练后的模型无法为目标域生成具有高度区分性的特征表示,因为训练过程主要由来自源域的有标签样本主导。这就可能导致有标签和无标签的目标域样本之间的特征缺乏连结以及目标域和源域样本之间的特征进行错位对齐。在本文中,作者们提出了一种新的被称为跨域自适应聚类的算法来解决这个问题。为了同时实现不同领域间和同一领域内的自适应,我们首先引入了一个对抗性自适应聚类损失函数来对无标签目标域样本的特征进行分组聚类,并在源域和目标域之间以聚类簇的形式进行跨域特征对齐。另外,我们进一步将“Pseudo labeling”技术应用于目标域中无标签样本,并对具有较高的置信度的样本赋予“伪标签”。该技术扩充了目标域中每个类别的“有标签样本”的数量使得每个类别可以产生了更加鲁棒、强大的聚类簇中心,从而促进对抗学习过程。我们在包括DomainNet、Office-Home和Office在内的基准数据集上进行的大量实验,结果表明我们所提出的方法能够在半监督域自适应中实现最优性能。
论文链接:https://www.zhuanzhi.ai/paper/bca546caa350082ff63382cc18636077