自监督学习 (SSL) 作为一种有效的表示学习范式,在各种策划的数据集中在多种情境下都取得了巨大的成功。然而,当面对现实世界应用中的长尾分布时,现有的方法仍然难以捕获可转移和鲁棒的表示。传统的 SSL 方法追求样本级的均匀性,很容易导致表示学习的差异,其中头部类别占据了特征领域,但尾部类别被动地崩溃。为了解决这个问题,我们提出了一种新颖的几何和谐化 (GH) 方法来鼓励在表示学习中的类别级的均匀性,这对少数群体更为友好,且几乎不会伤害在长尾分布下的大多数。特别是,GH 在自监督学习的基础上测量嵌入空间的人口统计数据,然后推断一个细粒度的实例级校准来限制头部类别的空间扩展并避免尾部类别的被动崩溃。我们的创新并不改变 SSL 的设置,并且可以以低成本的方式轻松集成到现有的方法中。在一系列基准数据集上的广泛结果显示了 GH 对分布偏斜的高容忍度的有效性。我们的代码可在
https://github.com/MediaBrain-SJTU/Geometric-Harmonization 上获得。