用图像混合学习更细粒度的特征表示，CMU邢波团队新论文入选AAAI 2022

会员服务 ·

用图像混合学习更细粒度的特征表示，CMU邢波团队新论文入选AAAI 2022

2022 年 1 月 5 日 机器之心

机器之心专栏

机器之心编辑部

这是一篇来自卡耐基梅隆大学和加州伯克利大学 Eric Xing 和 Trevor Darrell 团队联合出品的论文，探究如何在自监督双子结构中通过图像混合学习更加细粒度的特征表示，并入选 AAAI 2022。

论文链接：https://arxiv.org/pdf/2003.05438.pdf
代码链接：https://github.com/szq0214/Un-Mix

文章核心思想非常直观易懂：希望去探究在自监督学习常用的双子结构网络中，通过在输入空间做图像融合来学习更加细粒度的特征表示。核心内容讨论了如何来设计数据采样和构建对应的损失函数，从而去匹配图像融合之后新的输入空间。

如下图所示，首先形象地解释 这一基于图像融合在自监督学习中实现更加细粒度的距离度量的机制 ：

左边示例表示一般常用的双子自监督网络结构的工作原理，它的两个分支的距离就是默认的距离度量，比如使用 InfoNCE 去分类输入的图片对是正对 (positive) 还是负对 (negative)。

右边是本文 Un-Mix 提出的研究思路，即通过在一个分支上做图像融合，使得最后的距离度量变为一个 [0,1] 之间的软化系数

的倍数，从而使两个分支之间的距离变得更加细微和敏感（ 该工作是首个在自监督双子模型中引入了软距离概念的文章 ），进而让模型学习到更加细粒度的输入信息的隐空间表达。

实现策略

具体怎么来方便简单地实现这一机制呢？本文作者提出了如下一种策略：通过在一个 mini-batch 内部通过某种顺序做样本融合，从而得到固定的距离度量，如下图所示：

具体地，作者将一个批量（mini-batch）中的样本做一个倒序，然后跟原来的样本们做加权融合，两张原图的距离分别变成为λ和1-λ ，因此一个批量样本集合之间相互的语义距离矩阵变为如下形式：

利用这一新的距离度量，我们可以使用新的损失函数来训练模型，如下所示：

下面是 Un-Mix 算法实现的伪代码：

实验结果

作者在多个数据集上进行了大量的实验。

首先是 非 ImageNet 数据集上的训练和测试曲线 ：

可以发现一个比较有趣的现象：在加入了 Un-Mix 之后，训练的损失值（training loss）变得非常不稳定，波动很大，这是因为在输入空间进行图像融合操作之后导致两个分支的距离度量变得更加细微多样和敏感。但是这对模型泛化能力是有帮助的，在做模型测试的时候依然可以取得更好的测试性能。

具体的数值结果对比如下，可以看到在不同数据集和对照方法上结果都有非常明显的提升。

接下来是 在 ImageNet 上的结果 ，文章提出的方法在 200 和 800 epoch 两种不同的的训练参数设置下都有比较稳定的提升：

最后是 在下游任务目标检测上的迁移结果 ，该方法依然有稳定的提升：

此外，作者还讨论了如何处理含有 memory bank 的框架以及如何进行多尺度（multi-scale）训练（如上图 11 所示），有兴趣的同学可以去阅读原论文。

转载请联系本公众号获得授权

投稿或寻求报道：content@jiqizhixin.com

登录查看更多

相关内容

AAAI 2022

关注 12

【CVPR2022】基于节点-邻域互信息最大化的图中节点表示学习

专知会员服务

23+阅读 · 2022年3月28日

【MM 2021】基于统一中间模态学习的视红外人再识别,Towards a Unified Middle Modality Learning for Visible-Infrared Person Re-Identification

专知会员服务

12+阅读 · 2022年3月22日

WWW2022 | 迷途知返：分布迁移下的图神经网络自训练方法

专知会员服务

17+阅读 · 2022年2月19日

【博士论文】机器学习中的标记增强理论与应用研究

专知会员服务

30+阅读 · 2021年12月3日

【NeurIPS2021】由相似性迁移的弱样本细粒度分类

专知会员服务

21+阅读 · 2021年11月11日

【CVPR2021】一种基于知识蒸馏的弱监督图像文本匹配模型

专知会员服务

35+阅读 · 2021年4月8日

【NeurIPS 2020】对比学习全局和局部医学图像分割特征

专知会员服务

44+阅读 · 2020年10月20日

[NeurIPS 2020 oral] 基于因果干预的弱监督语义分割

专知会员服务

47+阅读 · 2020年10月5日

【NeurIPS2020提交论文】通用表示Transformer层的小样本图像分类

专知会员服务

58+阅读 · 2020年6月29日

【CVPR 2020 Oral】小样本类增量学习

专知会员服务

112+阅读 · 2020年6月26日

AAAI 2022 | Meta Faster R-CNN：基于注意力特征对齐的小样本目标检测

PaperWeekly

2+阅读 · 2022年3月21日

IJCAI 2021 | 中科院计算所：自监督增强的知识蒸馏方法

PaperWeekly

1+阅读 · 2022年2月22日

今晚直播 | AAAI 2022论文解读：重新思考图像融合策略和自监督对比学习

PaperWeekly

0+阅读 · 2022年2月22日

AAAI 2022上那些值得关注的NLP论文

PaperWeekly

1+阅读 · 2022年2月19日

从顶会论文看多模态预训练研究进展

专知

3+阅读 · 2021年12月24日

【NeurIPS2021】由相似性迁移的弱样本细粒度分类

专知

0+阅读 · 2021年11月11日

IJCAI 2021 | 不确定性感知小样本图像分类模型，实现SOTA性能

微软研究院AI头条

0+阅读 · 2021年8月19日

论文浅尝 | 融合多层次领域知识的分子图对比学习

开放知识图谱

2+阅读 · 2021年8月15日

图像分类：常用分类网络结构（附论文下载）

极市平台

13+阅读 · 2019年4月8日

论文浅尝 | 用图网络做小样本学习

开放知识图谱

66+阅读 · 2018年6月30日

基于低秩表示的鲁棒特征抽取和分类方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向生物特征识别的鲁棒判别结构化特征表示方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

高维多媒体特征的低维流形子空间降维及聚类研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于弱监督学习的图像语义分割研究

国家自然科学基金

4+阅读 · 2014年12月31日

网络多媒体流QoS特征稀疏表示及柔性跨域映射方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

图像标签关联性模型研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于局部不变特征和混合多示例学习的图像检索研究

国家自然科学基金

1+阅读 · 2013年12月31日

文本自动分类中样本重要性模型及应用研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于概率的名词性属性距离度量研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于特征融合的图像近似最近邻搜索哈希方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

Semi-supervised 3D shape segmentation with multilevel consistency and part substitution

Arxiv

0+阅读 · 2022年4月20日

A Novel Fast Exact Subproblem Solver for Stochastic Quasi-Newton Cubic Regularized Optimization

Arxiv

0+阅读 · 2022年4月19日

Caption Feature Space Regularization for Audio Captioning

Arxiv

0+阅读 · 2022年4月18日

DialAug: Mixing up Dialogue Contexts in Contrastive Learning for Robust Conversational Modeling

Arxiv

0+阅读 · 2022年4月15日

Simple but Effective: CLIP Embeddings for Embodied AI

Arxiv

1+阅读 · 2022年4月15日

Minimizing Control for Credit Assignment with Strong Feedback

Arxiv

0+阅读 · 2022年4月14日

Subgraph Neural Networks

Arxiv

27+阅读 · 2020年6月19日

Hierarchical Graph Representation Learning with Differentiable Pooling

Arxiv

13+阅读 · 2018年6月26日

Strong Baselines for Simple Question Answering over Knowledge Graphs with and without Neural Networks

Arxiv

17+阅读 · 2018年6月5日

Zero-shot Recognition via Semantic Embeddings and Knowledge Graphs

Arxiv

18+阅读 · 2018年4月8日

VIP会员