【FB陈鑫磊-何恺明】SimSiam：消除表征学习“崩溃解”，探寻对比表达学习成功之根源 - 专知VIP

会员服务 ·

1

陈鑫磊 · 何恺明 · 对比学习 · 表征学习 ·

2020 年 11 月 26 日

【FB陈鑫磊-何恺明】SimSiam：消除表征学习“崩溃解”，探寻对比表达学习成功之根源

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

孪生网络已成为无监督表达学习领域的通用架构，现有方法通过最大化同一图像的两者增广的相似性使其避免“崩溃解(collapsing solutions)”问题。在这篇研究中，作者提出一种惊人的实证结果：Simple Siamese(SimSiam)网络甚至可以在无（(1) negative sample pairs；(2)large batch；(3)momentum encoders）的情形下学习有意义的特征表达。

作者通过实验表明：对于损失与结构而言，“崩溃解”确实存在，但是“stop-gradient”操作对于避免“崩溃解”有非常重要的作用。作者提出了一种新颖的“stop-gradient”思想并通过实验对其进行了验证，该文所提SimSiam在ImageNet及下游任务上均取得了有竞争力的结果。作者期望：这个简单的基准方案可以驱动更多研员重新思考无监督表达学习中的孪生结构。

Method

成为VIP会员查看完整内容

20

相关内容

陈鑫磊

【AAAI2021】近似梯度下降的学习图神经网络

专知会员服务

20+阅读 · 2020年12月9日

【AAAI2021】元标签校正的噪声标签学习

专知会员服务

31+阅读 · 2020年12月7日

【NeurIPS2020-北大】非凸优化裁剪算法的改进分析

【NeurIPS2020-北大】非凸优化裁剪算法的改进分析

专知会员服务

29+阅读 · 2020年10月11日

【斯坦福尤佳轩&何恺明ICML2020新作】神经网络的图结构，48页ppt

专知会员服务

26+阅读 · 2020年8月28日

【ECCV2020】EfficientFCN：语义分割中的整体引导解码器

【ECCV2020】EfficientFCN：语义分割中的整体引导解码器

专知会员服务

18+阅读 · 2020年8月23日

【ICML2020-斯坦福Facebook】神经网络的图结构：通过相关图表达理解神经网络

专知会员服务

33+阅读 · 2020年7月16日

【KDD2020-清华大学】图对比编码的图神经网络预训练

【KDD2020-清华大学】图对比编码的图神经网络预训练

专知会员服务

46+阅读 · 2020年6月18日

【CVPR2020-CMU】无数据模型选择，一种深度框架潜力

【CVPR2020-CMU】无数据模型选择，一种深度框架潜力

专知会员服务

23+阅读 · 2020年4月12日

【CVPR2020】L2 ^GCN：图卷积网络的分层学习高效训练

【CVPR2020】L2 ^GCN：图卷积网络的分层学习高效训练

专知会员服务

40+阅读 · 2020年3月31日

【Nature论文】深度网络中的梯度下降复杂度控制

【Nature论文】深度网络中的梯度下降复杂度控制

专知会员服务

41+阅读 · 2020年3月9日

对比自监督学习

对比自监督学习

深度学习自然语言处理

35+阅读 · 2020年7月15日

何恺明最新一作论文：无监督胜有监督，迁移学习无压力，刷新7项检测分割任务

何恺明最新一作论文：无监督胜有监督，迁移学习无压力，刷新7项检测分割任务

量子位

7+阅读 · 2019年11月19日

何恺明一作，刷新7项检测分割任务，无监督预训练完胜有监督

何恺明一作，刷新7项检测分割任务，无监督预训练完胜有监督

机器之心

12+阅读 · 2019年11月15日

GAN用于无监督表征学习，效果依然惊人……

GAN用于无监督表征学习，效果依然惊人……

机器之心

12+阅读 · 2019年7月9日

何恺明团队最新研究：3D目标检测新框架VoteNet，直接处理点云数据，刷新最高精度

何恺明团队最新研究：3D目标检测新框架VoteNet，直接处理点云数据，刷新最高精度

人工智能前沿讲习班

5+阅读 · 2019年5月2日

何恺明团队最新研究：3D目标检测新框架VoteNet，两大数据集刷新最高精度

何恺明团队最新研究：3D目标检测新框架VoteNet，两大数据集刷新最高精度

新智元

8+阅读 · 2019年4月25日

CMU论文解读：基于GAN和VAE的跨模态图像生成

CMU论文解读：基于GAN和VAE的跨模态图像生成

PaperWeekly

9+阅读 · 2018年8月20日

图像压缩哪家强？请看这份超详细对比

图像压缩哪家强？请看这份超详细对比

PaperWeekly

5+阅读 · 2018年7月10日

前沿 | 通用句子语义编码器，谷歌在语义文本相似性上的探索

前沿 | 通用句子语义编码器，谷歌在语义文本相似性上的探索

机器之心

8+阅读 · 2018年5月26日

学界 | 浙大&川大提出脉冲版ResNet：继承ResNet优势，实现当前最佳

学界 | 浙大&川大提出脉冲版ResNet：继承ResNet优势，实现当前最佳

机器之心

3+阅读 · 2018年5月12日

Partially Observable Mean Field Reinforcement Learning

Arxiv

0+阅读 · 2021年1月7日

On Testability of First-Order Properties in Bounded-Degree Graphs

Arxiv

0+阅读 · 2021年1月7日

Set structured global empirical risk minimizers are rate optimal in general dimensions

Arxiv

1+阅读 · 2021年1月7日

Universal Bayes consistency in metric spaces

Arxiv

1+阅读 · 2021年1月6日

Polynomial Fixed-Parameter Algorithms: A Case Study for Longest Path on Interval Graphs

Arxiv

0+阅读 · 2021年1月4日

Multimodal Model-Agnostic Meta-Learning via Task-Aware Modulation

Multimodal Model-Agnostic Meta-Learning via Task-Aware Modulation

Arxiv

25+阅读 · 2019年10月30日

GEP-PG: Decoupling Exploration and Exploitation in Deep Reinforcement Learning Algorithms

GEP-PG: Decoupling Exploration and Exploitation in Deep Reinforcement Learning Algorithms

Arxiv

4+阅读 · 2018年8月17日

Constrained-CNN losses forweakly supervised segmentation

Arxiv

5+阅读 · 2018年5月12日

Efficient and Deep Person Re-Identification using Multi-Level Similarity

Arxiv

4+阅读 · 2018年4月2日

DDRprog: A CLEVR Differentiable Dynamic Reasoning Programmer

Arxiv

5+阅读 · 2018年3月30日

VIP会员

相关主题

相关VIP内容

【AAAI2021】近似梯度下降的学习图神经网络

专知会员服务

20+阅读 · 2020年12月9日

【AAAI2021】元标签校正的噪声标签学习

专知会员服务

31+阅读 · 2020年12月7日

【NeurIPS2020-北大】非凸优化裁剪算法的改进分析

【NeurIPS2020-北大】非凸优化裁剪算法的改进分析

专知会员服务

29+阅读 · 2020年10月11日

【斯坦福尤佳轩&何恺明ICML2020新作】神经网络的图结构，48页ppt

专知会员服务

26+阅读 · 2020年8月28日

【ECCV2020】EfficientFCN：语义分割中的整体引导解码器

【ECCV2020】EfficientFCN：语义分割中的整体引导解码器

专知会员服务

18+阅读 · 2020年8月23日

【ICML2020-斯坦福Facebook】神经网络的图结构：通过相关图表达理解神经网络

专知会员服务

33+阅读 · 2020年7月16日

【KDD2020-清华大学】图对比编码的图神经网络预训练

【KDD2020-清华大学】图对比编码的图神经网络预训练

专知会员服务

46+阅读 · 2020年6月18日

【CVPR2020-CMU】无数据模型选择，一种深度框架潜力

【CVPR2020-CMU】无数据模型选择，一种深度框架潜力

专知会员服务

23+阅读 · 2020年4月12日

【CVPR2020】L2 ^GCN：图卷积网络的分层学习高效训练

【CVPR2020】L2 ^GCN：图卷积网络的分层学习高效训练

专知会员服务

40+阅读 · 2020年3月31日

【Nature论文】深度网络中的梯度下降复杂度控制

【Nature论文】深度网络中的梯度下降复杂度控制

专知会员服务

41+阅读 · 2020年3月9日

热门VIP内容

开通专知VIP会员享更多权益服务

视觉-语言-动作模型解析：从模块构成到里程碑与挑战

《解析陆域作战方向：一个概念性框架》报告

【博士论文】基于多模态基础模型的上下文学习

追寻真正的AI自主性：从遗留思维到战场优势

相关资讯

对比自监督学习

对比自监督学习

深度学习自然语言处理

35+阅读 · 2020年7月15日

何恺明最新一作论文：无监督胜有监督，迁移学习无压力，刷新7项检测分割任务

何恺明最新一作论文：无监督胜有监督，迁移学习无压力，刷新7项检测分割任务

量子位

7+阅读 · 2019年11月19日

何恺明一作，刷新7项检测分割任务，无监督预训练完胜有监督

何恺明一作，刷新7项检测分割任务，无监督预训练完胜有监督

机器之心

12+阅读 · 2019年11月15日

GAN用于无监督表征学习，效果依然惊人……

GAN用于无监督表征学习，效果依然惊人……

机器之心

12+阅读 · 2019年7月9日

何恺明团队最新研究：3D目标检测新框架VoteNet，直接处理点云数据，刷新最高精度

何恺明团队最新研究：3D目标检测新框架VoteNet，直接处理点云数据，刷新最高精度

人工智能前沿讲习班

5+阅读 · 2019年5月2日

何恺明团队最新研究：3D目标检测新框架VoteNet，两大数据集刷新最高精度

何恺明团队最新研究：3D目标检测新框架VoteNet，两大数据集刷新最高精度

新智元

8+阅读 · 2019年4月25日

CMU论文解读：基于GAN和VAE的跨模态图像生成

CMU论文解读：基于GAN和VAE的跨模态图像生成

PaperWeekly

9+阅读 · 2018年8月20日

图像压缩哪家强？请看这份超详细对比

图像压缩哪家强？请看这份超详细对比

PaperWeekly

5+阅读 · 2018年7月10日

前沿 | 通用句子语义编码器，谷歌在语义文本相似性上的探索

前沿 | 通用句子语义编码器，谷歌在语义文本相似性上的探索

机器之心

8+阅读 · 2018年5月26日

学界 | 浙大&川大提出脉冲版ResNet：继承ResNet优势，实现当前最佳

学界 | 浙大&川大提出脉冲版ResNet：继承ResNet优势，实现当前最佳

机器之心

3+阅读 · 2018年5月12日

相关论文

Partially Observable Mean Field Reinforcement Learning

Arxiv

0+阅读 · 2021年1月7日

On Testability of First-Order Properties in Bounded-Degree Graphs

Arxiv

0+阅读 · 2021年1月7日

Set structured global empirical risk minimizers are rate optimal in general dimensions

Arxiv

1+阅读 · 2021年1月7日

Universal Bayes consistency in metric spaces

Arxiv

1+阅读 · 2021年1月6日

Polynomial Fixed-Parameter Algorithms: A Case Study for Longest Path on Interval Graphs

Arxiv

0+阅读 · 2021年1月4日

Multimodal Model-Agnostic Meta-Learning via Task-Aware Modulation

Multimodal Model-Agnostic Meta-Learning via Task-Aware Modulation

Arxiv

25+阅读 · 2019年10月30日

GEP-PG: Decoupling Exploration and Exploitation in Deep Reinforcement Learning Algorithms

GEP-PG: Decoupling Exploration and Exploitation in Deep Reinforcement Learning Algorithms

Arxiv

4+阅读 · 2018年8月17日

Constrained-CNN losses forweakly supervised segmentation

Arxiv

5+阅读 · 2018年5月12日

Efficient and Deep Person Re-Identification using Multi-Level Similarity

Arxiv

4+阅读 · 2018年4月2日

DDRprog: A CLEVR Differentiable Dynamic Reasoning Programmer

Arxiv

5+阅读 · 2018年3月30日

微信扫码咨询专知VIP会员