ICCV 2021｜“白嫖”性能的MixMo，一种新的数据增强or模型融合方法 - 专知VIP

会员服务 ·

1

ICCV 2021 · 数据增强 · 模型集成 ·

2021 年 8 月 6 日

ICCV 2021｜“白嫖”性能的MixMo，一种新的数据增强or模型融合方法

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

卷积神经网络(cnn)在计算机视觉任务中表现出了出色的性能，尤其是分类任务。为了在真实场景中增加鲁棒性或赢得Kaggle竞赛，cnn通常会采用两种实用策略:数据增强和模型集成。

数据增强可以减少过拟合并提升模型的泛化性。传统的图像增强是保留标签的:例如翻转、裁剪等。然而，最近的混合样本数据增强(MSDA)改变了这种方式：多个输入和它们的标签按比例混合来创建人工样本，代表工作有MixUp，CutMix等等。

模型集成证明了聚合来自多个神经网络的不同预测能够显著提高了泛化能力，尤其是不确定性估计。从经验上讲，几个小网络的集成通常比一个大网络性能更好。然而，在训练和推理方面，集成在时间和显存消耗方面都是昂贵的：这往往限制了模型集成的适用性。

在本文，作者提出了多输入多输出框架MixMo。为了解决传统集成中出现的这些开销，作者将M个独立子网放入一个单一的base网络中。这也是合理的，因为在模型集成时，“最终采纳的网络”其实就和整体的网络表现差不多。

所以，现在最大的问题是如何在没有结构差异的情况下加强subnet之间的多样性。

如上图，作者在训练过程中同时考虑了M个输入，M个输入被M个参数不共享的Encoder编码到共享空间中，然后将特征送到核心网络，核心网络最终分成M个分支；这个M个分支用来预测不同输入信息的label。在inference的时候，同一图像重复M次：通过平均M个预测获得“免费”的集成效果。

与现有的MSDA相比，MixMo最大的不同就是multi-input mixing block。如果合并是一个基本的求和，MixMo将变成到MIMO[1]。作者对比了大量的MSDA的工作，设计了更合适的混合块，因此作者采用binary masking的方法来确保子网络的多样性。（如上图所示，作者对不同样本采用了一个binary masking方法，这一点就类似CutMix，而不是像MIMO那样直接相加）。

这种不对称的混合也会造成网络特征中的信息不平衡的新问题，因此作者通过一个新的加权函数来解决多个分类训练任务之间的不平衡问题。

成为VIP会员查看完整内容

25

相关内容

ICCV 2021

【ICCV2021】用于群体行为识别的动态时空推理网络

专知会员服务

37+阅读 · 2021年9月15日

ICCV'21 Oral｜拒绝调参，显著提点！检测分割任务的新损失函数RS Loss开源

专知会员服务

16+阅读 · 2021年8月11日

序列数据的数据增强方法综述

专知会员服务

74+阅读 · 2021年7月21日

【CVPR2021】双图层实例分割，大幅提升遮挡处理性能

专知会员服务

18+阅读 · 2021年5月23日

【CVPR2021】重新思考BiSeNet让语义分割模型速度起飞

【CVPR2021】重新思考BiSeNet让语义分割模型速度起飞

专知会员服务

34+阅读 · 2021年5月5日

【AAAI2021】数据增强图神经网络

专知会员服务

108+阅读 · 2020年12月21日

【博士论文】基于深度学习的图像处理算法研究

专知会员服务

80+阅读 · 2020年12月6日

【Aalto博士论文】高效样本近似贝叶斯计算的高斯过程代理方法，84页pdf

专知会员服务

35+阅读 · 2020年9月30日

无需额外数据、Tricks、架构调整，CMU开源首个将ResNet50精度提升至80%+新方法

无需额外数据、Tricks、架构调整，CMU开源首个将ResNet50精度提升至80%+新方法

专知会员服务

14+阅读 · 2020年9月20日

【CVPR2020】用多样性最大化克服单样本NAS中的多模型遗忘

【CVPR2020】用多样性最大化克服单样本NAS中的多模型遗忘

专知会员服务

21+阅读 · 2020年5月16日

多任务学习(Multi-task Learning)方法总结

多任务学习(Multi-task Learning)方法总结

极市平台

6+阅读 · 2020年4月26日

ICCV 2019 | 北邮提出高阶注意力模型，大幅改进行人重识别SOTA精度

ICCV 2019 | 北邮提出高阶注意力模型，大幅改进行人重识别SOTA精度

极市平台

67+阅读 · 2019年8月31日

伯克利提出数据增强新方法，计算速度提升1000倍

伯克利提出数据增强新方法，计算速度提升1000倍

AI前线

12+阅读 · 2019年6月21日

Rocket Training: 一种提升轻量网络性能的训练方法

Rocket Training: 一种提升轻量网络性能的训练方法

极市平台

5+阅读 · 2019年6月15日

用于语音识别的数据增强

用于语音识别的数据增强

AI研习社

24+阅读 · 2019年6月5日

性能超越经典ASR模型！谷歌重磅推出全新语音识别数据增强方法

性能超越经典ASR模型！谷歌重磅推出全新语音识别数据增强方法

AI前线

10+阅读 · 2019年4月28日

非平衡数据集 focal loss 多类分类

非平衡数据集 focal loss 多类分类

AI研习社

33+阅读 · 2019年4月23日

【学界】谷歌大脑提出自动数据增强方法AutoAugment：可迁移至不同数据集

【学界】谷歌大脑提出自动数据增强方法AutoAugment：可迁移至不同数据集

GAN生成式对抗网络

11+阅读 · 2018年6月5日

学界 | 谷歌大脑提出自动数据增强方法AutoAugment：可迁移至不同数据集

学界 | 谷歌大脑提出自动数据增强方法AutoAugment：可迁移至不同数据集

机器之心

3+阅读 · 2018年6月2日

深度判别和共享特征学习的图像分类

深度判别和共享特征学习的图像分类

计算机视觉战队

6+阅读 · 2017年9月27日

In-Network Processing Acoustic Data for Anomaly Detection in Smart Factory

Arxiv

0+阅读 · 2021年10月4日

Multimodal Emergent Fake News Detection via Meta Neural Process Networks

Arxiv

6+阅读 · 2021年6月22日

Uncertainty-aware Joint Salient Object and Camouflaged Object Detection

Arxiv

5+阅读 · 2021年4月6日

Learning Discriminative Model Prediction for Tracking

Learning Discriminative Model Prediction for Tracking

Arxiv

6+阅读 · 2019年4月15日

PFLD: A Practical Facial Landmark Detector

Arxiv

5+阅读 · 2019年2月28日

Collaborative Similarity Embedding for Recommender Systems

Arxiv

8+阅读 · 2019年2月19日

A Question-Focused Multi-Factor Attention Network for Question Answering

Arxiv

6+阅读 · 2018年1月25日

DKN: Deep Knowledge-Aware Network for News Recommendation

Arxiv

3+阅读 · 2018年1月25日

Negative Binomial Matrix Factorization for Recommender Systems

Arxiv

8+阅读 · 2018年1月5日

Neural Attentive Session-based Recommendation

Arxiv

5+阅读 · 2017年11月13日

VIP会员

相关主题

相关VIP内容

【ICCV2021】用于群体行为识别的动态时空推理网络

专知会员服务

37+阅读 · 2021年9月15日

ICCV'21 Oral｜拒绝调参，显著提点！检测分割任务的新损失函数RS Loss开源

专知会员服务

16+阅读 · 2021年8月11日

序列数据的数据增强方法综述

专知会员服务

74+阅读 · 2021年7月21日

【CVPR2021】双图层实例分割，大幅提升遮挡处理性能

专知会员服务

18+阅读 · 2021年5月23日

【CVPR2021】重新思考BiSeNet让语义分割模型速度起飞

【CVPR2021】重新思考BiSeNet让语义分割模型速度起飞

专知会员服务

34+阅读 · 2021年5月5日

【AAAI2021】数据增强图神经网络

专知会员服务

108+阅读 · 2020年12月21日

【博士论文】基于深度学习的图像处理算法研究

专知会员服务

80+阅读 · 2020年12月6日

【Aalto博士论文】高效样本近似贝叶斯计算的高斯过程代理方法，84页pdf

专知会员服务

35+阅读 · 2020年9月30日

无需额外数据、Tricks、架构调整，CMU开源首个将ResNet50精度提升至80%+新方法

无需额外数据、Tricks、架构调整，CMU开源首个将ResNet50精度提升至80%+新方法

专知会员服务

14+阅读 · 2020年9月20日

【CVPR2020】用多样性最大化克服单样本NAS中的多模型遗忘

【CVPR2020】用多样性最大化克服单样本NAS中的多模型遗忘

专知会员服务

21+阅读 · 2020年5月16日

热门VIP内容

开通专知VIP会员享更多权益服务

《乌克兰无人机产业：志愿者与政策在构建新兴无人机产业中的协同作用》最新报告

《人工智能辅助决策中的数据可视化：系统性综述》

人工智能驱动弹药制造现代化：美国陆军转型之路

《敏捷作战部署中枢纽-辐条基地选址优化研究》80页

相关资讯

多任务学习(Multi-task Learning)方法总结

多任务学习(Multi-task Learning)方法总结

极市平台

6+阅读 · 2020年4月26日

ICCV 2019 | 北邮提出高阶注意力模型，大幅改进行人重识别SOTA精度

ICCV 2019 | 北邮提出高阶注意力模型，大幅改进行人重识别SOTA精度

极市平台

67+阅读 · 2019年8月31日

伯克利提出数据增强新方法，计算速度提升1000倍

伯克利提出数据增强新方法，计算速度提升1000倍

AI前线

12+阅读 · 2019年6月21日

Rocket Training: 一种提升轻量网络性能的训练方法

Rocket Training: 一种提升轻量网络性能的训练方法

极市平台

5+阅读 · 2019年6月15日

用于语音识别的数据增强

用于语音识别的数据增强

AI研习社

24+阅读 · 2019年6月5日

性能超越经典ASR模型！谷歌重磅推出全新语音识别数据增强方法

性能超越经典ASR模型！谷歌重磅推出全新语音识别数据增强方法

AI前线

10+阅读 · 2019年4月28日

非平衡数据集 focal loss 多类分类

非平衡数据集 focal loss 多类分类

AI研习社

33+阅读 · 2019年4月23日

【学界】谷歌大脑提出自动数据增强方法AutoAugment：可迁移至不同数据集

【学界】谷歌大脑提出自动数据增强方法AutoAugment：可迁移至不同数据集

GAN生成式对抗网络

11+阅读 · 2018年6月5日

学界 | 谷歌大脑提出自动数据增强方法AutoAugment：可迁移至不同数据集

学界 | 谷歌大脑提出自动数据增强方法AutoAugment：可迁移至不同数据集

机器之心

3+阅读 · 2018年6月2日

深度判别和共享特征学习的图像分类

深度判别和共享特征学习的图像分类

计算机视觉战队

6+阅读 · 2017年9月27日

相关论文

In-Network Processing Acoustic Data for Anomaly Detection in Smart Factory

Arxiv

0+阅读 · 2021年10月4日

Multimodal Emergent Fake News Detection via Meta Neural Process Networks

Arxiv

6+阅读 · 2021年6月22日

Uncertainty-aware Joint Salient Object and Camouflaged Object Detection

Arxiv

5+阅读 · 2021年4月6日

Learning Discriminative Model Prediction for Tracking

Learning Discriminative Model Prediction for Tracking

Arxiv

6+阅读 · 2019年4月15日

PFLD: A Practical Facial Landmark Detector

Arxiv

5+阅读 · 2019年2月28日

Collaborative Similarity Embedding for Recommender Systems

Arxiv

8+阅读 · 2019年2月19日

A Question-Focused Multi-Factor Attention Network for Question Answering

Arxiv

6+阅读 · 2018年1月25日

DKN: Deep Knowledge-Aware Network for News Recommendation

Arxiv

3+阅读 · 2018年1月25日

Negative Binomial Matrix Factorization for Recommender Systems

Arxiv

8+阅读 · 2018年1月5日

Neural Attentive Session-based Recommendation

Arxiv

5+阅读 · 2017年11月13日

微信扫码咨询专知VIP会员