基于meta-learning的方法在有噪声标注的图像分类中取得了显著的效果。这类方法往往需要大量的计算资源,而计算瓶颈在于meta-gradient的计算上。本文提出了一种高效的meta-learning更新方式:Faster Meta Update Strategy (FaMUS),加快了meta-learning的训练速度 (减少2/3的训练时间),并提升了模型的性能。首先,我们发现meta-gradient的计算可以转换成一个逐层计算并累计的形式; 并且,meta-learning的更新只需少量层数在meta-gradient就可以完成。基于此,我们设计了一个layer-wise gradient sampler 加在网络的每一层上。根据sampler的输出,模型可以在训练过程中自适应地判断是否计算并收集该层网络的梯度。越少层的meta-gradient需要计算,网络更新时所需的计算资源越少,从而提升模型的计算效率。

并且,我们发现FaMUS使得meta-learning更加稳定,从而提升了模型的性能。最后,我们在有噪声的分类问题以及长尾分类问题都验证了我们方法的有效性。

https://www.zhuanzhi.ai/paper/fda93b750216436e45e6f660ed76776e

成为VIP会员查看完整内容
19

相关内容

Meta Learning,元学习,也叫 Learning to Learn(学会学习)。是继Reinforcement Learning(增强学习)之后又一个重要的研究分支。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
专知会员服务
15+阅读 · 2021年6月6日
专知会员服务
21+阅读 · 2021年5月14日
专知会员服务
20+阅读 · 2021年5月1日
【CVPR2021】现实世界域泛化的自适应方法
专知会员服务
55+阅读 · 2021年3月31日
专知会员服务
10+阅读 · 2021年3月21日
【KDD2020】最小方差采样用于图神经网络的快速训练
专知会员服务
27+阅读 · 2020年7月13日
【CVPR2020】用多样性最大化克服单样本NAS中的多模型遗忘
【CVPR2021】细粒度多标签分类
专知
44+阅读 · 2021年3月8日
基于深度学习的多标签生成研究进展
专知
4+阅读 · 2020年4月25日
基于手机系统的实时目标检测
计算机视觉战队
8+阅读 · 2018年12月5日
基于注意力机制的图卷积网络
科技创新与创业
73+阅读 · 2017年11月8日
基于聚类和决策树的链路预测方法
计算机研究与发展
8+阅读 · 2017年8月25日
Arxiv
7+阅读 · 2020年8月7日
Meta-Learning with Implicit Gradients
Arxiv
13+阅读 · 2019年9月10日
Fast AutoAugment
Arxiv
5+阅读 · 2019年5月1日
Multi-Label Learning with Label Enhancement
Arxiv
4+阅读 · 2019年4月16日
Multi-task Deep Reinforcement Learning with PopArt
Arxiv
4+阅读 · 2018年9月12日
VIP会员
相关VIP内容
专知会员服务
15+阅读 · 2021年6月6日
专知会员服务
21+阅读 · 2021年5月14日
专知会员服务
20+阅读 · 2021年5月1日
【CVPR2021】现实世界域泛化的自适应方法
专知会员服务
55+阅读 · 2021年3月31日
专知会员服务
10+阅读 · 2021年3月21日
【KDD2020】最小方差采样用于图神经网络的快速训练
专知会员服务
27+阅读 · 2020年7月13日
【CVPR2020】用多样性最大化克服单样本NAS中的多模型遗忘
相关资讯
【CVPR2021】细粒度多标签分类
专知
44+阅读 · 2021年3月8日
基于深度学习的多标签生成研究进展
专知
4+阅读 · 2020年4月25日
基于手机系统的实时目标检测
计算机视觉战队
8+阅读 · 2018年12月5日
基于注意力机制的图卷积网络
科技创新与创业
73+阅读 · 2017年11月8日
基于聚类和决策树的链路预测方法
计算机研究与发展
8+阅读 · 2017年8月25日
相关论文
微信扫码咨询专知VIP会员