Artificial neural networks thrive in solving the classification problem for a particular rigid task, acquiring knowledge through generalized learning behaviour from a distinct training phase. The resulting network resembles a static entity of knowledge, with endeavours to extend this knowledge without targeting the original task resulting in a catastrophic forgetting. Continual learning shifts this paradigm towards networks that can continually accumulate knowledge over different tasks without the need to retrain from scratch. We focus on task incremental classification, where tasks arrive sequentially and are delineated by clear boundaries. Our main contributions concern 1) a taxonomy and extensive overview of the state-of-the-art, 2) a novel framework to continually determine the stability-plasticity trade-off of the continual learner, 3) a comprehensive experimental comparison of 11 state-of-the-art continual learning methods and 4 baselines. We empirically scrutinize method strengths and weaknesses on three benchmarks, considering Tiny Imagenet and large-scale unbalanced iNaturalist and a sequence of recognition datasets. We study the influence of model capacity, weight decay and dropout regularization, and the order in which the tasks are presented, and qualitatively compare methods in terms of required memory, computation time, and storage.


翻译:人造神经网络在解决特定僵硬任务的分类问题方面蓬勃发展,在不同的培训阶段通过普遍学习行为获得知识。由此形成的网络类似于一个静态的知识实体,努力扩展这种知识,而没有针对最初的任务,导致灾难性的遗忘。持续学习将这一范式转向能够不断积累不同任务的知识而无需从零开始重新培训的网络。我们注重任务递增分类,任务按顺序到达,并按明确的界限划分。我们的主要贡献涉及:(1) 分类和广泛概述最新技术,(2) 一个不断确定持续学习者稳定-固定性交换的新框架,(3) 对11个最先进的持续学习方法和4个基线进行全面的实验性比较。我们从经验上审视三个基准的优点和弱点,考虑小图像网和大规模不平衡的饱和表以及识别数据集的顺序。我们研究了模型能力、重量衰减和辍学调整的影响,以及任务的排列顺序,以及所需记忆、计算时间和储存的质量比较方法。

32
下载
关闭预览

相关内容

让 iOS 8 和 OS X Yosemite 无缝切换的一个新特性。 > Apple products have always been designed to work together beautifully. But now they may really surprise you. With iOS 8 and OS X Yosemite, you’ll be able to do more wonderful things than ever before.

Source: Apple - iOS 8
多标签学习的新趋势(2020 Survey)
专知会员服务
41+阅读 · 2020年12月6日
【CMU】最新深度学习课程, Introduction to Deep Learning
专知会员服务
36+阅读 · 2020年9月12日
Stabilizing Transformers for Reinforcement Learning
专知会员服务
56+阅读 · 2019年10月17日
多任务学习(Multi-task Learning)方法总结
极市平台
6+阅读 · 2020年4月26日
【论文笔记】通俗理解少样本文本分类 (Few-Shot Text Classification) (1)
深度学习自然语言处理
7+阅读 · 2020年4月8日
强化学习三篇论文 避免遗忘等
CreateAMind
19+阅读 · 2019年5月24日
Hierarchically Structured Meta-learning
CreateAMind
23+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
25+阅读 · 2019年5月18日
小样本学习(Few-shot Learning)综述
机器之心
18+阅读 · 2019年4月1日
Unsupervised Learning via Meta-Learning
CreateAMind
41+阅读 · 2019年1月3日
meta learning 17年:MAML SNAIL
CreateAMind
11+阅读 · 2019年1月2日
Hierarchical Imitation - Reinforcement Learning
CreateAMind
19+阅读 · 2018年5月25日
Arxiv
54+阅读 · 2021年5月3日
Arxiv
24+阅读 · 2021年1月25日
Arxiv
14+阅读 · 2020年10月26日
Learning from Few Samples: A Survey
Arxiv
77+阅读 · 2020年7月30日
Attentive Graph Neural Networks for Few-Shot Learning
Arxiv
40+阅读 · 2020年7月14日
Continual Unsupervised Representation Learning
Arxiv
7+阅读 · 2019年10月31日
Arxiv
18+阅读 · 2019年1月16日
Arxiv
6+阅读 · 2018年12月10日
VIP会员
相关资讯
多任务学习(Multi-task Learning)方法总结
极市平台
6+阅读 · 2020年4月26日
【论文笔记】通俗理解少样本文本分类 (Few-Shot Text Classification) (1)
深度学习自然语言处理
7+阅读 · 2020年4月8日
强化学习三篇论文 避免遗忘等
CreateAMind
19+阅读 · 2019年5月24日
Hierarchically Structured Meta-learning
CreateAMind
23+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
25+阅读 · 2019年5月18日
小样本学习(Few-shot Learning)综述
机器之心
18+阅读 · 2019年4月1日
Unsupervised Learning via Meta-Learning
CreateAMind
41+阅读 · 2019年1月3日
meta learning 17年:MAML SNAIL
CreateAMind
11+阅读 · 2019年1月2日
Hierarchical Imitation - Reinforcement Learning
CreateAMind
19+阅读 · 2018年5月25日
相关论文
Arxiv
54+阅读 · 2021年5月3日
Arxiv
24+阅读 · 2021年1月25日
Arxiv
14+阅读 · 2020年10月26日
Learning from Few Samples: A Survey
Arxiv
77+阅读 · 2020年7月30日
Attentive Graph Neural Networks for Few-Shot Learning
Arxiv
40+阅读 · 2020年7月14日
Continual Unsupervised Representation Learning
Arxiv
7+阅读 · 2019年10月31日
Arxiv
18+阅读 · 2019年1月16日
Arxiv
6+阅读 · 2018年12月10日
Top
微信扫码咨询专知VIP会员