随着深度学习技术的发展与应用,特别是资源受限场景和数据安全场景对序列任务和数据进行快速学习需求的增多,持续学习逐渐成为机器学习领域关注的一个新热点. 不同于人类所具备的持续学习和迁移知识的能力,现有深度学习模型在序列学习过程中容易遭受灾难性遗忘的问题. 因此,如何在动态、非平稳的序列任务及流式数据中不断学习新知识、同时保留旧知识是持续学习研究的核心. 首先,通过对近年来持续学习国内外相关工作的调研与总结,将持续学习方法分为基于回放、基于约束、基于结构3大类,并对这3类方法做进一步的细分. 具体而言,根据所使用的样本来源将基于回放的方法细分为采样回放、生成回放、伪样本回放3类;根据训练约束的来源将基于约束的方法细分为参数约束、梯度约束、数据约束3类;根据对于模型结构的使用方式将基于结构的方法细分为参数隔离、模型拓展2类. 通过对比相关工作的创新点,对各类方法的优缺点进行总结. 其次,对国内外研究现状进行分析. 最后,针对持续学习与其他领域相结合的未来发展方向进行展望.

目前,深度学习算法和模型凭借其优异的性能在众多任务和场景中取得巨大的成功,特别是在图像识别[1-3]、自然语言处理[4-6]和视频分析[7-9]等领域,甚至在具体图像分类、实例分割任务上超越了人类的水平[10]. 然而,当面临新任务,特别是分布差异大的序列任务学习时,深度学习模型的表现就难以达到预期,往往会出现迅速破坏之前学到的旧任务知识的现象,即灾难性遗忘(catastrophic forgetting). 造成深度模型2种截然不同表现的原因在于,在传统离线非序列任务场景下,深度模型可以重复不断地交错访问和学习任务数据中的知识直到模型饱和,然而在真实序列或在线场景下,旧任务和数据无法被交错访问和读取,导致旧任务的知识及其关联的模型参数逐渐被新任务和数据擦除和覆盖.

不同于深度模型,人类等高级动物虽然也会逐渐忘记以前学到的信息,但很少有新信息的学习会对巩固的知识造成灾难性的干扰,即人类天生具备序列学习和抵抗灾难性遗忘的能力,并且能够利用旧任务的知识帮助新任务的学习,同时将新任务知识整合进现有知识体系[11-12]. 例如,人类在小时候学会了骑自行车、游泳等技能,即便多年没再实践过,长大后在需要时仍然能够轻易上手,进一步还能帮助其快速学习骑摩托车、其他水上运动等. 换言之,人类具有终生学习的能力,这是目前机器学习和深度学习算法所不具备的. 根据目前生物学和神经科学的发现,人类之所以能够进行持续学习,是因为大脑中存在一套丰富的神经生理学机制能够很好地调控不同脑区的稳定性-可塑性的平衡(stability-plasticity balance)[13-15] , 在早期发育的关键时期,大脑的可塑性特别强,随着生物系统在一系列特定的发育阶段稳定下来,可塑性变得不那么突出,在较小规模上保持一定程度的可塑性,以快速适应环境和重组知识. 此外,互补学习系统理论 (complementary learning systems theory)认为智能主体必须拥有2个学习系统,在哺乳动物的新皮质和海马中实例化. 大脑海马体系统具有短期适应性可以快速学习新的信息和知识,而大脑新皮层系统具有长期保持性,二者互补的特性使得人类认知系统可实现短期学习和长期记忆[16-19]. 因此,受人类认知系统的启发,在机器学习领域,如何有效克服灾难性遗忘,在记忆旧知识的同时通过迁移加快新任务的学习,使得深度模型在序列任务数据中持续不断的学习,即持续学习(continual learning),得到广泛关注和研究,具有重要科学研究价值和应用价值.

成为VIP会员查看完整内容
39

相关内容

基于主动学习的图像分类技术:现状与未来
专知会员服务
35+阅读 · 1月8日
持续学习:研究综述
专知会员服务
76+阅读 · 2023年1月30日
能耗优化的神经网络轻量化方法研究进展
专知会员服务
23+阅读 · 2023年1月29日
「因果机器学习」前沿进展最新综述
专知会员服务
83+阅读 · 2023年1月17日
深度学习在时间序列异常检测中的应用综述
专知会员服务
106+阅读 · 2022年11月11日
结合进化算法的深度强化学习方法研究综述
专知会员服务
78+阅读 · 2022年7月16日
强化学习可解释性基础问题探索和方法综述
专知会员服务
90+阅读 · 2022年1月16日
对抗机器学习在网络入侵检测领域的应用
专知会员服务
33+阅读 · 2022年1月4日
基于深度神经网络的高效视觉识别研究进展与新方向
专知会员服务
38+阅读 · 2021年8月31日
专知会员服务
219+阅读 · 2020年8月1日
「基于通信的多智能体强化学习」 进展综述
综述| 当图神经网络遇上强化学习
图与推荐
29+阅读 · 2022年7月1日
联邦学习安全与隐私保护研究综述
专知
12+阅读 · 2020年8月7日
深度学习模型可解释性的研究进展
专知
25+阅读 · 2020年8月1日
深度学习与医学图像分析
人工智能前沿讲习班
40+阅读 · 2019年6月8日
【优青论文】深度神经网络压缩与加速综述
计算机研究与发展
14+阅读 · 2018年9月20日
孟小峰:机器学习与数据库技术融合
计算机研究与发展
14+阅读 · 2018年9月6日
深度学习时代的目标检测算法
炼数成金订阅号
39+阅读 · 2018年3月19日
深度学习在推荐系统上的应用
架构文摘
13+阅读 · 2018年2月22日
迁移学习在深度学习中的应用
专知
23+阅读 · 2017年12月24日
国家自然科学基金
16+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
25+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
15+阅读 · 2013年12月31日
国家自然科学基金
21+阅读 · 2009年12月31日
Arxiv
157+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
398+阅读 · 2023年3月31日
Arxiv
139+阅读 · 2023年3月24日
Arxiv
20+阅读 · 2023年3月17日
Arxiv
10+阅读 · 2020年11月26日
VIP会员
相关主题
相关VIP内容
基于主动学习的图像分类技术:现状与未来
专知会员服务
35+阅读 · 1月8日
持续学习:研究综述
专知会员服务
76+阅读 · 2023年1月30日
能耗优化的神经网络轻量化方法研究进展
专知会员服务
23+阅读 · 2023年1月29日
「因果机器学习」前沿进展最新综述
专知会员服务
83+阅读 · 2023年1月17日
深度学习在时间序列异常检测中的应用综述
专知会员服务
106+阅读 · 2022年11月11日
结合进化算法的深度强化学习方法研究综述
专知会员服务
78+阅读 · 2022年7月16日
强化学习可解释性基础问题探索和方法综述
专知会员服务
90+阅读 · 2022年1月16日
对抗机器学习在网络入侵检测领域的应用
专知会员服务
33+阅读 · 2022年1月4日
基于深度神经网络的高效视觉识别研究进展与新方向
专知会员服务
38+阅读 · 2021年8月31日
专知会员服务
219+阅读 · 2020年8月1日
相关资讯
「基于通信的多智能体强化学习」 进展综述
综述| 当图神经网络遇上强化学习
图与推荐
29+阅读 · 2022年7月1日
联邦学习安全与隐私保护研究综述
专知
12+阅读 · 2020年8月7日
深度学习模型可解释性的研究进展
专知
25+阅读 · 2020年8月1日
深度学习与医学图像分析
人工智能前沿讲习班
40+阅读 · 2019年6月8日
【优青论文】深度神经网络压缩与加速综述
计算机研究与发展
14+阅读 · 2018年9月20日
孟小峰:机器学习与数据库技术融合
计算机研究与发展
14+阅读 · 2018年9月6日
深度学习时代的目标检测算法
炼数成金订阅号
39+阅读 · 2018年3月19日
深度学习在推荐系统上的应用
架构文摘
13+阅读 · 2018年2月22日
迁移学习在深度学习中的应用
专知
23+阅读 · 2017年12月24日
相关基金
国家自然科学基金
16+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
25+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
15+阅读 · 2013年12月31日
国家自然科学基金
21+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员