【AAAI2023】类增量学习的在线超参数优化 - 专知VIP

会员服务 ·

10

AAAI 2023 · 类增量学习 · 超参数优化 ·

2023 年 1 月 18 日

【AAAI2023】类增量学习的在线超参数优化

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

类增量学习(class incremental learning, CIL)旨在在类别数量逐步增加的情况下训练分类模型。CIL模型面临的一个内在挑战是稳定性与可塑性的权衡，即CIL模型既要保持稳定性以保留旧知识，又要保持可塑性以吸收新知识。然而，现有的CIL模型都不能在不同的数据接收设置中实现最佳权衡——通常，从一半开始训练(TFH)设置需要更大的稳定性，但从头开始训练(TFS)需要更大的可塑性**。设计了一种在线学习方法，可以在不知道先验设置的情况下自适应地优化权衡。**首先引入了影响权衡的关键超参数，例如知识蒸馏(KD)损失权重、学习率和分类器类型。然后，将超参数优化过程建模为一个在线马尔可夫决策过程(MDP)问题，并提出了一种具体的算法来求解该问题。本文采用局部估计奖励和经典bandit算法Exp3[4]来解决将在线MDP方法应用于CIL协议时存在的问题。所提出方法在TFH和TFS设置中不断改进表现最好的CIL方法，例如，与最先进的[23]相比，在ImageNet-Full上将TFH和TFS的平均精度提高了2.2个百分点。

https://www.zhuanzhi.ai/paper/1aa5db12a9fd06a275ad0b6e89be62bb

成为VIP会员查看完整内容

20

相关内容

AAAI 2023

什么是类增量学习？南京大学最新《深度类增量学习》综述论文，30页pdf涵盖249篇文献

什么是类增量学习？南京大学最新《深度类增量学习》综述论文，30页pdf涵盖249篇文献

专知会员服务

38+阅读 · 2023年2月10日

【CMU博士论文】黑盒和多目标优化策略，151页pdf

【CMU博士论文】黑盒和多目标优化策略，151页pdf

专知会员服务

52+阅读 · 2022年11月24日

【AAAI2022】多任务推荐中的跨任务知识提炼

【AAAI2022】多任务推荐中的跨任务知识提炼

专知会员服务

25+阅读 · 2022年2月22日

【AAAI2022】基于秩模仿和预测引导特征模仿的目标检测知识蒸馏

【AAAI2022】基于秩模仿和预测引导特征模仿的目标检测知识蒸馏

专知会员服务

24+阅读 · 2021年12月12日

【NeurIPS 2021】通过元学习优化可重用知识实现持续学习

专知会员服务

23+阅读 · 2021年9月30日

【ICML2021】动量残差神经网络

专知会员服务

31+阅读 · 2021年7月19日

【AAAI2021】记忆门控循环网络

【AAAI2021】记忆门控循环网络

专知会员服务

50+阅读 · 2020年12月28日

【AAAI2021】自校正Q学习，Self-correcting Q-Learning

专知会员服务

17+阅读 · 2020年12月4日

【CVPR 2020 Oral】小样本类增量学习

专知会员服务

112+阅读 · 2020年6月26日

【CMU博士论文】用动态超参数优化改进深度学习训练和推理，Improving Deep Learning Training and Inference with Dynamic Hyperparameter Optimization

【CMU博士论文】用动态超参数优化改进深度学习训练和推理，Improving Deep Learning Training and Inference with Dynamic Hyperparameter Optimization

专知会员服务

55+阅读 · 2020年5月26日

【AAAI2023】图序注意力网络

【AAAI2023】图序注意力网络

专知

6+阅读 · 2022年11月24日

【CMU博士论文】黑盒和多目标优化策略，151页pdf

【CMU博士论文】黑盒和多目标优化策略，151页pdf

专知

13+阅读 · 2022年11月24日

NeurIPS 2022 | 基于精确差异学习的图自监督学习

NeurIPS 2022 | 基于精确差异学习的图自监督学习

PaperWeekly

0+阅读 · 2022年10月22日

【CVPR2022】通过初始阶段的表征去相关性来提升类增量学习

【CVPR2022】通过初始阶段的表征去相关性来提升类增量学习

专知

6+阅读 · 2022年4月25日

【CVPR2022】带噪声标签的少样本学习

【CVPR2022】带噪声标签的少样本学习

专知

1+阅读 · 2022年4月15日

CVPR 2022 | 新加权范式！港理工提出DW：用于目标检测的双加权标签分配方法

CVPR 2022 | 新加权范式！港理工提出DW：用于目标检测的双加权标签分配方法

CVer

1+阅读 · 2022年3月23日

【AAAI2021】对比聚类，Contrastive Clustering

【AAAI2021】对比聚类，Contrastive Clustering

专知

25+阅读 · 2021年1月30日

【CVPR 2020 Oral】小样本类增量学习

【CVPR 2020 Oral】小样本类增量学习

专知

20+阅读 · 2020年6月26日

小样本也能增量学习？CVPR 2020 Oral最新干货：小样本类增量学习

小样本也能增量学习？CVPR 2020 Oral最新干货：小样本类增量学习

CVer

54+阅读 · 2020年5月1日

元学习(Meta-Learning) 综述及五篇顶会论文推荐

元学习(Meta-Learning) 综述及五篇顶会论文推荐

专知

194+阅读 · 2019年4月14日

最小化加权完工时间和的在线排序研究

国家自然科学基金

0+阅读 · 2015年12月31日

分布式有监督学习的学习理论

国家自然科学基金

17+阅读 · 2015年12月31日

e-Learner认知效率建模及自适应调整方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于博弈论的高效稳定聚类算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于非独立同分布样本的统计学习理论研究与应用

国家自然科学基金

0+阅读 · 2014年12月31日

基于在线机器学习的组合算法交易策略研究

国家自然科学基金

5+阅读 · 2013年12月31日

基于在线机器学习的超级计算机主动容错技术研究

国家自然科学基金

1+阅读 · 2012年12月31日

在线和离线折衷排序研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于支持向量机的低复杂度自适应频谱感知方法

国家自然科学基金

0+阅读 · 2011年12月31日

基于感知视觉单词描述的对象分割研究

国家自然科学基金

0+阅读 · 2009年12月31日

Upper Bound of Real Log Canonical Threshold of Tensor Decomposition and its Application to Bayesian Inference

Arxiv

0+阅读 · 2023年3月10日

Cal-QL: Calibrated Offline RL Pre-Training for Efficient Online Fine-Tuning

Arxiv

0+阅读 · 2023年3月9日

ICL-D3IE: In-Context Learning with Diverse Demonstrations Updating for Document Information Extraction

Arxiv

0+阅读 · 2023年3月9日

Agnostic PAC Learning of k-juntas Using L2-Polynomial Regression

Arxiv

0+阅读 · 2023年3月8日

Gradient-Free Structured Pruning with Unlabeled Data

Arxiv

0+阅读 · 2023年3月7日

Mimicking the Oracle: An Initial Phase Decorrelation Approach for Class Incremental Learning

Arxiv

14+阅读 · 2022年3月25日

Contrastive Spatio-Temporal Pretext Learning for Self-supervised Video Representation

Arxiv

11+阅读 · 2021年12月16日

Contrastive Clustering

Arxiv

31+阅读 · 2020年9月21日

Self-training with Noisy Student improves ImageNet classification

Arxiv

15+阅读 · 2019年11月11日

How to train your MAML

Arxiv

26+阅读 · 2019年3月5日

VIP会员

相关主题

类增量学习

超参数优化

相关VIP内容

什么是类增量学习？南京大学最新《深度类增量学习》综述论文，30页pdf涵盖249篇文献

什么是类增量学习？南京大学最新《深度类增量学习》综述论文，30页pdf涵盖249篇文献

专知会员服务

38+阅读 · 2023年2月10日

【CMU博士论文】黑盒和多目标优化策略，151页pdf

【CMU博士论文】黑盒和多目标优化策略，151页pdf

专知会员服务

52+阅读 · 2022年11月24日

【AAAI2022】多任务推荐中的跨任务知识提炼

【AAAI2022】多任务推荐中的跨任务知识提炼

专知会员服务

25+阅读 · 2022年2月22日

【AAAI2022】基于秩模仿和预测引导特征模仿的目标检测知识蒸馏

【AAAI2022】基于秩模仿和预测引导特征模仿的目标检测知识蒸馏

专知会员服务

24+阅读 · 2021年12月12日

【NeurIPS 2021】通过元学习优化可重用知识实现持续学习

专知会员服务

23+阅读 · 2021年9月30日

【ICML2021】动量残差神经网络

专知会员服务

31+阅读 · 2021年7月19日

【AAAI2021】记忆门控循环网络

【AAAI2021】记忆门控循环网络

专知会员服务

50+阅读 · 2020年12月28日

【AAAI2021】自校正Q学习，Self-correcting Q-Learning

专知会员服务

17+阅读 · 2020年12月4日

【CVPR 2020 Oral】小样本类增量学习

专知会员服务

112+阅读 · 2020年6月26日

【CMU博士论文】用动态超参数优化改进深度学习训练和推理，Improving Deep Learning Training and Inference with Dynamic Hyperparameter Optimization

【CMU博士论文】用动态超参数优化改进深度学习训练和推理，Improving Deep Learning Training and Inference with Dynamic Hyperparameter Optimization

专知会员服务

55+阅读 · 2020年5月26日

热门VIP内容

开通专知VIP会员享更多权益服务

【CMU博士论文】数据驱动决策中的激励、信息与不确定性

DGP双粒度提示框架：图增强大模型助力欺诈检测

【ICCV2025】ESSENTIAL：用于视频类增量学习的情景记忆与语义记忆整合

唯快不破：大型语言模型高效架构综述

相关资讯

【AAAI2023】图序注意力网络

【AAAI2023】图序注意力网络

专知

6+阅读 · 2022年11月24日

【CMU博士论文】黑盒和多目标优化策略，151页pdf

【CMU博士论文】黑盒和多目标优化策略，151页pdf

专知

13+阅读 · 2022年11月24日

NeurIPS 2022 | 基于精确差异学习的图自监督学习

NeurIPS 2022 | 基于精确差异学习的图自监督学习

PaperWeekly

0+阅读 · 2022年10月22日

【CVPR2022】通过初始阶段的表征去相关性来提升类增量学习

【CVPR2022】通过初始阶段的表征去相关性来提升类增量学习

专知

6+阅读 · 2022年4月25日

【CVPR2022】带噪声标签的少样本学习

【CVPR2022】带噪声标签的少样本学习

专知

1+阅读 · 2022年4月15日

CVPR 2022 | 新加权范式！港理工提出DW：用于目标检测的双加权标签分配方法

CVPR 2022 | 新加权范式！港理工提出DW：用于目标检测的双加权标签分配方法

CVer

1+阅读 · 2022年3月23日

【AAAI2021】对比聚类，Contrastive Clustering

【AAAI2021】对比聚类，Contrastive Clustering

专知

25+阅读 · 2021年1月30日

【CVPR 2020 Oral】小样本类增量学习

【CVPR 2020 Oral】小样本类增量学习

专知

20+阅读 · 2020年6月26日

小样本也能增量学习？CVPR 2020 Oral最新干货：小样本类增量学习

小样本也能增量学习？CVPR 2020 Oral最新干货：小样本类增量学习

CVer

54+阅读 · 2020年5月1日

元学习(Meta-Learning) 综述及五篇顶会论文推荐

元学习(Meta-Learning) 综述及五篇顶会论文推荐

专知

194+阅读 · 2019年4月14日

相关基金

最小化加权完工时间和的在线排序研究

国家自然科学基金

0+阅读 · 2015年12月31日

分布式有监督学习的学习理论

国家自然科学基金

17+阅读 · 2015年12月31日

e-Learner认知效率建模及自适应调整方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于博弈论的高效稳定聚类算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于非独立同分布样本的统计学习理论研究与应用

国家自然科学基金

0+阅读 · 2014年12月31日

基于在线机器学习的组合算法交易策略研究

国家自然科学基金

5+阅读 · 2013年12月31日

基于在线机器学习的超级计算机主动容错技术研究

国家自然科学基金

1+阅读 · 2012年12月31日

在线和离线折衷排序研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于支持向量机的低复杂度自适应频谱感知方法

国家自然科学基金

0+阅读 · 2011年12月31日

基于感知视觉单词描述的对象分割研究

国家自然科学基金

0+阅读 · 2009年12月31日

相关论文

Upper Bound of Real Log Canonical Threshold of Tensor Decomposition and its Application to Bayesian Inference

Arxiv

0+阅读 · 2023年3月10日

Cal-QL: Calibrated Offline RL Pre-Training for Efficient Online Fine-Tuning

Arxiv

0+阅读 · 2023年3月9日

ICL-D3IE: In-Context Learning with Diverse Demonstrations Updating for Document Information Extraction

Arxiv

0+阅读 · 2023年3月9日

Agnostic PAC Learning of k-juntas Using L2-Polynomial Regression

Arxiv

0+阅读 · 2023年3月8日

Gradient-Free Structured Pruning with Unlabeled Data

Arxiv

0+阅读 · 2023年3月7日

Mimicking the Oracle: An Initial Phase Decorrelation Approach for Class Incremental Learning

Arxiv

14+阅读 · 2022年3月25日

Contrastive Spatio-Temporal Pretext Learning for Self-supervised Video Representation

Arxiv

11+阅读 · 2021年12月16日

Contrastive Clustering

Arxiv

31+阅读 · 2020年9月21日

Self-training with Noisy Student improves ImageNet classification

Arxiv

15+阅读 · 2019年11月11日

How to train your MAML

Arxiv

26+阅读 · 2019年3月5日

微信扫码咨询专知VIP会员