元增强提示调整：更好的少样本学习 (Meta-augmented Prompt Tuning for Better Few-shot Learning) - 专知论文

会员服务 ·

0

样本 · 提示学习 · 初始化 · 少样本学习 · 拟合 ·

2023 年 3 月 28 日

Meta-augmented Prompt Tuning for Better Few-shot Learning

翻译：元增强提示调整：更好的少样本学习

Kaihang Pan,Juncheng Li,Hongye Song,Jun Lin,Xiaozhong Liu,Siliang Tang

Prompt tuning is a parameter-efficient method, which freezes all PLM parameters and only prepends some additional tunable tokens called soft prompts to the input text. However, soft prompts heavily rely on a better initialization and may easily result in overfitting under few-shot settings, which causes prompt-tuning performing much worse than fine-tuning. To address the above issues, this paper proposes a novel Self-sUpervised Meta-prompt learning framework with MEtagradient Regularization for few shot generalization (SUMMER). We leverage self-supervised meta-learning to better initialize soft prompts and curriculum-based task augmentation is further proposed to enrich the meta-task distribution. Besides, a novel meta-gradient regularization method is integrated into the meta-prompt learning framework, which meta-learns to transform the raw gradient during few-shot learning into a domain-generalizable direction, thus alleviating the problem of overfitting. Extensive experiments show that SUMMER achieves better performance for different few-shot downstream tasks, and also exhibits a stronger domain generalization ability.

翻译：提示调整是一种参数高效的方法，它将所有PLM参数固定，仅在输入文本前添加一些附加的可调节标记，称为软提示。然而，软提示在很大程度上依赖于更好的初始化，并且在少样本设置下很容易导致过拟合，这导致提示调整比微调表现得更差。为了解决上述问题，本文提出了一种新颖的自监督元提示学习框架，其中包含MEtagradient正则化，用于少样本泛化（SUMMER）。我们利用自监督元学习更好地初始化软提示，并进一步提出基于课程的任务增强来丰富元任务分布。此外，新颖的元梯度正则化方法集成到元提示学习框架中，元学习将原始梯度转化为通用域方向，从而缓解过拟合问题。广泛的实验表明，SUMMER在不同的少样本下游任务中实现了更好的性能，并且还展现出更强的域泛化能力。

0

相关内容

【ICML2023】调整语言模型作为增强少样本学习的训练数据生成器

【ICML2023】调整语言模型作为增强少样本学习的训练数据生成器

专知会员服务

32+阅读 · 2023年5月19日

ChatAug: 利用ChatGPT进行文本数据增强

ChatAug: 利用ChatGPT进行文本数据增强

专知会员服务

81+阅读 · 2023年3月4日

【CVPR 2022】视觉提示调整（VPT），Vision Prompt Tuning

【CVPR 2022】视觉提示调整（VPT），Vision Prompt Tuning

专知会员服务

32+阅读 · 2022年3月12日

【CIKM2021】超链接预训练信息检索

专知会员服务

17+阅读 · 2021年8月24日

【WSDM 2021】面向信息检索的预训练语言模型

专知会员服务

36+阅读 · 2020年11月29日

【CIKM2020】研究和减轻图卷积网络中度相关的偏差

专知会员服务

19+阅读 · 2020年9月11日

近期必读的七篇 ECCV 2020【少样本学习（FSL）】相关论文

近期必读的七篇 ECCV 2020【少样本学习（FSL）】相关论文

专知会员服务

44+阅读 · 2020年9月1日

注意力图神经网络的小样本学习

注意力图神经网络的小样本学习

专知会员服务

192+阅读 · 2020年7月16日

100+篇《自监督学习(Self-Supervised Learning)》论文最新合集

100+篇《自监督学习(Self-Supervised Learning)》论文最新合集

专知会员服务

165+阅读 · 2020年3月18日

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning

专知会员服务

159+阅读 · 2020年2月29日

举一反三：示例增强的（example augmented）自然语言处理

举一反三：示例增强的（example augmented）自然语言处理

RUC AI Box

1+阅读 · 2022年5月13日

强化学习三篇论文避免遗忘等

强化学习三篇论文避免遗忘等

CreateAMind

20+阅读 · 2019年5月24日

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

Transferring Knowledge across Learning Processes

Transferring Knowledge across Learning Processes

CreateAMind

29+阅读 · 2019年5月18日

强化学习的Unsupervised Meta-Learning

强化学习的Unsupervised Meta-Learning

CreateAMind

18+阅读 · 2019年1月7日

无监督元学习表示学习

无监督元学习表示学习

CreateAMind

27+阅读 · 2019年1月4日

Unsupervised Learning via Meta-Learning

Unsupervised Learning via Meta-Learning

CreateAMind

43+阅读 · 2019年1月3日

【SIGIR2018】五篇对抗训练文章

【SIGIR2018】五篇对抗训练文章

专知

12+阅读 · 2018年7月9日

【论文推荐】最新八篇生成对抗网络相关论文—BRE、图像合成、多模态图像生成、非配对多域图、注意力、对抗特征增强、深度对抗性训练

【论文推荐】最新八篇生成对抗网络相关论文—BRE、图像合成、多模态图像生成、非配对多域图、注意力、对抗特征增强、深度对抗性训练

专知

16+阅读 · 2018年5月14日

【论文推荐】最新6篇生成式对抗网络（GAN）相关论文—半监督对抗学习、行人再识别、代表性特征、高分辨率深度卷积、自监督、超分辨

【论文推荐】最新6篇生成式对抗网络（GAN）相关论文—半监督对抗学习、行人再识别、代表性特征、高分辨率深度卷积、自监督、超分辨

专知

10+阅读 · 2018年2月1日

肝素酶1通过血管生成相关分子介导宫颈癌辐射抵抗的作用及机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于PPARγ节点双向调控探寻葛根芩连汤改善脂肪胰岛素抵抗的分子网络机制

国家自然科学基金

0+阅读 · 2014年12月31日

SPARC对脾脏边缘带B细胞功能的调节作用及机理研究

国家自然科学基金

0+阅读 · 2014年12月31日

用于细胞内超氧自由基含量检测的新型稀土配位聚合物荧光探针的设计合成

国家自然科学基金

0+阅读 · 2014年12月31日

基于静息态和任务态的脑网络连接性fMRI研究运动想象训练促进皮层下脑卒中患者功能恢复的作用机制

国家自然科学基金

0+阅读 · 2013年12月31日

不同基因型（p53codon72）鼻咽癌细胞放射敏感性差异的机制研究

国家自然科学基金

0+阅读 · 2012年12月31日

溶瘤新城疫病毒通过自噬效应杀伤耐药肺癌细胞的分子机制及应用

国家自然科学基金

0+阅读 · 2012年12月31日

穴位不同针刺方式促进脑卒中手功能恢复的神经影像学评价

国家自然科学基金

0+阅读 · 2011年12月31日

基于合成样本和MCE准则下判别学习的汉字手写文本识别研究

国家自然科学基金

0+阅读 · 2009年12月31日

汉族和维吾尔族遗传性乳腺癌BRCA基因检测及临床相关研究

国家自然科学基金

0+阅读 · 2009年12月31日

Efficient Prompting via Dynamic In-Context Learning

Arxiv

0+阅读 · 2023年5月18日

Learning to Generalize for Cross-domain QA

Arxiv

0+阅读 · 2023年5月18日

Data Augmentation for Diverse Voice Conversion in Noisy Environments

Arxiv

0+阅读 · 2023年5月18日

Rethinking Data Augmentation for Tabular Data in Deep Learning

Arxiv

0+阅读 · 2023年5月17日

Self-Prompting Large Language Models for Zero-Shot Open-Domain QA

Arxiv

0+阅读 · 2023年5月16日

Prompt Distribution Learning

Arxiv

14+阅读 · 2022年5月6日

Conditional Prompt Learning for Vision-Language Models

Conditional Prompt Learning for Vision-Language Models

Arxiv

13+阅读 · 2022年3月10日

MetAug: Contrastive Learning via Meta Feature Augmentation

Arxiv

10+阅读 · 2022年3月10日

Attribute-Guided Adversarial Training for Robustness to Natural Perturbations

Arxiv

15+阅读 · 2020年12月3日

Data Augmentation for Graph Neural Networks

Arxiv

38+阅读 · 2020年12月2日

VIP会员

文章信息

相关主题

少样本学习

相关VIP内容

【ICML2023】调整语言模型作为增强少样本学习的训练数据生成器

【ICML2023】调整语言模型作为增强少样本学习的训练数据生成器

专知会员服务

32+阅读 · 2023年5月19日

ChatAug: 利用ChatGPT进行文本数据增强

ChatAug: 利用ChatGPT进行文本数据增强

专知会员服务

81+阅读 · 2023年3月4日

【CVPR 2022】视觉提示调整（VPT），Vision Prompt Tuning

【CVPR 2022】视觉提示调整（VPT），Vision Prompt Tuning

专知会员服务

32+阅读 · 2022年3月12日

【CIKM2021】超链接预训练信息检索

专知会员服务

17+阅读 · 2021年8月24日

【WSDM 2021】面向信息检索的预训练语言模型

专知会员服务

36+阅读 · 2020年11月29日

【CIKM2020】研究和减轻图卷积网络中度相关的偏差

专知会员服务

19+阅读 · 2020年9月11日

近期必读的七篇 ECCV 2020【少样本学习（FSL）】相关论文

近期必读的七篇 ECCV 2020【少样本学习（FSL）】相关论文

专知会员服务

44+阅读 · 2020年9月1日

注意力图神经网络的小样本学习

注意力图神经网络的小样本学习

专知会员服务

192+阅读 · 2020年7月16日

100+篇《自监督学习(Self-Supervised Learning)》论文最新合集

100+篇《自监督学习(Self-Supervised Learning)》论文最新合集

专知会员服务

165+阅读 · 2020年3月18日

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning

专知会员服务

159+阅读 · 2020年2月29日

热门VIP内容

开通专知VIP会员享更多权益服务

《生成式人工智能与大/小语言模型在供应链管理决策优化与可持续性提升中的作用评估》最新51页

白宫发布《赢得AI竞赛：美国人工智能行动计划》最新28页

地下战：地下空间的战略博弈

《美地下作战条令手册》228页

相关资讯

举一反三：示例增强的（example augmented）自然语言处理

举一反三：示例增强的（example augmented）自然语言处理

RUC AI Box

1+阅读 · 2022年5月13日

强化学习三篇论文避免遗忘等

强化学习三篇论文避免遗忘等

CreateAMind

20+阅读 · 2019年5月24日

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

Transferring Knowledge across Learning Processes

Transferring Knowledge across Learning Processes

CreateAMind

29+阅读 · 2019年5月18日

强化学习的Unsupervised Meta-Learning

强化学习的Unsupervised Meta-Learning

CreateAMind

18+阅读 · 2019年1月7日

无监督元学习表示学习

无监督元学习表示学习

CreateAMind

27+阅读 · 2019年1月4日

Unsupervised Learning via Meta-Learning

Unsupervised Learning via Meta-Learning

CreateAMind

43+阅读 · 2019年1月3日

【SIGIR2018】五篇对抗训练文章

【SIGIR2018】五篇对抗训练文章

专知

12+阅读 · 2018年7月9日

【论文推荐】最新八篇生成对抗网络相关论文—BRE、图像合成、多模态图像生成、非配对多域图、注意力、对抗特征增强、深度对抗性训练

【论文推荐】最新八篇生成对抗网络相关论文—BRE、图像合成、多模态图像生成、非配对多域图、注意力、对抗特征增强、深度对抗性训练

专知

16+阅读 · 2018年5月14日

【论文推荐】最新6篇生成式对抗网络（GAN）相关论文—半监督对抗学习、行人再识别、代表性特征、高分辨率深度卷积、自监督、超分辨

【论文推荐】最新6篇生成式对抗网络（GAN）相关论文—半监督对抗学习、行人再识别、代表性特征、高分辨率深度卷积、自监督、超分辨

专知

10+阅读 · 2018年2月1日

相关论文

Efficient Prompting via Dynamic In-Context Learning

Arxiv

0+阅读 · 2023年5月18日

Learning to Generalize for Cross-domain QA

Arxiv

0+阅读 · 2023年5月18日

Data Augmentation for Diverse Voice Conversion in Noisy Environments

Arxiv

0+阅读 · 2023年5月18日

Rethinking Data Augmentation for Tabular Data in Deep Learning

Arxiv

0+阅读 · 2023年5月17日

Self-Prompting Large Language Models for Zero-Shot Open-Domain QA

Arxiv

0+阅读 · 2023年5月16日

Prompt Distribution Learning

Arxiv

14+阅读 · 2022年5月6日

Conditional Prompt Learning for Vision-Language Models

Conditional Prompt Learning for Vision-Language Models

Arxiv

13+阅读 · 2022年3月10日

MetAug: Contrastive Learning via Meta Feature Augmentation

Arxiv

10+阅读 · 2022年3月10日

Attribute-Guided Adversarial Training for Robustness to Natural Perturbations

Arxiv

15+阅读 · 2020年12月3日

Data Augmentation for Graph Neural Networks

Arxiv

38+阅读 · 2020年12月2日

相关基金

肝素酶1通过血管生成相关分子介导宫颈癌辐射抵抗的作用及机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于PPARγ节点双向调控探寻葛根芩连汤改善脂肪胰岛素抵抗的分子网络机制

国家自然科学基金

0+阅读 · 2014年12月31日

SPARC对脾脏边缘带B细胞功能的调节作用及机理研究

国家自然科学基金

0+阅读 · 2014年12月31日

用于细胞内超氧自由基含量检测的新型稀土配位聚合物荧光探针的设计合成

国家自然科学基金

0+阅读 · 2014年12月31日

基于静息态和任务态的脑网络连接性fMRI研究运动想象训练促进皮层下脑卒中患者功能恢复的作用机制

国家自然科学基金

0+阅读 · 2013年12月31日

不同基因型（p53codon72）鼻咽癌细胞放射敏感性差异的机制研究

国家自然科学基金

0+阅读 · 2012年12月31日

溶瘤新城疫病毒通过自噬效应杀伤耐药肺癌细胞的分子机制及应用

国家自然科学基金

0+阅读 · 2012年12月31日

穴位不同针刺方式促进脑卒中手功能恢复的神经影像学评价

国家自然科学基金

0+阅读 · 2011年12月31日

基于合成样本和MCE准则下判别学习的汉字手写文本识别研究

国家自然科学基金

0+阅读 · 2009年12月31日

汉族和维吾尔族遗传性乳腺癌BRCA基因检测及临床相关研究

国家自然科学基金

0+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员