提示调优综述 - 专知VIP

会员服务 ·

14

提示调优 ·

提示调优综述

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

本综述回顾了提示调优（prompt tuning）这一参数高效的语言模型适配方法。该方法通过在模型输入前添加可训练的连续向量，并保持预训练语言模型本体冻结，从而实现模型在下游任务上的快速适应。我们将现有方法归类为两大类：直接提示学习与迁移学习。 * 直接提示学习方法包括：通用优化策略、基于编码器的方法、分解策略，以及专家混合框架（mixture-of-experts frameworks）。 * 迁移学习方法包括：通用迁移策略、基于编码器的方法，以及分解策略。

对于每类方法，本文从方法设计、创新点、核心洞察、优缺点等方面进行了系统分析，并通过可视化图示比较不同提示调优框架。此外，我们识别出该领域在计算效率与训练稳定性方面所面临的挑战，并讨论了未来在提升训练鲁棒性与拓展应用范围方向的研究前景。

成为VIP会员查看完整内容

18

相关内容

小型语言模型综述

小型语言模型综述

专知会员服务

53+阅读 · 2024年10月29日

图提示学习最新综述

图提示学习最新综述

专知会员服务

21+阅读 · 2024年8月28日

生成式信息检索综述

生成式信息检索综述

专知会员服务

35+阅读 · 2024年6月5日

基础模型视频理解综述

基础模型视频理解综述

专知会员服务

31+阅读 · 2024年5月8日

《图持续学习》综述

《图持续学习》综述

专知会员服务

44+阅读 · 2024年2月13日

对比自监督学习

对比自监督学习

深度学习自然语言处理

35+阅读 · 2020年7月15日

【SIGIR2020-清华】知识图谱上的增强推荐推理

【SIGIR2020-清华】知识图谱上的增强推荐推理

专知

15+阅读 · 2020年5月30日

PointNet系列论文解读

PointNet系列论文解读

人工智能前沿讲习班

17+阅读 · 2019年5月3日

Attention！注意力机制模型最新综述

Attention！注意力机制模型最新综述

专知

65+阅读 · 2019年4月8日

深度学习超参数搜索实用指南

深度学习超参数搜索实用指南

云栖社区

28+阅读 · 2018年10月14日

组合测试用例优先排序算法及选择策略研究

国家自然科学基金

8+阅读 · 2015年12月31日

最小化加权完工时间和的在线排序研究

国家自然科学基金

0+阅读 · 2015年12月31日

高维数据下的模型平均方法

国家自然科学基金

6+阅读 · 2014年12月31日

复杂多元数据的半参数统计推断

国家自然科学基金

5+阅读 · 2014年12月31日

观测反馈能稳的控制系统的最佳结构参数

国家自然科学基金

0+阅读 · 2014年12月31日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

86+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

494+阅读 · 2023年3月31日

Nature Language Reasoning, A Survey

Arxiv

81+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

180+阅读 · 2023年3月24日

Data-centric Artificial Intelligence: A Survey

Arxiv

25+阅读 · 2023年3月17日

VIP会员

相关主题

相关VIP内容

小型语言模型综述

小型语言模型综述

专知会员服务

53+阅读 · 2024年10月29日

图提示学习最新综述

图提示学习最新综述

专知会员服务

21+阅读 · 2024年8月28日

生成式信息检索综述

生成式信息检索综述

专知会员服务

35+阅读 · 2024年6月5日

基础模型视频理解综述

基础模型视频理解综述

专知会员服务

31+阅读 · 2024年5月8日

《图持续学习》综述

《图持续学习》综述

专知会员服务

44+阅读 · 2024年2月13日

热门VIP内容

开通专知VIP会员享更多权益服务

美海军作战管理系统：变革战场空间的二十年

《任务与武器驱动美海军舰队设计》报告

俄罗斯“沙希德”/“天竺葵”攻击无人机

《利用动态图对网络攻击进行建模与仿真：在云安全评估中的应用》90页

相关资讯

对比自监督学习

对比自监督学习

深度学习自然语言处理

35+阅读 · 2020年7月15日

【SIGIR2020-清华】知识图谱上的增强推荐推理

【SIGIR2020-清华】知识图谱上的增强推荐推理

专知

15+阅读 · 2020年5月30日

PointNet系列论文解读

PointNet系列论文解读

人工智能前沿讲习班

17+阅读 · 2019年5月3日

Attention！注意力机制模型最新综述

Attention！注意力机制模型最新综述

专知

65+阅读 · 2019年4月8日

深度学习超参数搜索实用指南

深度学习超参数搜索实用指南

云栖社区

28+阅读 · 2018年10月14日

相关基金

组合测试用例优先排序算法及选择策略研究

国家自然科学基金

8+阅读 · 2015年12月31日

最小化加权完工时间和的在线排序研究

国家自然科学基金

0+阅读 · 2015年12月31日

高维数据下的模型平均方法

国家自然科学基金

6+阅读 · 2014年12月31日

复杂多元数据的半参数统计推断

国家自然科学基金

5+阅读 · 2014年12月31日

观测反馈能稳的控制系统的最佳结构参数

国家自然科学基金

0+阅读 · 2014年12月31日

相关论文

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

86+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

494+阅读 · 2023年3月31日

Nature Language Reasoning, A Survey

Arxiv

81+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

180+阅读 · 2023年3月24日

Data-centric Artificial Intelligence: A Survey

Arxiv

25+阅读 · 2023年3月17日

微信扫码咨询专知VIP会员