【ICML2023】基于自然语言指令的受控文本生成 - 专知VIP

会员服务 ·

15

ICML 2023 · 自然语言指令 · 文本生成 ·

2023 年 4 月 28 日

【ICML2023】基于自然语言指令的受控文本生成

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

大型语言模型可以生成流畅的文本，并可以按照自然语言指令解决各种任务，而无需特定任务的训练。然而，要控制它们的生成以满足不同应用所需的各种约束条件是非常困难的。在这项工作中，我们提出了INSTRUCTCTG，这是一个受控文本生成框架，它通过依据约束条件的自然语言描述和演示来结合不同的约束条件。特别地，我们首先通过一组现成的自然语言处理工具和简单的启发式方法来提取自然文本中的潜在约束条件。然后，我们将这些约束条件转化为自然语言指令，以形成弱监督的训练数据。通过在输入之前添加约束条件的自然语言描述和一些演示，我们微调了一个预训练的语言模型，以包括各种类型的约束条件。与现有的基于搜索或基于评分的方法相比，INSTRUCTCTG 对不同类型的约束条件更加灵活，并且对生成质量和速度的影响要小得多，因为它不修改解码过程。此外，INSTRUCTCTG 还允许模型通过使用指令调整的语言模型的少量样本任务泛化和上下文学习能力来适应新的约束条件而无需重新训练。代码将在 https://github. com/MichaelZhouwang/InstructCTG 上提供。

成为VIP会员查看完整内容

29

相关内容

ICML 2023

国际机器学习大会(International Conference on Machine Learning，简称ICML ) 是由国际机器学习学会（IMLS）主办的机器学习国际顶级会议。 2023年7月23日至29日周六在夏威夷会议中心举行。

【ICML2023】POUF:面向提示的大型预训练模型无监督微调

【ICML2023】POUF:面向提示的大型预训练模型无监督微调

专知会员服务

39+阅读 · 2023年5月18日

【ICML2023】BLIP-2:基于冻结图像编码器和大型语言模型的Bootstrapping语言-图像预训练

【ICML2023】BLIP-2:基于冻结图像编码器和大型语言模型的Bootstrapping语言-图像预训练

专知会员服务

30+阅读 · 2023年5月1日

【CVPR2023】基于文本到图像扩散模型的开放词汇全景分割

【CVPR2023】基于文本到图像扩散模型的开放词汇全景分割

专知会员服务

25+阅读 · 2023年3月12日

【CVPR2023】提示、生成、然后缓存:基础模型的级联生成强大的少样本学习器

【CVPR2023】提示、生成、然后缓存:基础模型的级联生成强大的少样本学习器

专知会员服务

37+阅读 · 2023年3月8日

【CVPR2023】I2MVFormer:大语言模型生成的多视图文档监督零样本图像分类

【CVPR2023】I2MVFormer:大语言模型生成的多视图文档监督零样本图像分类

专知会员服务

21+阅读 · 2023年3月1日

基于预训练语言模型的文本生成研究综述

专知会员服务

82+阅读 · 2021年10月15日

人大最新《基于Transformer 的视频语言预训练》综述论文

人大最新《基于Transformer 的视频语言预训练》综述论文

专知会员服务

47+阅读 · 2021年9月27日

【ICML2021】通过文本生成统一视觉和语言任务

专知会员服务

19+阅读 · 2021年9月13日

知识增强的文本生成研究进展

知识增强的文本生成研究进展

专知会员服务

100+阅读 · 2021年3月6日

【ACL2020】对抗性文本生成，Improving Adversarial Text Generation

专知会员服务

52+阅读 · 2020年5月5日

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

专知

17+阅读 · 2023年4月12日

从此告别繁琐的模型微调，LLM-Adapters助力NLP任务快速高效微调！

从此告别繁琐的模型微调，LLM-Adapters助力NLP任务快速高效微调！

PaperWeekly

2+阅读 · 2023年4月6日

7 Papers & Radios | 谷歌推出DreamBooth扩散模型；张益唐零点猜想论文出炉

7 Papers & Radios | 谷歌推出DreamBooth扩散模型；张益唐零点猜想论文出炉

机器之心

2+阅读 · 2022年11月13日

CLUE社区最新神器！PromptCLUE：大规模多任务Prompt预训练中文开源模型

CLUE社区最新神器！PromptCLUE：大规模多任务Prompt预训练中文开源模型

新智元

0+阅读 · 2022年10月30日

扩散模型在文本生成领域的应用

扩散模型在文本生成领域的应用

新智元

0+阅读 · 2022年10月13日

NAACL 2022 | 基于Prompt的文本生成迁移学习

NAACL 2022 | 基于Prompt的文本生成迁移学习

PaperWeekly

1+阅读 · 2022年8月31日

自然语言生成资源列表

自然语言生成资源列表

专知

17+阅读 · 2020年1月4日

多项NLP任务新SOTA，Facebook提出预训练模型BART

多项NLP任务新SOTA，Facebook提出预训练模型BART

机器之心

22+阅读 · 2019年11月4日

论文浅尝 | 利用图 Transformer 实现基于知识图谱的文本生成

论文浅尝 | 利用图 Transformer 实现基于知识图谱的文本生成

开放知识图谱

52+阅读 · 2019年9月1日

ACL 2019 | 基于知识增强的语言表示模型，多项NLP任务表现超越BERT（附论文解读）

ACL 2019 | 基于知识增强的语言表示模型，多项NLP任务表现超越BERT（附论文解读）

数据派THU

14+阅读 · 2019年6月15日

带有伸缩器和饱和器的模糊自适应控制设计方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于深度学习的交通环境理解与目标检测方法研究

国家自然科学基金

2+阅读 · 2013年12月31日

环境与任务诱导的模块化机器人协进化理论与控制基础

国家自然科学基金

0+阅读 · 2012年12月31日

多层服装动画方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

仿人机器人步态规划的测地线方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

概率依赖增益机制下基于随机发生不完全信息的非线性随机控制与滤波

国家自然科学基金

0+阅读 · 2012年12月31日

上下文感知的Web服务自适应计算模型研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于运动状态约束的平面欠驱动机械系统控制方法

国家自然科学基金

0+阅读 · 2012年12月31日

应急任务生成的决策机制与管理支持方法研究

国家自然科学基金

4+阅读 · 2009年12月31日

句子语义的视觉表示研究

国家自然科学基金

4+阅读 · 2009年12月31日

Explaining CLIP through Co-Creative Drawings and Interaction

Arxiv

0+阅读 · 2023年6月12日

Generating Language Corrections for Teaching Physical Control Tasks

Arxiv

0+阅读 · 2023年6月12日

Backdooring Neural Code Search

Arxiv

0+阅读 · 2023年6月12日

Diffusion Self-Guidance for Controllable Image Generation

Arxiv

0+阅读 · 2023年6月11日

Language Instructed Reinforcement Learning for Human-AI Coordination

Arxiv

0+阅读 · 2023年6月10日

Towards a Robust Detection of Language Model Generated Text: Is ChatGPT that Easy to Detect?

Arxiv

0+阅读 · 2023年6月9日

How to Backdoor Diffusion Models?

Arxiv

0+阅读 · 2023年6月9日

A Survey on Masked Autoencoder for Self-supervised Learning in Vision and Beyond

Arxiv

10+阅读 · 2022年7月30日

Pre-Training with Whole Word Masking for Chinese BERT

Arxiv

11+阅读 · 2019年6月19日

Fine-tune BERT for Extractive Summarization

Arxiv

21+阅读 · 2019年3月25日

VIP会员

相关主题

自然语言指令

相关VIP内容

【ICML2023】POUF:面向提示的大型预训练模型无监督微调

【ICML2023】POUF:面向提示的大型预训练模型无监督微调

专知会员服务

39+阅读 · 2023年5月18日

【ICML2023】BLIP-2:基于冻结图像编码器和大型语言模型的Bootstrapping语言-图像预训练

【ICML2023】BLIP-2:基于冻结图像编码器和大型语言模型的Bootstrapping语言-图像预训练

专知会员服务

30+阅读 · 2023年5月1日

【CVPR2023】基于文本到图像扩散模型的开放词汇全景分割

【CVPR2023】基于文本到图像扩散模型的开放词汇全景分割

专知会员服务

25+阅读 · 2023年3月12日

【CVPR2023】提示、生成、然后缓存:基础模型的级联生成强大的少样本学习器

【CVPR2023】提示、生成、然后缓存:基础模型的级联生成强大的少样本学习器

专知会员服务

37+阅读 · 2023年3月8日

【CVPR2023】I2MVFormer:大语言模型生成的多视图文档监督零样本图像分类

【CVPR2023】I2MVFormer:大语言模型生成的多视图文档监督零样本图像分类

专知会员服务

21+阅读 · 2023年3月1日

基于预训练语言模型的文本生成研究综述

专知会员服务

82+阅读 · 2021年10月15日

人大最新《基于Transformer 的视频语言预训练》综述论文

人大最新《基于Transformer 的视频语言预训练》综述论文

专知会员服务

47+阅读 · 2021年9月27日

【ICML2021】通过文本生成统一视觉和语言任务

专知会员服务

19+阅读 · 2021年9月13日

知识增强的文本生成研究进展

知识增强的文本生成研究进展

专知会员服务

100+阅读 · 2021年3月6日

【ACL2020】对抗性文本生成，Improving Adversarial Text Generation

专知会员服务

52+阅读 · 2020年5月5日

热门VIP内容

开通专知VIP会员享更多权益服务

《多域空战指挥体系：驾驭复杂性的艺术》

构建军事人工智能信任体系始于破除黑盒机制

《生态建模密码破译：建模与编程实践》美陆军最新报告

《战争形态演变：合成兵种防御主导模式探析》48页slides

相关资讯

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

专知

17+阅读 · 2023年4月12日

从此告别繁琐的模型微调，LLM-Adapters助力NLP任务快速高效微调！

从此告别繁琐的模型微调，LLM-Adapters助力NLP任务快速高效微调！

PaperWeekly

2+阅读 · 2023年4月6日

7 Papers & Radios | 谷歌推出DreamBooth扩散模型；张益唐零点猜想论文出炉

7 Papers & Radios | 谷歌推出DreamBooth扩散模型；张益唐零点猜想论文出炉

机器之心

2+阅读 · 2022年11月13日

CLUE社区最新神器！PromptCLUE：大规模多任务Prompt预训练中文开源模型

CLUE社区最新神器！PromptCLUE：大规模多任务Prompt预训练中文开源模型

新智元

0+阅读 · 2022年10月30日

扩散模型在文本生成领域的应用

扩散模型在文本生成领域的应用

新智元

0+阅读 · 2022年10月13日

NAACL 2022 | 基于Prompt的文本生成迁移学习

NAACL 2022 | 基于Prompt的文本生成迁移学习

PaperWeekly

1+阅读 · 2022年8月31日

自然语言生成资源列表

自然语言生成资源列表

专知

17+阅读 · 2020年1月4日

多项NLP任务新SOTA，Facebook提出预训练模型BART

多项NLP任务新SOTA，Facebook提出预训练模型BART

机器之心

22+阅读 · 2019年11月4日

论文浅尝 | 利用图 Transformer 实现基于知识图谱的文本生成

论文浅尝 | 利用图 Transformer 实现基于知识图谱的文本生成

开放知识图谱

52+阅读 · 2019年9月1日

ACL 2019 | 基于知识增强的语言表示模型，多项NLP任务表现超越BERT（附论文解读）

ACL 2019 | 基于知识增强的语言表示模型，多项NLP任务表现超越BERT（附论文解读）

数据派THU

14+阅读 · 2019年6月15日

相关基金

带有伸缩器和饱和器的模糊自适应控制设计方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于深度学习的交通环境理解与目标检测方法研究

国家自然科学基金

2+阅读 · 2013年12月31日

环境与任务诱导的模块化机器人协进化理论与控制基础

国家自然科学基金

0+阅读 · 2012年12月31日

多层服装动画方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

仿人机器人步态规划的测地线方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

概率依赖增益机制下基于随机发生不完全信息的非线性随机控制与滤波

国家自然科学基金

0+阅读 · 2012年12月31日

上下文感知的Web服务自适应计算模型研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于运动状态约束的平面欠驱动机械系统控制方法

国家自然科学基金

0+阅读 · 2012年12月31日

应急任务生成的决策机制与管理支持方法研究

国家自然科学基金

4+阅读 · 2009年12月31日

句子语义的视觉表示研究

国家自然科学基金

4+阅读 · 2009年12月31日

相关论文

Explaining CLIP through Co-Creative Drawings and Interaction

Arxiv

0+阅读 · 2023年6月12日

Generating Language Corrections for Teaching Physical Control Tasks

Arxiv

0+阅读 · 2023年6月12日

Backdooring Neural Code Search

Arxiv

0+阅读 · 2023年6月12日

Diffusion Self-Guidance for Controllable Image Generation

Arxiv

0+阅读 · 2023年6月11日

Language Instructed Reinforcement Learning for Human-AI Coordination

Arxiv

0+阅读 · 2023年6月10日

Towards a Robust Detection of Language Model Generated Text: Is ChatGPT that Easy to Detect?

Arxiv

0+阅读 · 2023年6月9日

How to Backdoor Diffusion Models?

Arxiv

0+阅读 · 2023年6月9日

A Survey on Masked Autoencoder for Self-supervised Learning in Vision and Beyond

Arxiv

10+阅读 · 2022年7月30日

Pre-Training with Whole Word Masking for Chinese BERT

Arxiv

11+阅读 · 2019年6月19日

Fine-tune BERT for Extractive Summarization

Arxiv

21+阅读 · 2019年3月25日

微信扫码咨询专知VIP会员