【EMNLP2020】自然语言分类任务的自监督元学习 - 专知VIP

会员服务 ·

0

自监督学习 · 元学习 ·

2020 年 9 月 18 日

【EMNLP2020】自然语言分类任务的自监督元学习

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

Transformer 模型的自监督预训练已经彻底改变了NLP的应用。这种语言建模目标的预训练为参数提供了一个有用的初始化，这些参数可以很好地推广到新的任务中。然而，微调仍然是数据效率低下的——当有标记的例子很少时，准确性可能会很低。数据效率可以通过优化预训练;这可以看作是一个元学习问题。然而，标准的元学习技术需要许多训练任务才能泛化;不幸的是，找到一组不同的这样的监督任务通常是困难的。本文提出了一种自监督的方法，从无标记文本生成一个庞大的，丰富的元学习任务分布。这是使用closize风格的目标实现的，但是通过从少数词汇表术语中收集待删除的标记来创建单独的多类分类任务。这产生的唯一元训练任务与词汇术语子集的数量一样多。我们使用最近的元学习框架对任务分配的transformer模型进行元训练。在17个NLP任务中，我们表明，这种元训练比语言模型前训练后的精细化能产生更好的少样本泛化效果。此外，我们还展示了如何将自监督任务与监督任务结合起来进行元学习，从而比之前的监督元学习获得了更大的准确性。

https://arxiv.org/abs/2009.08445

成为VIP会员查看完整内容

30

相关内容

自监督学习

自监督学习

自监督学习（self-supervised learning）可以被看作是机器学习的一种“理想状态”，模型直接从无标签数据中自行学习，无需标注数据。

【EMNLP2020-CMU&字节跳动】基于预训练语言模型的句子嵌入研究

【EMNLP2020-CMU&字节跳动】基于预训练语言模型的句子嵌入研究

专知会员服务

23+阅读 · 2020年11月14日

【EMNLP2020】低资源域适应的多阶段预训练

专知会员服务

19+阅读 · 2020年10月13日

【ICML2020】基于贝叶斯元学习在关系图上进行小样本关系抽取

【ICML2020】基于贝叶斯元学习在关系图上进行小样本关系抽取

专知会员服务

38+阅读 · 2020年9月5日

【KDD2020-UCLA-微软】GPT-GNN：图神经网络的预训练

【KDD2020-UCLA-微软】GPT-GNN：图神经网络的预训练

专知会员服务

63+阅读 · 2020年8月19日

《小样本元学习》2020最新综述论文

《小样本元学习》2020最新综述论文

专知会员服务

173+阅读 · 2020年7月31日

【ICML2020】统一预训练伪掩码语言模型

【ICML2020】统一预训练伪掩码语言模型

专知会员服务

27+阅读 · 2020年7月23日

【Salesforce】最新《小样本自然语言处理的元学习》综述论文

【Salesforce】最新《小样本自然语言处理的元学习》综述论文

专知会员服务

80+阅读 · 2020年7月21日

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

专知会员服务

246+阅读 · 2020年6月20日

【基于元学习的推荐系统】5篇相关论文

专知会员服务

88+阅读 · 2020年1月20日

【元学习 | 论文】NeuralPS19，多模态模型无关元学习，南加州大学

【元学习 | 论文】NeuralPS19，多模态模型无关元学习，南加州大学

专知会员服务

62+阅读 · 2019年11月21日

【基于元学习的推荐系统】5篇相关论文

【基于元学习的推荐系统】5篇相关论文

专知

11+阅读 · 2020年1月20日

机器也能学会如何学习？——元学习介绍

机器也能学会如何学习？——元学习介绍

AINLP

19+阅读 · 2019年9月22日

开发 | 谷歌更强NLP模型XLNet开源：20项任务全面碾压BERT！

开发 | 谷歌更强NLP模型XLNet开源：20项任务全面碾压BERT！

AI科技评论

6+阅读 · 2019年6月20日

ACL 2019 | 基于知识增强的语言表示模型，多项NLP任务表现超越BERT（附论文解读）

ACL 2019 | 基于知识增强的语言表示模型，多项NLP任务表现超越BERT（附论文解读）

数据派THU

14+阅读 · 2019年6月15日

ACL 2019 | 基于知识增强的语言表示模型，多项NLP任务表现超越BERT

ACL 2019 | 基于知识增强的语言表示模型，多项NLP任务表现超越BERT

PaperWeekly

8+阅读 · 2019年6月3日

Meta-Learning 元学习：学会快速学习

Meta-Learning 元学习：学会快速学习

专知

24+阅读 · 2018年12月8日

BERT 现已开源：最先进的 NLP 预训练技术，支持中文和更多语言

BERT 现已开源：最先进的 NLP 预训练技术，支持中文和更多语言

谷歌开发者

16+阅读 · 2018年11月6日

NLP通用模型诞生？一个模型搞定十大自然语言常见任务

NLP通用模型诞生？一个模型搞定十大自然语言常见任务

人工智能头条

10+阅读 · 2018年6月29日

OpenAI NLP最新进展：通过无监督学习提升语言理解

OpenAI NLP最新进展：通过无监督学习提升语言理解

人工智能头条

6+阅读 · 2018年6月18日

OpenAI提出Reptile：可扩展的元学习算法

OpenAI提出Reptile：可扩展的元学习算法

深度学习世界

7+阅读 · 2018年3月9日

Few-shot Natural Language Generation for Task-Oriented Dialog

Few-shot Natural Language Generation for Task-Oriented Dialog

Arxiv

30+阅读 · 2020年2月27日

Learning to Propagate for Graph Meta-Learning

Arxiv

14+阅读 · 2019年9月11日

Investigating Meta-Learning Algorithms for Low-Resource Natural Language Understanding Tasks

Arxiv

5+阅读 · 2019年8月27日

X-BERT: eXtreme Multi-label Text Classification with BERT

X-BERT: eXtreme Multi-label Text Classification with BERT

Arxiv

12+阅读 · 2019年7月4日

BERTScore: Evaluating Text Generation with BERT

Arxiv

5+阅读 · 2019年4月21日

Meta-Transfer Learning for Few-Shot Learning

Meta-Transfer Learning for Few-Shot Learning

Arxiv

4+阅读 · 2019年4月9日

Paraphrase Generation with Deep Reinforcement Learning

Paraphrase Generation with Deep Reinforcement Learning

Arxiv

4+阅读 · 2018年8月23日

Large Margin Few-Shot Learning

Arxiv

11+阅读 · 2018年7月8日

Phrase-Based & Neural Unsupervised Machine Translation

Arxiv

4+阅读 · 2018年4月20日

Generating Triples with Adversarial Networks for Scene Graph Construction

Arxiv

7+阅读 · 2018年2月7日

VIP会员

相关主题

自监督学习

相关VIP内容

【EMNLP2020-CMU&字节跳动】基于预训练语言模型的句子嵌入研究

【EMNLP2020-CMU&字节跳动】基于预训练语言模型的句子嵌入研究

专知会员服务

23+阅读 · 2020年11月14日

【EMNLP2020】低资源域适应的多阶段预训练

专知会员服务

19+阅读 · 2020年10月13日

【ICML2020】基于贝叶斯元学习在关系图上进行小样本关系抽取

【ICML2020】基于贝叶斯元学习在关系图上进行小样本关系抽取

专知会员服务

38+阅读 · 2020年9月5日

【KDD2020-UCLA-微软】GPT-GNN：图神经网络的预训练

【KDD2020-UCLA-微软】GPT-GNN：图神经网络的预训练

专知会员服务

63+阅读 · 2020年8月19日

《小样本元学习》2020最新综述论文

《小样本元学习》2020最新综述论文

专知会员服务

173+阅读 · 2020年7月31日

【ICML2020】统一预训练伪掩码语言模型

【ICML2020】统一预训练伪掩码语言模型

专知会员服务

27+阅读 · 2020年7月23日

【Salesforce】最新《小样本自然语言处理的元学习》综述论文

【Salesforce】最新《小样本自然语言处理的元学习》综述论文

专知会员服务

80+阅读 · 2020年7月21日

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

专知会员服务

246+阅读 · 2020年6月20日

【基于元学习的推荐系统】5篇相关论文

专知会员服务

88+阅读 · 2020年1月20日

【元学习 | 论文】NeuralPS19，多模态模型无关元学习，南加州大学

【元学习 | 论文】NeuralPS19，多模态模型无关元学习，南加州大学

专知会员服务

62+阅读 · 2019年11月21日

热门VIP内容

开通专知VIP会员享更多权益服务

《美陆军徒步机动作战条令手册》最新168页

【博士论文】基于不确定性的可靠性：现代机器学习中的选择性预测与可信部署

军事后勤数字化未来展望

《美海军后勤体系整合与创新挑战》最新报告

相关资讯

【基于元学习的推荐系统】5篇相关论文

【基于元学习的推荐系统】5篇相关论文

专知

11+阅读 · 2020年1月20日

机器也能学会如何学习？——元学习介绍

机器也能学会如何学习？——元学习介绍

AINLP

19+阅读 · 2019年9月22日

开发 | 谷歌更强NLP模型XLNet开源：20项任务全面碾压BERT！

开发 | 谷歌更强NLP模型XLNet开源：20项任务全面碾压BERT！

AI科技评论

6+阅读 · 2019年6月20日

ACL 2019 | 基于知识增强的语言表示模型，多项NLP任务表现超越BERT（附论文解读）

ACL 2019 | 基于知识增强的语言表示模型，多项NLP任务表现超越BERT（附论文解读）

数据派THU

14+阅读 · 2019年6月15日

ACL 2019 | 基于知识增强的语言表示模型，多项NLP任务表现超越BERT

ACL 2019 | 基于知识增强的语言表示模型，多项NLP任务表现超越BERT

PaperWeekly

8+阅读 · 2019年6月3日

Meta-Learning 元学习：学会快速学习

Meta-Learning 元学习：学会快速学习

专知

24+阅读 · 2018年12月8日

BERT 现已开源：最先进的 NLP 预训练技术，支持中文和更多语言

BERT 现已开源：最先进的 NLP 预训练技术，支持中文和更多语言

谷歌开发者

16+阅读 · 2018年11月6日

NLP通用模型诞生？一个模型搞定十大自然语言常见任务

NLP通用模型诞生？一个模型搞定十大自然语言常见任务

人工智能头条

10+阅读 · 2018年6月29日

OpenAI NLP最新进展：通过无监督学习提升语言理解

OpenAI NLP最新进展：通过无监督学习提升语言理解

人工智能头条

6+阅读 · 2018年6月18日

OpenAI提出Reptile：可扩展的元学习算法

OpenAI提出Reptile：可扩展的元学习算法

深度学习世界

7+阅读 · 2018年3月9日

相关论文

Few-shot Natural Language Generation for Task-Oriented Dialog

Few-shot Natural Language Generation for Task-Oriented Dialog

Arxiv

30+阅读 · 2020年2月27日

Learning to Propagate for Graph Meta-Learning

Arxiv

14+阅读 · 2019年9月11日

Investigating Meta-Learning Algorithms for Low-Resource Natural Language Understanding Tasks

Arxiv

5+阅读 · 2019年8月27日

X-BERT: eXtreme Multi-label Text Classification with BERT

X-BERT: eXtreme Multi-label Text Classification with BERT

Arxiv

12+阅读 · 2019年7月4日

BERTScore: Evaluating Text Generation with BERT

Arxiv

5+阅读 · 2019年4月21日

Meta-Transfer Learning for Few-Shot Learning

Meta-Transfer Learning for Few-Shot Learning

Arxiv

4+阅读 · 2019年4月9日

Paraphrase Generation with Deep Reinforcement Learning

Paraphrase Generation with Deep Reinforcement Learning

Arxiv

4+阅读 · 2018年8月23日

Large Margin Few-Shot Learning

Arxiv

11+阅读 · 2018年7月8日

Phrase-Based & Neural Unsupervised Machine Translation

Arxiv

4+阅读 · 2018年4月20日

Generating Triples with Adversarial Networks for Scene Graph Construction

Arxiv

7+阅读 · 2018年2月7日

微信扫码咨询专知VIP会员