少即是多？非参数语言模型，68页ppt - 专知

会员服务 ·

0

少即是多？非参数语言模型，68页ppt

2020 年 11 月 22 日 专知

原型驱动的文本生成使用非参数模型，该模型首先从句子库中选择“原型”，然后修改原型生成输出文本。这些方法虽然有效，但测试时效率低下，因为需要对整个训练语料库进行存储和索引。此外，现有的方法通常需要启发式来确定在训练时引用哪个原型。在本文中，我们提出了一种新的生成模型，它可以自动学习稀疏原型支持集，同时也可以获得较强的语言建模性能。通过(1)在原型选择分布上施加稀疏诱导先验，(2)利用平摊变分推理学习原型检索函数来实现。在实验中，我们的模型优于以前的原型驱动的语言模型，同时实现了高达1000倍的内存减少，以及测试时1000倍的加速。更有趣的是，当我们改变原型选择的稀疏性时，我们展示了学习的原型能够在不同的粒度捕获语义和语法，并且可以通过指定生成的原型来控制某些句子属性。

https://arxiv.org/abs/2006.16336

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“NPLM” 就可以获取《少即是多？非参数语言模型，68页ppt》专知下载链接

专知，专业可信的人工智能知识分发，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取5000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取5000+AI主题知识资源

登录查看更多

0

相关内容

语言模型

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

专知会员服务

74+阅读 · 2021年1月25日

最新LightGBM进展介绍报告，39页ppt

最新LightGBM进展介绍报告，39页ppt

专知会员服务

31+阅读 · 2021年1月15日

LinkedIn《贝叶斯优化推荐系统》，IJCAI报告，142页ppt

LinkedIn《贝叶斯优化推荐系统》，IJCAI报告，142页ppt

专知会员服务

52+阅读 · 2021年1月11日

最新《弱监督预训练语言模型微调》报告，52页ppt

最新《弱监督预训练语言模型微调》报告，52页ppt

专知会员服务

38+阅读 · 2020年12月26日

【GPT-3作者亲解】超大型语言模型少样本学习，109页ppt

【GPT-3作者亲解】超大型语言模型少样本学习，109页ppt

专知会员服务

109+阅读 · 2020年12月19日

【EMNLP2020】序列知识蒸馏进展，44页ppt

【EMNLP2020】序列知识蒸馏进展，44页ppt

专知会员服务

39+阅读 · 2020年11月21日

最新《文本深度学习模型压缩》综述论文，21页pdf

最新《文本深度学习模型压缩》综述论文，21页pdf

专知会员服务

26+阅读 · 2020年8月19日

【ICML2020】统一预训练伪掩码语言模型

【ICML2020】统一预训练伪掩码语言模型

专知会员服务

27+阅读 · 2020年7月23日

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

专知会员服务

70+阅读 · 2020年7月1日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知会员服务

45+阅读 · 2020年2月12日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知

13+阅读 · 2020年8月9日

【KDD2020】图神经网络生成式预训练

【KDD2020】图神经网络生成式预训练

专知

22+阅读 · 2020年7月3日

【ICML2020】对比多视角表示学习

【ICML2020】对比多视角表示学习

专知

19+阅读 · 2020年6月28日

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

专知

40+阅读 · 2020年6月20日

【斯坦福CS520】向量空间中嵌入的知识图谱推理，48页ppt

【斯坦福CS520】向量空间中嵌入的知识图谱推理，48页ppt

专知

24+阅读 · 2020年6月11日

图神经网络推理，27页ppt精炼讲解

图神经网络推理，27页ppt精炼讲解

专知

3+阅读 · 2020年4月24日

【Amazon】使用预训练Transformer模型进行数据增强

【Amazon】使用预训练Transformer模型进行数据增强

专知

12+阅读 · 2020年3月6日

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning，33页ppt

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning，33页ppt

专知

71+阅读 · 2020年2月29日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知

12+阅读 · 2020年2月12日

Google DeepMind最新报告—深度神经网络压缩进展（附PPT下载）

Google DeepMind最新报告—深度神经网络压缩进展（附PPT下载）

专知

27+阅读 · 2019年4月16日

Proba-V-ref: Repurposing the Proba-V challenge for reference-aware super resolution

Arxiv

0+阅读 · 2021年1月26日

Information-Theoretic Bounds on Transfer Generalization Gap Based on Jensen-Shannon Divergence

Arxiv

0+阅读 · 2021年1月25日

Efficient Transformers: A Survey

Arxiv

23+阅读 · 2020年9月16日

DocBERT: BERT for Document Classification

Arxiv

6+阅读 · 2019年8月22日

How to Fine-Tune BERT for Text Classification?

How to Fine-Tune BERT for Text Classification?

Arxiv

13+阅读 · 2019年5月14日

Star-Transformer

Star-Transformer

Arxiv

5+阅读 · 2019年2月28日

Meta-Transfer Learning for Few-Shot Learning

Meta-Transfer Learning for Few-Shot Learning

Arxiv

8+阅读 · 2018年12月6日

Universal Language Model Fine-tuning for Text Classification

Arxiv

3+阅读 · 2018年5月23日

Composition of PPT Maps

Arxiv

6+阅读 · 2017年12月7日

Net2Net: Accelerating Learning via Knowledge Transfer

Arxiv

3+阅读 · 2016年4月23日

VIP会员

相关主题

非参数模型

相关VIP内容

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

专知会员服务

74+阅读 · 2021年1月25日

最新LightGBM进展介绍报告，39页ppt

最新LightGBM进展介绍报告，39页ppt

专知会员服务

31+阅读 · 2021年1月15日

LinkedIn《贝叶斯优化推荐系统》，IJCAI报告，142页ppt

LinkedIn《贝叶斯优化推荐系统》，IJCAI报告，142页ppt

专知会员服务

52+阅读 · 2021年1月11日

最新《弱监督预训练语言模型微调》报告，52页ppt

最新《弱监督预训练语言模型微调》报告，52页ppt

专知会员服务

38+阅读 · 2020年12月26日

【GPT-3作者亲解】超大型语言模型少样本学习，109页ppt

【GPT-3作者亲解】超大型语言模型少样本学习，109页ppt

专知会员服务

109+阅读 · 2020年12月19日

【EMNLP2020】序列知识蒸馏进展，44页ppt

【EMNLP2020】序列知识蒸馏进展，44页ppt

专知会员服务

39+阅读 · 2020年11月21日

最新《文本深度学习模型压缩》综述论文，21页pdf

最新《文本深度学习模型压缩》综述论文，21页pdf

专知会员服务

26+阅读 · 2020年8月19日

【ICML2020】统一预训练伪掩码语言模型

【ICML2020】统一预训练伪掩码语言模型

专知会员服务

27+阅读 · 2020年7月23日

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

专知会员服务

70+阅读 · 2020年7月1日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知会员服务

45+阅读 · 2020年2月12日

热门VIP内容

开通专知VIP会员享更多权益服务

美陆军2025.4最新条令《地面装备战损评估、修复与回收作业规范》138页

《战略战备风险管理：概念、实践、数据分析与实施路径》美智库最新65页

国防领域边缘计算：将智能推向行动前沿

《多机器人系统协作效能提升：基于模型与数据驱动的具身智能方法》339页

相关资讯

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知

13+阅读 · 2020年8月9日

【KDD2020】图神经网络生成式预训练

【KDD2020】图神经网络生成式预训练

专知

22+阅读 · 2020年7月3日

【ICML2020】对比多视角表示学习

【ICML2020】对比多视角表示学习

专知

19+阅读 · 2020年6月28日

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

专知

40+阅读 · 2020年6月20日

【斯坦福CS520】向量空间中嵌入的知识图谱推理，48页ppt

【斯坦福CS520】向量空间中嵌入的知识图谱推理，48页ppt

专知

24+阅读 · 2020年6月11日

图神经网络推理，27页ppt精炼讲解

图神经网络推理，27页ppt精炼讲解

专知

3+阅读 · 2020年4月24日

【Amazon】使用预训练Transformer模型进行数据增强

【Amazon】使用预训练Transformer模型进行数据增强

专知

12+阅读 · 2020年3月6日

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning，33页ppt

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning，33页ppt

专知

71+阅读 · 2020年2月29日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知

12+阅读 · 2020年2月12日

Google DeepMind最新报告—深度神经网络压缩进展（附PPT下载）

Google DeepMind最新报告—深度神经网络压缩进展（附PPT下载）

专知

27+阅读 · 2019年4月16日

相关论文

Proba-V-ref: Repurposing the Proba-V challenge for reference-aware super resolution

Arxiv

0+阅读 · 2021年1月26日

Information-Theoretic Bounds on Transfer Generalization Gap Based on Jensen-Shannon Divergence

Arxiv

0+阅读 · 2021年1月25日

Efficient Transformers: A Survey

Arxiv

23+阅读 · 2020年9月16日

DocBERT: BERT for Document Classification

Arxiv

6+阅读 · 2019年8月22日

How to Fine-Tune BERT for Text Classification?

How to Fine-Tune BERT for Text Classification?

Arxiv

13+阅读 · 2019年5月14日

Star-Transformer

Star-Transformer

Arxiv

5+阅读 · 2019年2月28日

Meta-Transfer Learning for Few-Shot Learning

Meta-Transfer Learning for Few-Shot Learning

Arxiv

8+阅读 · 2018年12月6日

Universal Language Model Fine-tuning for Text Classification

Arxiv

3+阅读 · 2018年5月23日

Composition of PPT Maps

Arxiv

6+阅读 · 2017年12月7日

Net2Net: Accelerating Learning via Knowledge Transfer

Arxiv

3+阅读 · 2016年4月23日

大家都在搜

大型语言模型

斯坦福博士论文

城市绿色交通发展评价指标体系和方法研究

微信扫码咨询专知VIP会员