【ACL2020-Google】逆向工程配置的神经文本生成模型 - 专知VIP

会员服务 ·

1

ACL 2020 · 逆向工程配置 · 神经文本生成 ·

2020 年 4 月 20 日

【ACL2020-Google】逆向工程配置的神经文本生成模型

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

本文试图对神经文本生成模型的基本性质有更深入的理解。对机器生成文本中由于建模选择而出现的构件的研究是一个新兴的研究领域。在此之前，这些人工制品在生成文本中出现的范围和程度还没有得到很好的研究。为了更好地理解生成文本模型及其构件，我们提出了一项新的任务，即区分给定模型的几个变体中哪个生成了一段文本，我们进行了一系列诊断测试，以观察建模选择(例如，抽样方法、top-k概率、模型架构等)是否在它们生成的文本中留下可检测的构件。我们的关键发现得到了一组严格实验的支持，即存在这样的构件，并且可以通过单独观察生成的文本推断出不同的建模选择。这表明，神经文本生成器对各种建模选择的敏感度可能比之前认为的要高。

成为VIP会员查看完整内容

17

相关内容

ACL 2020

自然语言处理ACL2020最佳论文出炉！微软摘得最佳论文，Bengio论文获时间检验奖

自然语言处理ACL2020最佳论文出炉！微软摘得最佳论文，Bengio论文获时间检验奖

专知会员服务

45+阅读 · 2020年7月9日

【翻译-ACL2020】使用知识库嵌入改进知识图上的多跳问答

【翻译-ACL2020】使用知识库嵌入改进知识图上的多跳问答

专知会员服务

70+阅读 · 2020年7月3日

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

专知会员服务

70+阅读 · 2020年7月1日

【ACL2020-密歇根州立大学】语言和视觉推理的跨模态关联

【ACL2020-密歇根州立大学】语言和视觉推理的跨模态关联

专知会员服务

57+阅读 · 2020年5月14日

【ACL2020-Google】BLEURT:一种基于迁移学习的自然语言生成度量

【ACL2020-Google】BLEURT:一种基于迁移学习的自然语言生成度量

专知会员服务

20+阅读 · 2020年5月12日

【ACL2020-复旦大学NLP】异构图神经网络的文档摘要提取

【ACL2020-复旦大学NLP】异构图神经网络的文档摘要提取

专知会员服务

35+阅读 · 2020年5月1日

【ACL2020】生成事实验证解释，Generating Fact Checking Explanations

【ACL2020】生成事实验证解释，Generating Fact Checking Explanations

专知会员服务

17+阅读 · 2020年4月15日

【ACL2020-Allen AI】预训练语言模型中的无监督域聚类

【ACL2020-Allen AI】预训练语言模型中的无监督域聚类

专知会员服务

24+阅读 · 2020年4月7日

【ICML2020投稿论文-CMU-DeepMind-Google】用于评估跨语言泛化的大规模多语言多任务基准

【ICML2020投稿论文-CMU-DeepMind-Google】用于评估跨语言泛化的大规模多语言多任务基准

专知会员服务

14+阅读 · 2020年3月27日

【Google】无监督机器翻译，Unsupervised Machine Translation

【Google】无监督机器翻译，Unsupervised Machine Translation

专知会员服务

36+阅读 · 2020年3月3日

谷歌最新研究，NLP经典BERT模型进军视频领域，看你和面就知会做蛋糕

谷歌最新研究，NLP经典BERT模型进军视频领域，看你和面就知会做蛋糕

极市平台

4+阅读 · 2019年9月22日

一文详解Google最新NLP模型XLNet

一文详解Google最新NLP模型XLNet

PaperWeekly

18+阅读 · 2019年7月1日

已删除

将门创投

5+阅读 · 2019年4月15日

论文浅尝 | 基于知识库的自然语言理解 01#

论文浅尝 | 基于知识库的自然语言理解 01#

开放知识图谱

15+阅读 · 2019年2月22日

迄今最大模型？OpenAI发布参数量高达15亿的通用语言模型GPT-2

迄今最大模型？OpenAI发布参数量高达15亿的通用语言模型GPT-2

中国人工智能学会

7+阅读 · 2019年2月15日

人类没法下了！DeepMind贝叶斯优化调参AlphaGo，自弈胜率大涨16.5%

人类没法下了！DeepMind贝叶斯优化调参AlphaGo，自弈胜率大涨16.5%

新智元

6+阅读 · 2018年12月21日

Google：数据并行对神经网络训练用时的影响

Google：数据并行对神经网络训练用时的影响

论智

4+阅读 · 2018年11月27日

阅读理解得分超越人类：谷歌推出最强预训练语言理解模型BERT

阅读理解得分超越人类：谷歌推出最强预训练语言理解模型BERT

DeepTech深科技

5+阅读 · 2018年10月14日

【学界】ECCV 2018：对抗深度学习: 鱼 (模型准确性) 与熊掌 (模型鲁棒性) 能否兼得？

【学界】ECCV 2018：对抗深度学习: 鱼 (模型准确性) 与熊掌 (模型鲁棒性) 能否兼得？

GAN生成式对抗网络

9+阅读 · 2018年8月21日

推荐｜机器学习中的模型评价、模型选择和算法选择！

推荐｜机器学习中的模型评价、模型选择和算法选择！

全球人工智能

10+阅读 · 2018年2月5日

Do NLP Models Know Numbers? Probing Numeracy in Embeddings

Arxiv

5+阅读 · 2019年9月17日

The Effect of Network Width on Stochastic Gradient Descent and Generalization: an Empirical Study

The Effect of Network Width on Stochastic Gradient Descent and Generalization: an Empirical Study

Arxiv

4+阅读 · 2019年5月9日

Universal Transformers

Universal Transformers

Arxiv

5+阅读 · 2019年3月5日

The Evolved Transformer

The Evolved Transformer

Arxiv

5+阅读 · 2019年1月30日

Hypernetwork Knowledge Graph Embeddings

Arxiv

9+阅读 · 2018年10月18日

Unsupervised Multilingual Word Embeddings

Arxiv

4+阅读 · 2018年9月6日

Evaluating and Understanding the Robustness of Adversarial Logit Pairing

Arxiv

8+阅读 · 2018年7月26日

A Study on Overfitting in Deep Reinforcement Learning

Arxiv

7+阅读 · 2018年4月20日

Audio Adversarial Examples: Targeted Attacks on Speech-to-Text

Arxiv

18+阅读 · 2018年1月5日

Long-Term Visual Object Tracking Benchmark

Arxiv

7+阅读 · 2017年12月28日

VIP会员

相关主题

逆向工程配置

神经文本生成

相关VIP内容

自然语言处理ACL2020最佳论文出炉！微软摘得最佳论文，Bengio论文获时间检验奖

自然语言处理ACL2020最佳论文出炉！微软摘得最佳论文，Bengio论文获时间检验奖

专知会员服务

45+阅读 · 2020年7月9日

【翻译-ACL2020】使用知识库嵌入改进知识图上的多跳问答

【翻译-ACL2020】使用知识库嵌入改进知识图上的多跳问答

专知会员服务

70+阅读 · 2020年7月3日

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

专知会员服务

70+阅读 · 2020年7月1日

【ACL2020-密歇根州立大学】语言和视觉推理的跨模态关联

【ACL2020-密歇根州立大学】语言和视觉推理的跨模态关联

专知会员服务

57+阅读 · 2020年5月14日

【ACL2020-Google】BLEURT:一种基于迁移学习的自然语言生成度量

【ACL2020-Google】BLEURT:一种基于迁移学习的自然语言生成度量

专知会员服务

20+阅读 · 2020年5月12日

【ACL2020-复旦大学NLP】异构图神经网络的文档摘要提取

【ACL2020-复旦大学NLP】异构图神经网络的文档摘要提取

专知会员服务

35+阅读 · 2020年5月1日

【ACL2020】生成事实验证解释，Generating Fact Checking Explanations

【ACL2020】生成事实验证解释，Generating Fact Checking Explanations

专知会员服务

17+阅读 · 2020年4月15日

【ACL2020-Allen AI】预训练语言模型中的无监督域聚类

【ACL2020-Allen AI】预训练语言模型中的无监督域聚类

专知会员服务

24+阅读 · 2020年4月7日

【ICML2020投稿论文-CMU-DeepMind-Google】用于评估跨语言泛化的大规模多语言多任务基准

【ICML2020投稿论文-CMU-DeepMind-Google】用于评估跨语言泛化的大规模多语言多任务基准

专知会员服务

14+阅读 · 2020年3月27日

【Google】无监督机器翻译，Unsupervised Machine Translation

【Google】无监督机器翻译，Unsupervised Machine Translation

专知会员服务

36+阅读 · 2020年3月3日

热门VIP内容

开通专知VIP会员享更多权益服务

《美陆军徒步机动作战条令手册》最新168页

【博士论文】基于不确定性的可靠性：现代机器学习中的选择性预测与可信部署

军事后勤数字化未来展望

《美海军后勤体系整合与创新挑战》最新报告

相关资讯

谷歌最新研究，NLP经典BERT模型进军视频领域，看你和面就知会做蛋糕

谷歌最新研究，NLP经典BERT模型进军视频领域，看你和面就知会做蛋糕

极市平台

4+阅读 · 2019年9月22日

一文详解Google最新NLP模型XLNet

一文详解Google最新NLP模型XLNet

PaperWeekly

18+阅读 · 2019年7月1日

已删除

将门创投

5+阅读 · 2019年4月15日

论文浅尝 | 基于知识库的自然语言理解 01#

论文浅尝 | 基于知识库的自然语言理解 01#

开放知识图谱

15+阅读 · 2019年2月22日

迄今最大模型？OpenAI发布参数量高达15亿的通用语言模型GPT-2

迄今最大模型？OpenAI发布参数量高达15亿的通用语言模型GPT-2

中国人工智能学会

7+阅读 · 2019年2月15日

人类没法下了！DeepMind贝叶斯优化调参AlphaGo，自弈胜率大涨16.5%

人类没法下了！DeepMind贝叶斯优化调参AlphaGo，自弈胜率大涨16.5%

新智元

6+阅读 · 2018年12月21日

Google：数据并行对神经网络训练用时的影响

Google：数据并行对神经网络训练用时的影响

论智

4+阅读 · 2018年11月27日

阅读理解得分超越人类：谷歌推出最强预训练语言理解模型BERT

阅读理解得分超越人类：谷歌推出最强预训练语言理解模型BERT

DeepTech深科技

5+阅读 · 2018年10月14日

【学界】ECCV 2018：对抗深度学习: 鱼 (模型准确性) 与熊掌 (模型鲁棒性) 能否兼得？

【学界】ECCV 2018：对抗深度学习: 鱼 (模型准确性) 与熊掌 (模型鲁棒性) 能否兼得？

GAN生成式对抗网络

9+阅读 · 2018年8月21日

推荐｜机器学习中的模型评价、模型选择和算法选择！

推荐｜机器学习中的模型评价、模型选择和算法选择！

全球人工智能

10+阅读 · 2018年2月5日

相关论文

Do NLP Models Know Numbers? Probing Numeracy in Embeddings

Arxiv

5+阅读 · 2019年9月17日

The Effect of Network Width on Stochastic Gradient Descent and Generalization: an Empirical Study

The Effect of Network Width on Stochastic Gradient Descent and Generalization: an Empirical Study

Arxiv

4+阅读 · 2019年5月9日

Universal Transformers

Universal Transformers

Arxiv

5+阅读 · 2019年3月5日

The Evolved Transformer

The Evolved Transformer

Arxiv

5+阅读 · 2019年1月30日

Hypernetwork Knowledge Graph Embeddings

Arxiv

9+阅读 · 2018年10月18日

Unsupervised Multilingual Word Embeddings

Arxiv

4+阅读 · 2018年9月6日

Evaluating and Understanding the Robustness of Adversarial Logit Pairing

Arxiv

8+阅读 · 2018年7月26日

A Study on Overfitting in Deep Reinforcement Learning

Arxiv

7+阅读 · 2018年4月20日

Audio Adversarial Examples: Targeted Attacks on Speech-to-Text

Arxiv

18+阅读 · 2018年1月5日

Long-Term Visual Object Tracking Benchmark

Arxiv

7+阅读 · 2017年12月28日

微信扫码咨询专知VIP会员