【纽约大学Sean】神经文本退化:一致性和学习，93页ppt - 专知

会员服务 ·

0

【纽约大学Sean】神经文本退化:一致性和学习，93页ppt

2020 年 10 月 18 日 专知

Sean Welleck是纽约大学的博士生，他的顾问是Kyunghyun Cho和Zheng Zhang。他的研究兴趣包括深度学习和结构预测，以及在自然语言处理中的应用。他曾在Facebook人工智能研究公司(AI research)担任实习生，由杰森·韦斯顿(Jason Weston)担任顾问。他在宾夕法尼亚大学获得了理学学士和理学硕士学位。他的研究成果发表在ICML、NeurIPS、ICLR和ACL上，包括两项Nvidia AI实验室开拓性研究奖。

神经文本退化:一致性和学习

用最大似然估计训练的神经序列模型已经成为建模和生成文本的标准方法。然而，最近的研究发现了这些模型的问题。在这次谈话中，我们研究了在实践中出现的最大似然学习的退化性质，激发了新的学习方法。我们使用在生成文本中观察到的三个特性来描述简并性:非终止性、逻辑不连贯性和重复性。为了研究非终止性，我们发展了一个理论，允许我们正式证明传统的文本生成方法可以生成具有高概率的无限长序列。为了减少这三种类型的退化，我们开发了两种学习算法:非似然训练(惩罚特定任务的文本属性)和最大似然引导参数搜索(直接优化序列级损失)。

https://europe.naverlabs.com/research/seminars/neural-text-degeneration-consistency-and-learning/

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“NTD93” 可以获取《【纽约大学Sean】神经文本退化:一致性和学习，93页ppt》专知下载链接索引

专知，专业可信的人工智能知识分发，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取5000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取5000+AI主题知识资源

登录查看更多

1

相关内容

神经文本退化

神经文本退化

最新《域自适应视觉应用》ECCV2020教程，43页PPT

最新《域自适应视觉应用》ECCV2020教程，43页PPT

专知会员服务

27+阅读 · 2020年11月5日

最新必读的六篇「知识图谱表示学习KGRL」2020顶会论文和代码

最新必读的六篇「知识图谱表示学习KGRL」2020顶会论文和代码

专知会员服务

67+阅读 · 2020年7月17日

最新《生成式对抗网络》简介，25页ppt

最新《生成式对抗网络》简介，25页ppt

专知会员服务

175+阅读 · 2020年6月28日

模型优化基础，Sayak Paul，67页ppt

模型优化基础，Sayak Paul，67页ppt

专知会员服务

76+阅读 · 2020年6月8日

少标签数据学习，54页ppt

少标签数据学习，54页ppt

专知会员服务

203+阅读 · 2020年5月22日

深度学习自然语言处理概述，216页ppt，Jindřich Helcl

深度学习自然语言处理概述，216页ppt，Jindřich Helcl

专知会员服务

216+阅读 · 2020年4月26日

Yann Lecun 纽约大学《深度学习(PyTorch)》课程(2020）PPT

Yann Lecun 纽约大学《深度学习(PyTorch)》课程(2020）PPT

专知会员服务

183+阅读 · 2020年3月16日

AAAI2020最新「图神经网络GNN模型与应用」305页ppt，密歇根州立大学

AAAI2020最新「图神经网络GNN模型与应用」305页ppt，密歇根州立大学

专知会员服务

345+阅读 · 2020年2月7日

【EMNLP2019教程】端到端学习对话人工智能，附237页PPT下载

【EMNLP2019教程】端到端学习对话人工智能，附237页PPT下载

专知会员服务

70+阅读 · 2019年11月25日

【EMNLP2019Keynote报告】神经序列模型， Neural Sequence Models，63页ppt

【EMNLP2019Keynote报告】神经序列模型， Neural Sequence Models，63页ppt

专知会员服务

27+阅读 · 2019年11月10日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知

13+阅读 · 2020年8月9日

如何进行贝叶深度学习？纽约大学Andrew博士视频讲解《贝叶斯深度学习与概率模型构建》134页ppt

如何进行贝叶深度学习？纽约大学Andrew博士视频讲解《贝叶斯深度学习与概率模型构建》134页ppt

专知

8+阅读 · 2020年7月30日

【ICML2020-Tutorial】无标签表示学习，222页ppt，DeepMind

【ICML2020-Tutorial】无标签表示学习，222页ppt，DeepMind

专知

30+阅读 · 2020年7月14日

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

专知

40+阅读 · 2020年6月20日

知识图谱推理，50页ppt，Salesforce首席科学家Richard Socher

知识图谱推理，50页ppt，Salesforce首席科学家Richard Socher

专知

10+阅读 · 2020年6月10日

普林斯顿大学陈丹琦主讲COS484: 自然语言处理课程

普林斯顿大学陈丹琦主讲COS484: 自然语言处理课程

专知

6+阅读 · 2019年12月11日

【EMNLP2019教程】端到端学习对话人工智能，附237页PPT下载

【EMNLP2019教程】端到端学习对话人工智能，附237页PPT下载

专知

26+阅读 · 2019年11月20日

用GANs来自动生成音乐【代码+PPT】

用GANs来自动生成音乐【代码+PPT】

专知

28+阅读 · 2019年11月7日

VLDB2019特邀报告《图处理》综述进展，滑铁卢大学数据库大牛M. Tamer Özsu教授，170页ppt

VLDB2019特邀报告《图处理》综述进展，滑铁卢大学数据库大牛M. Tamer Özsu教授，170页ppt

专知

9+阅读 · 2019年9月1日

西湖大学张岳：自然语言处理中的多任务联合学习（384页PPT）

西湖大学张岳：自然语言处理中的多任务联合学习（384页PPT）

专知

21+阅读 · 2018年11月20日

Regularised Least-Squares Regression with Infinite-Dimensional Output Space

Arxiv

0+阅读 · 2020年12月3日

Gaussian Process Regression with Local Explanation

Arxiv

0+阅读 · 2020年12月2日

FairFaceGAN: Fairness-aware Facial Image-to-Image Translation

Arxiv

0+阅读 · 2020年12月2日

The massive modular Hamiltonian

Arxiv

0+阅读 · 2020年12月1日

A monolithic divergence-conforming HDG scheme for a linear fluid-structure interaction model

Arxiv

0+阅读 · 2020年11月30日

Hawkes processes as competing hazards models and a simulation algorithm

Arxiv

0+阅读 · 2020年11月30日

Detecting Sparse Heterogeneous Mixtures in a Two-Sample Problem

Arxiv

0+阅读 · 2020年11月26日

Language GANs Falling Short

Arxiv

7+阅读 · 2018年11月6日

One-Shot Relational Learning for Knowledge Graphs

Arxiv

3+阅读 · 2018年8月27日

Exploring Models and Data for Remote Sensing Image Caption Generation

Arxiv

14+阅读 · 2017年12月21日

VIP会员

相关主题

神经文本退化

神经序列模型

最大似然估计

相关VIP内容

最新《域自适应视觉应用》ECCV2020教程，43页PPT

最新《域自适应视觉应用》ECCV2020教程，43页PPT

专知会员服务

27+阅读 · 2020年11月5日

最新必读的六篇「知识图谱表示学习KGRL」2020顶会论文和代码

最新必读的六篇「知识图谱表示学习KGRL」2020顶会论文和代码

专知会员服务

67+阅读 · 2020年7月17日

最新《生成式对抗网络》简介，25页ppt

最新《生成式对抗网络》简介，25页ppt

专知会员服务

175+阅读 · 2020年6月28日

模型优化基础，Sayak Paul，67页ppt

模型优化基础，Sayak Paul，67页ppt

专知会员服务

76+阅读 · 2020年6月8日

少标签数据学习，54页ppt

少标签数据学习，54页ppt

专知会员服务

203+阅读 · 2020年5月22日

深度学习自然语言处理概述，216页ppt，Jindřich Helcl

深度学习自然语言处理概述，216页ppt，Jindřich Helcl

专知会员服务

216+阅读 · 2020年4月26日

Yann Lecun 纽约大学《深度学习(PyTorch)》课程(2020）PPT

Yann Lecun 纽约大学《深度学习(PyTorch)》课程(2020）PPT

专知会员服务

183+阅读 · 2020年3月16日

AAAI2020最新「图神经网络GNN模型与应用」305页ppt，密歇根州立大学

AAAI2020最新「图神经网络GNN模型与应用」305页ppt，密歇根州立大学

专知会员服务

345+阅读 · 2020年2月7日

【EMNLP2019教程】端到端学习对话人工智能，附237页PPT下载

【EMNLP2019教程】端到端学习对话人工智能，附237页PPT下载

专知会员服务

70+阅读 · 2019年11月25日

【EMNLP2019Keynote报告】神经序列模型， Neural Sequence Models，63页ppt

【EMNLP2019Keynote报告】神经序列模型， Neural Sequence Models，63页ppt

专知会员服务

27+阅读 · 2019年11月10日

热门VIP内容

开通专知VIP会员享更多权益服务

《人与智能体在系统工程建模语言V2任务中的性能表现：基于用户中心化的评估方法》308页

《数据安全国家标准体系（2025版）》征求意见稿

AlphaMosaic：人工智能赋能的作战管理系统

《军事行动中通信平台的战略价值：提升战术效能与作战优势》

相关资讯

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知

13+阅读 · 2020年8月9日

如何进行贝叶深度学习？纽约大学Andrew博士视频讲解《贝叶斯深度学习与概率模型构建》134页ppt

如何进行贝叶深度学习？纽约大学Andrew博士视频讲解《贝叶斯深度学习与概率模型构建》134页ppt

专知

8+阅读 · 2020年7月30日

【ICML2020-Tutorial】无标签表示学习，222页ppt，DeepMind

【ICML2020-Tutorial】无标签表示学习，222页ppt，DeepMind

专知

30+阅读 · 2020年7月14日

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

专知

40+阅读 · 2020年6月20日

知识图谱推理，50页ppt，Salesforce首席科学家Richard Socher

知识图谱推理，50页ppt，Salesforce首席科学家Richard Socher

专知

10+阅读 · 2020年6月10日

普林斯顿大学陈丹琦主讲COS484: 自然语言处理课程

普林斯顿大学陈丹琦主讲COS484: 自然语言处理课程

专知

6+阅读 · 2019年12月11日

【EMNLP2019教程】端到端学习对话人工智能，附237页PPT下载

【EMNLP2019教程】端到端学习对话人工智能，附237页PPT下载

专知

26+阅读 · 2019年11月20日

用GANs来自动生成音乐【代码+PPT】

用GANs来自动生成音乐【代码+PPT】

专知

28+阅读 · 2019年11月7日

VLDB2019特邀报告《图处理》综述进展，滑铁卢大学数据库大牛M. Tamer Özsu教授，170页ppt

VLDB2019特邀报告《图处理》综述进展，滑铁卢大学数据库大牛M. Tamer Özsu教授，170页ppt

专知

9+阅读 · 2019年9月1日

西湖大学张岳：自然语言处理中的多任务联合学习（384页PPT）

西湖大学张岳：自然语言处理中的多任务联合学习（384页PPT）

专知

21+阅读 · 2018年11月20日

相关论文

Regularised Least-Squares Regression with Infinite-Dimensional Output Space

Arxiv

0+阅读 · 2020年12月3日

Gaussian Process Regression with Local Explanation

Arxiv

0+阅读 · 2020年12月2日

FairFaceGAN: Fairness-aware Facial Image-to-Image Translation

Arxiv

0+阅读 · 2020年12月2日

The massive modular Hamiltonian

Arxiv

0+阅读 · 2020年12月1日

A monolithic divergence-conforming HDG scheme for a linear fluid-structure interaction model

Arxiv

0+阅读 · 2020年11月30日

Hawkes processes as competing hazards models and a simulation algorithm

Arxiv

0+阅读 · 2020年11月30日

Detecting Sparse Heterogeneous Mixtures in a Two-Sample Problem

Arxiv

0+阅读 · 2020年11月26日

Language GANs Falling Short

Arxiv

7+阅读 · 2018年11月6日

One-Shot Relational Learning for Knowledge Graphs

Arxiv

3+阅读 · 2018年8月27日

Exploring Models and Data for Remote Sensing Image Caption Generation

Arxiv

14+阅读 · 2017年12月21日

大家都在搜

CMU博士论文

无人机集群

久别重逢话双塔

国防科技创新

无人机航拍交通事故现场勘查处置系统——行业第一的警用事故处理软件

微信扫码咨询专知VIP会员