【CAAI 2019】XLNet and Beyond，杨植麟，联合创始人，循环智能（Recurrent AI） - 专知VIP

会员服务 ·

0

BERT · XLNet（广义自回归预训练方法） · 卡内基梅隆大学 (Carnegie Mellon University) · 杨植麟 · 机器学习 ·

2019 年 12 月 4 日

【CAAI 2019】XLNet and Beyond，杨植麟，联合创始人，循环智能（Recurrent AI）

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

题目：

XLNet and Beyond

摘要：

我们提出XLNet，一个广义自回归预训练方法，（1）通过在分解次序的所有排列上最大化期望的可能性，使得学习双向上下文，并且（2）由于其自回归公式克服了伯特的限制。从经验来看，XLNet在20项任务上的表现都优于BERT，而且往往有很大的差距。此外，我们还将讨论类似XLNet的方法在实际应用中实现NLP工业化的重要性。

个人简介：

杨植麟，循环智能（Recurrent AI）的联合创始人。曾效力于Facebook AI Research和Google Brain，与多名图灵奖得主合作发表论文，其研究成果在三十余项标准任务取得state-of-the-art，是XLNet第一作者。本科毕业于清华大学，博士毕业于卡内基梅隆大学。

成为VIP会员查看完整内容

14

相关内容

BERT

BERT全称Bidirectional Encoder Representations from Transformers，是预训练语言表示的方法，可以在大型文本语料库（如维基百科）上训练通用的“语言理解”模型，然后将该模型用于下游NLP任务，比如机器翻译、问答。

【DeepMind硬核课】深度学习注意力与记忆机制，附70页ppt与视频

【DeepMind硬核课】深度学习注意力与记忆机制，附70页ppt与视频

专知会员服务

172+阅读 · 2020年6月25日

【DeepMind深度学习课程】序列循环神经网络，141页ppt，Sequences and Recurrent Network

【DeepMind深度学习课程】序列循环神经网络，141页ppt，Sequences and Recurrent Network

专知会员服务

86+阅读 · 2020年6月23日

基于多头注意力胶囊网络的文本分类模型

基于多头注意力胶囊网络的文本分类模型

专知会员服务

78+阅读 · 2020年5月24日

【北京大学】动态异构图神经网络建模情感，Jointly Modeling Aspect and Sentiment with Dynamic Heterogeneous Graph Neural Networks

【北京大学】动态异构图神经网络建模情感，Jointly Modeling Aspect and Sentiment with Dynamic Heterogeneous Graph Neural Networks

专知会员服务

55+阅读 · 2020年4月15日

【微软&CMU】后向特征校正，深度学习如何深度学习？Backward Feature Correction: How Deep Learning Performs Deep Learning

专知会员服务

13+阅读 · 2020年1月18日

【华盛顿大学】知识建模+生成式推理，60页ppt，Cracking Commonsense Intelligence with Knowledge Modeling + Generative Reasoning

【华盛顿大学】知识建模+生成式推理，60页ppt，Cracking Commonsense Intelligence with Knowledge Modeling + Generative Reasoning

专知会员服务

54+阅读 · 2019年12月27日

【CCL 2019】社会媒体处理前沿综述，哈尔滨工业大学助理研究员丁效

【CCL 2019】社会媒体处理前沿综述，哈尔滨工业大学助理研究员丁效

专知会员服务

42+阅读 · 2019年11月12日

【EMNLP2019Keynote报告】神经序列模型， Neural Sequence Models，63页ppt

【EMNLP2019Keynote报告】神经序列模型， Neural Sequence Models，63页ppt

专知会员服务

27+阅读 · 2019年11月10日

知识图谱与语义理解，百度研究院王海峰院长，CCKS-2019：知识智能

知识图谱与语义理解，百度研究院王海峰院长，CCKS-2019：知识智能

专知会员服务

60+阅读 · 2019年10月25日

方面级别情感分析方法研究，深圳先进技术研究院助理研究员杨敏，第八届全国社会媒体处理大会SMP2019

方面级别情感分析方法研究，深圳先进技术研究院助理研究员杨敏，第八届全国社会媒体处理大会SMP2019

专知会员服务

57+阅读 · 2019年10月22日

已删除

将门创投

4+阅读 · 2019年9月10日

20项任务全面碾压BERT，全新XLNet预训练模型

20项任务全面碾压BERT，全新XLNet预训练模型

机器学习算法与Python学习

15+阅读 · 2019年6月20日

谷歌更强 NLP 模型 XLNet 开源：20 项任务全面碾压 BERT！

谷歌更强 NLP 模型 XLNet 开源：20 项任务全面碾压 BERT！

雷锋网

5+阅读 · 2019年6月20日

开发 | 谷歌更强NLP模型XLNet开源：20项任务全面碾压BERT！

开发 | 谷歌更强NLP模型XLNet开源：20项任务全面碾压BERT！

AI科技评论

6+阅读 · 2019年6月20日

最新论文解读 | 基于预训练自然语言生成的文本摘要方法

最新论文解读 | 基于预训练自然语言生成的文本摘要方法

微软研究院AI头条

57+阅读 · 2019年3月19日

微软最新论文解读 | 基于预训练自然语言生成的文本摘要方法

微软最新论文解读 | 基于预训练自然语言生成的文本摘要方法

PaperWeekly

14+阅读 · 2019年3月18日

阅读理解得分超越人类：谷歌推出最强预训练语言理解模型BERT

阅读理解得分超越人类：谷歌推出最强预训练语言理解模型BERT

DeepTech深科技

5+阅读 · 2018年10月14日

前沿 | CNN取代RNN？当序列建模不再需要循环网络

前沿 | CNN取代RNN？当序列建模不再需要循环网络

机器之心

3+阅读 · 2018年8月7日

Simple Recurrent Unit For Sentence Classification

Simple Recurrent Unit For Sentence Classification

哈工大SCIR

6+阅读 · 2017年11月29日

【深度学习基础】4. Recurrent Neural Networks

【深度学习基础】4. Recurrent Neural Networks

微信AI

16+阅读 · 2017年7月19日

Jointly Modeling Aspect and Sentiment with Dynamic Heterogeneous Graph Neural Networks

Jointly Modeling Aspect and Sentiment with Dynamic Heterogeneous Graph Neural Networks

Arxiv

8+阅读 · 2020年4月14日

What Can Neural Networks Reason About?

Arxiv

10+阅读 · 2020年2月15日

An Attentive Survey of Attention Models

Arxiv

19+阅读 · 2019年4月5日

BERT for Joint Intent Classification and Slot Filling

Arxiv

12+阅读 · 2019年2月28日

Ordered Neurons: Integrating Tree Structures into Recurrent Neural Networks

Ordered Neurons: Integrating Tree Structures into Recurrent Neural Networks

Arxiv

4+阅读 · 2018年11月21日

Relational recurrent neural networks

Relational recurrent neural networks

Arxiv

8+阅读 · 2018年6月28日

Generalization without systematicity: On the compositional skills of sequence-to-sequence recurrent networks

Arxiv

3+阅读 · 2018年6月6日

Token-level and sequence-level loss smoothing for RNN language models

Arxiv

7+阅读 · 2018年5月14日

Language Modeling with Gated Convolutional Networks

Arxiv

5+阅读 · 2017年9月8日

Recurrent Instance Segmentation

Arxiv

5+阅读 · 2016年10月24日

VIP会员

相关主题

XLNet（广义自回归预训练方法）

卡内基梅隆大学 (Carnegie Mellon University)

相关VIP内容

【DeepMind硬核课】深度学习注意力与记忆机制，附70页ppt与视频

【DeepMind硬核课】深度学习注意力与记忆机制，附70页ppt与视频

专知会员服务

172+阅读 · 2020年6月25日

【DeepMind深度学习课程】序列循环神经网络，141页ppt，Sequences and Recurrent Network

【DeepMind深度学习课程】序列循环神经网络，141页ppt，Sequences and Recurrent Network

专知会员服务

86+阅读 · 2020年6月23日

基于多头注意力胶囊网络的文本分类模型

基于多头注意力胶囊网络的文本分类模型

专知会员服务

78+阅读 · 2020年5月24日

【北京大学】动态异构图神经网络建模情感，Jointly Modeling Aspect and Sentiment with Dynamic Heterogeneous Graph Neural Networks

【北京大学】动态异构图神经网络建模情感，Jointly Modeling Aspect and Sentiment with Dynamic Heterogeneous Graph Neural Networks

专知会员服务

55+阅读 · 2020年4月15日

【微软&CMU】后向特征校正，深度学习如何深度学习？Backward Feature Correction: How Deep Learning Performs Deep Learning

专知会员服务

13+阅读 · 2020年1月18日

【华盛顿大学】知识建模+生成式推理，60页ppt，Cracking Commonsense Intelligence with Knowledge Modeling + Generative Reasoning

【华盛顿大学】知识建模+生成式推理，60页ppt，Cracking Commonsense Intelligence with Knowledge Modeling + Generative Reasoning

专知会员服务

54+阅读 · 2019年12月27日

【CCL 2019】社会媒体处理前沿综述，哈尔滨工业大学助理研究员丁效

【CCL 2019】社会媒体处理前沿综述，哈尔滨工业大学助理研究员丁效

专知会员服务

42+阅读 · 2019年11月12日

【EMNLP2019Keynote报告】神经序列模型， Neural Sequence Models，63页ppt

【EMNLP2019Keynote报告】神经序列模型， Neural Sequence Models，63页ppt

专知会员服务

27+阅读 · 2019年11月10日

知识图谱与语义理解，百度研究院王海峰院长，CCKS-2019：知识智能

知识图谱与语义理解，百度研究院王海峰院长，CCKS-2019：知识智能

专知会员服务

60+阅读 · 2019年10月25日

方面级别情感分析方法研究，深圳先进技术研究院助理研究员杨敏，第八届全国社会媒体处理大会SMP2019

方面级别情感分析方法研究，深圳先进技术研究院助理研究员杨敏，第八届全国社会媒体处理大会SMP2019

专知会员服务

57+阅读 · 2019年10月22日

热门VIP内容

开通专知VIP会员享更多权益服务

【博士论文】扩展可扩展会话推荐的边界

别想太多：高效 R1 风格大型推理模型综述

【ACMMM2025】EvoVLMA: 进化式视觉-语言模型自适应

智能体网络：用AI智能体编织下一代网络

相关资讯

已删除

将门创投

4+阅读 · 2019年9月10日

20项任务全面碾压BERT，全新XLNet预训练模型

20项任务全面碾压BERT，全新XLNet预训练模型

机器学习算法与Python学习

15+阅读 · 2019年6月20日

谷歌更强 NLP 模型 XLNet 开源：20 项任务全面碾压 BERT！

谷歌更强 NLP 模型 XLNet 开源：20 项任务全面碾压 BERT！

雷锋网

5+阅读 · 2019年6月20日

开发 | 谷歌更强NLP模型XLNet开源：20项任务全面碾压BERT！

开发 | 谷歌更强NLP模型XLNet开源：20项任务全面碾压BERT！

AI科技评论

6+阅读 · 2019年6月20日

最新论文解读 | 基于预训练自然语言生成的文本摘要方法

最新论文解读 | 基于预训练自然语言生成的文本摘要方法

微软研究院AI头条

57+阅读 · 2019年3月19日

微软最新论文解读 | 基于预训练自然语言生成的文本摘要方法

微软最新论文解读 | 基于预训练自然语言生成的文本摘要方法

PaperWeekly

14+阅读 · 2019年3月18日

阅读理解得分超越人类：谷歌推出最强预训练语言理解模型BERT

阅读理解得分超越人类：谷歌推出最强预训练语言理解模型BERT

DeepTech深科技

5+阅读 · 2018年10月14日

前沿 | CNN取代RNN？当序列建模不再需要循环网络

前沿 | CNN取代RNN？当序列建模不再需要循环网络

机器之心

3+阅读 · 2018年8月7日

Simple Recurrent Unit For Sentence Classification

Simple Recurrent Unit For Sentence Classification

哈工大SCIR

6+阅读 · 2017年11月29日

【深度学习基础】4. Recurrent Neural Networks

【深度学习基础】4. Recurrent Neural Networks

微信AI

16+阅读 · 2017年7月19日

相关论文

Jointly Modeling Aspect and Sentiment with Dynamic Heterogeneous Graph Neural Networks

Jointly Modeling Aspect and Sentiment with Dynamic Heterogeneous Graph Neural Networks

Arxiv

8+阅读 · 2020年4月14日

What Can Neural Networks Reason About?

Arxiv

10+阅读 · 2020年2月15日

An Attentive Survey of Attention Models

Arxiv

19+阅读 · 2019年4月5日

BERT for Joint Intent Classification and Slot Filling

Arxiv

12+阅读 · 2019年2月28日

Ordered Neurons: Integrating Tree Structures into Recurrent Neural Networks

Ordered Neurons: Integrating Tree Structures into Recurrent Neural Networks

Arxiv

4+阅读 · 2018年11月21日

Relational recurrent neural networks

Relational recurrent neural networks

Arxiv

8+阅读 · 2018年6月28日

Generalization without systematicity: On the compositional skills of sequence-to-sequence recurrent networks

Arxiv

3+阅读 · 2018年6月6日

Token-level and sequence-level loss smoothing for RNN language models

Arxiv

7+阅读 · 2018年5月14日

Language Modeling with Gated Convolutional Networks

Arxiv

5+阅读 · 2017年9月8日

Recurrent Instance Segmentation

Arxiv

5+阅读 · 2016年10月24日

微信扫码咨询专知VIP会员