【PNAS2020-斯坦福】自监督训练的人工神经网络中的涌现语言结构 - 专知

会员服务 ·

0

【PNAS2020-斯坦福】自监督训练的人工神经网络中的涌现语言结构

2020 年 6 月 5 日 专知

本文探讨了大型人工神经网络学习的语言结构知识，通过自监督训练，该模型简单地尝试预测给定上下文中的一个掩蔽词。人类的语言交流是通过词语序列进行的，但是语言理解需要构建丰富的从未被明确观察到的层次结构。这一机制一直是人类语言习得的一个主要奥秘，而工程工作主要是通过在树堆上有监督的句子学习来完成的，这些句子是手写标记的这种潜在结构。然而，我们证明，现代的深度语境化语言模型在没有任何明确监督的情况下学习这种语言结构。我们开发了识别人工神经网络中涌现的语言层次结构的方法，并证明了这些模型中的组件关注于语法关系和回指共指。事实上，我们表明，在这些模型中学习的嵌入的线性转换捕获了解析树的距离，达到了令人惊讶的程度，允许大致重建通常由语言学家假定的句子树结构。这些结果有助于解释为什么这些模型在许多语言理解任务中带来了如此大的改进。

https://www.pnas.org/content/early/2020/06/02/1907367117

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“ELS” 可以获取《【PNAS2020-斯坦福】自监督训练的人工神经网络中的涌现语言结构》专知下载链接索引

专知，专业可信的人工智能知识分发，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取5000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“阅读原文”，了解使用专知，查看获取5000+AI主题知识资源

登录查看更多

0

相关内容

语言结构

【ICML2020-西电】用于语言生成的递归层次主题引导RNN

【ICML2020-西电】用于语言生成的递归层次主题引导RNN

专知会员服务

22+阅读 · 2020年6月30日

【UTSA】最新《可解释人工智能XAI：机会与挑战》， 25页pdf119篇文献详述XAI技术进展

【UTSA】最新《可解释人工智能XAI：机会与挑战》， 25页pdf119篇文献详述XAI技术进展

专知会员服务

160+阅读 · 2020年6月24日

基于多头注意力胶囊网络的文本分类模型

基于多头注意力胶囊网络的文本分类模型

专知会员服务

78+阅读 · 2020年5月24日

【斯坦福大学AI】BERT, ELMo， & GPT-2:上下文化的单词表示是怎样的?

专知会员服务

35+阅读 · 2020年3月28日

BERT技术体系综述论文：40项分析探究BERT如何work

BERT技术体系综述论文：40项分析探究BERT如何work

专知会员服务

140+阅读 · 2020年3月1日

慕尼黑大学LMU博士论文：自然语言文本神经网络信息提取，240页pdf

慕尼黑大学LMU博士论文：自然语言文本神经网络信息提取，240页pdf

专知会员服务

74+阅读 · 2020年1月13日

BERT进展2019四篇必读论文

BERT进展2019四篇必读论文

专知会员服务

69+阅读 · 2020年1月2日

【Science最新论文】XAI—可解释人工智能简述，机遇与挑战

【Science最新论文】XAI—可解释人工智能简述，机遇与挑战

专知会员服务

165+阅读 · 2019年12月21日

【MLA 2019】对抗机器学习与对抗视觉，韩亚洪天津大学教授

【MLA 2019】对抗机器学习与对抗视觉，韩亚洪天津大学教授

专知会员服务

46+阅读 · 2019年11月6日

互联网、社会互动和群体行为，中国人民大学冯仕政教授，第八届全国社会媒体处理大会SMP2019

互联网、社会互动和群体行为，中国人民大学冯仕政教授，第八届全国社会媒体处理大会SMP2019

专知会员服务

33+阅读 · 2019年10月23日

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知

36+阅读 · 2020年5月2日

【芝加哥大学】可变形的风格转移，Deformable Style Transfer

【芝加哥大学】可变形的风格转移，Deformable Style Transfer

专知

20+阅读 · 2020年3月26日

BERT技术体系综述论文：40项分析探究BERT如何work

BERT技术体系综述论文：40项分析探究BERT如何work

专知

50+阅读 · 2020年3月1日

天津大学最新「边缘计算与深度学习的融合」综述论文，35页pdf

天津大学最新「边缘计算与深度学习的融合」综述论文，35页pdf

专知

8+阅读 · 2020年1月7日

【初学者指南】神经网络中的数学

【初学者指南】神经网络中的数学

专知

33+阅读 · 2019年12月16日

【NAACL2019】182页PPT带你回顾自然语言推断的前世今生

【NAACL2019】182页PPT带你回顾自然语言推断的前世今生

专知

36+阅读 · 2019年6月4日

可解释AI(XAI)工具集—DrWhy

可解释AI(XAI)工具集—DrWhy

专知

25+阅读 · 2019年6月4日

【NAACL-HLT2019】自然语言处理的深度对抗学习方法-附104页教程Slides

【NAACL-HLT2019】自然语言处理的深度对抗学习方法-附104页教程Slides

专知

17+阅读 · 2019年6月3日

【课程讲义】176页哥德堡大学人工神经网络讲义

【课程讲义】176页哥德堡大学人工神经网络讲义

专知

17+阅读 · 2019年1月24日

自编码表示学习 25页最新进展综述，90篇参考文献

自编码表示学习 25页最新进展综述，90篇参考文献

专知

34+阅读 · 2018年12月18日

ALBERT: A Lite BERT for Self-supervised Learning of Language Representations

Arxiv

11+阅读 · 2019年10月30日

Visualizing and Measuring the Geometry of BERT

Visualizing and Measuring the Geometry of BERT

Arxiv

7+阅读 · 2019年10月28日

BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

Arxiv

16+阅读 · 2019年5月24日

How to Fine-Tune BERT for Text Classification?

How to Fine-Tune BERT for Text Classification?

Arxiv

13+阅读 · 2019年5月14日

Multi-Head Attention with Disagreement Regularization

Arxiv

9+阅读 · 2018年10月24日

Physical Primitive Decomposition

Physical Primitive Decomposition

Arxiv

4+阅读 · 2018年9月13日

Neural Network Models for Paraphrase Identification, Semantic Textual Similarity, Natural Language Inference, and Question Answering

Arxiv

7+阅读 · 2018年6月12日

Topic Compositional Neural Language Model

Arxiv

5+阅读 · 2018年2月26日

Adaptive Graph Convolutional Neural Networks

Arxiv

7+阅读 · 2018年1月10日

Interpretable Convolutional Neural Networks

Arxiv

4+阅读 · 2017年11月13日

VIP会员

相关主题

自监督训练

人工神经网络

相关VIP内容

【ICML2020-西电】用于语言生成的递归层次主题引导RNN

【ICML2020-西电】用于语言生成的递归层次主题引导RNN

专知会员服务

22+阅读 · 2020年6月30日

【UTSA】最新《可解释人工智能XAI：机会与挑战》， 25页pdf119篇文献详述XAI技术进展

【UTSA】最新《可解释人工智能XAI：机会与挑战》， 25页pdf119篇文献详述XAI技术进展

专知会员服务

160+阅读 · 2020年6月24日

基于多头注意力胶囊网络的文本分类模型

基于多头注意力胶囊网络的文本分类模型

专知会员服务

78+阅读 · 2020年5月24日

【斯坦福大学AI】BERT, ELMo， & GPT-2:上下文化的单词表示是怎样的?

专知会员服务

35+阅读 · 2020年3月28日

BERT技术体系综述论文：40项分析探究BERT如何work

BERT技术体系综述论文：40项分析探究BERT如何work

专知会员服务

140+阅读 · 2020年3月1日

慕尼黑大学LMU博士论文：自然语言文本神经网络信息提取，240页pdf

慕尼黑大学LMU博士论文：自然语言文本神经网络信息提取，240页pdf

专知会员服务

74+阅读 · 2020年1月13日

BERT进展2019四篇必读论文

BERT进展2019四篇必读论文

专知会员服务

69+阅读 · 2020年1月2日

【Science最新论文】XAI—可解释人工智能简述，机遇与挑战

【Science最新论文】XAI—可解释人工智能简述，机遇与挑战

专知会员服务

165+阅读 · 2019年12月21日

【MLA 2019】对抗机器学习与对抗视觉，韩亚洪天津大学教授

【MLA 2019】对抗机器学习与对抗视觉，韩亚洪天津大学教授

专知会员服务

46+阅读 · 2019年11月6日

互联网、社会互动和群体行为，中国人民大学冯仕政教授，第八届全国社会媒体处理大会SMP2019

互联网、社会互动和群体行为，中国人民大学冯仕政教授，第八届全国社会媒体处理大会SMP2019

专知会员服务

33+阅读 · 2019年10月23日

热门VIP内容

开通专知VIP会员享更多权益服务

操作系统智能体：基于多模态大模型（MLLM）的通用计算设备智能体综述

《美国太空军系统全生命周期建模、仿真与分析效能提升方案》最新84页报告

【博士论文】推进数据高效的深度学习：非参数 Transformer、主动测试与上下文学习

自主人工智能：未来战争是否将是自主化的？

相关资讯

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知

36+阅读 · 2020年5月2日

【芝加哥大学】可变形的风格转移，Deformable Style Transfer

【芝加哥大学】可变形的风格转移，Deformable Style Transfer

专知

20+阅读 · 2020年3月26日

BERT技术体系综述论文：40项分析探究BERT如何work

BERT技术体系综述论文：40项分析探究BERT如何work

专知

50+阅读 · 2020年3月1日

天津大学最新「边缘计算与深度学习的融合」综述论文，35页pdf

天津大学最新「边缘计算与深度学习的融合」综述论文，35页pdf

专知

8+阅读 · 2020年1月7日

【初学者指南】神经网络中的数学

【初学者指南】神经网络中的数学

专知

33+阅读 · 2019年12月16日

【NAACL2019】182页PPT带你回顾自然语言推断的前世今生

【NAACL2019】182页PPT带你回顾自然语言推断的前世今生

专知

36+阅读 · 2019年6月4日

可解释AI(XAI)工具集—DrWhy

可解释AI(XAI)工具集—DrWhy

专知

25+阅读 · 2019年6月4日

【NAACL-HLT2019】自然语言处理的深度对抗学习方法-附104页教程Slides

【NAACL-HLT2019】自然语言处理的深度对抗学习方法-附104页教程Slides

专知

17+阅读 · 2019年6月3日

【课程讲义】176页哥德堡大学人工神经网络讲义

【课程讲义】176页哥德堡大学人工神经网络讲义

专知

17+阅读 · 2019年1月24日

自编码表示学习 25页最新进展综述，90篇参考文献

自编码表示学习 25页最新进展综述，90篇参考文献

专知

34+阅读 · 2018年12月18日

相关论文

ALBERT: A Lite BERT for Self-supervised Learning of Language Representations

Arxiv

11+阅读 · 2019年10月30日

Visualizing and Measuring the Geometry of BERT

Visualizing and Measuring the Geometry of BERT

Arxiv

7+阅读 · 2019年10月28日

BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

Arxiv

16+阅读 · 2019年5月24日

How to Fine-Tune BERT for Text Classification?

How to Fine-Tune BERT for Text Classification?

Arxiv

13+阅读 · 2019年5月14日

Multi-Head Attention with Disagreement Regularization

Arxiv

9+阅读 · 2018年10月24日

Physical Primitive Decomposition

Physical Primitive Decomposition

Arxiv

4+阅读 · 2018年9月13日

Neural Network Models for Paraphrase Identification, Semantic Textual Similarity, Natural Language Inference, and Question Answering

Arxiv

7+阅读 · 2018年6月12日

Topic Compositional Neural Language Model

Arxiv

5+阅读 · 2018年2月26日

Adaptive Graph Convolutional Neural Networks

Arxiv

7+阅读 · 2018年1月10日

Interpretable Convolutional Neural Networks

Arxiv

4+阅读 · 2017年11月13日

大家都在搜

大型语言模型

CMU博士论文

国防科技创新

软件无线电

论文浅尝 - ICLR2020 | 通过神经逻辑归纳学习有效地解释

微信扫码咨询专知VIP会员