【PNAS2020-斯坦福】自监督训练的人工神经网络中的涌现语言结构 - 专知VIP

会员服务 ·

0

自监督训练 · 语言结构 ·

2020 年 6 月 5 日

【PNAS2020-斯坦福】自监督训练的人工神经网络中的涌现语言结构

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

本文探讨了大型人工神经网络学习的语言结构知识，通过自监督训练，该模型简单地尝试预测给定上下文中的一个掩蔽词。人类的语言交流是通过词语序列进行的，但是语言理解需要构建丰富的从未被明确观察到的层次结构。这一机制一直是人类语言习得的一个主要奥秘，而工程工作主要是通过在树堆上有监督的句子学习来完成的，这些句子是手写标记的这种潜在结构。然而，我们证明，现代的深度语境化语言模型在没有任何明确监督的情况下学习这种语言结构。我们开发了识别人工神经网络中涌现的语言层次结构的方法，并证明了这些模型中的组件关注于语法关系和回指共指。事实上，我们表明，在这些模型中学习的嵌入的线性转换捕获了解析树的距离，达到了令人惊讶的程度，允许大致重建通常由语言学家假定的句子树结构。这些结果有助于解释为什么这些模型在许多语言理解任务中带来了如此大的改进。

成为VIP会员查看完整内容

20

相关内容

自监督训练

自监督训练

【NeurIPS2020提交论文】建立具有消息传递的等变图神经网络

【NeurIPS2020提交论文】建立具有消息传递的等变图神经网络

专知会员服务

50+阅读 · 2020年6月29日

【ICML2020-哈佛】深度语言表示中可分流形

【ICML2020-哈佛】深度语言表示中可分流形

专知会员服务

13+阅读 · 2020年6月2日

语言视觉预训练语言模型揭密，Behind the Scene: Revealing the Secrets of Pre-trained Vision-and-Language Models

语言视觉预训练语言模型揭密，Behind the Scene: Revealing the Secrets of Pre-trained Vision-and-Language Models

专知会员服务

36+阅读 · 2020年5月20日

【IJCAI2020】图神经网络预测结构化实体交互

【IJCAI2020】图神经网络预测结构化实体交互

专知会员服务

43+阅读 · 2020年5月13日

BERT技术体系综述论文：40项分析探究BERT如何work

BERT技术体系综述论文：40项分析探究BERT如何work

专知会员服务

140+阅读 · 2020年3月1日

【斯坦福大学-PNAS2020】人工智能中深度学习的不合理有效性unreasonable effectiveness of DL

专知会员服务

14+阅读 · 2020年2月23日

Nature论文：用于自主血管通路的深度学习机器人导航，新泽西州立大学

Nature论文：用于自主血管通路的深度学习机器人导航，新泽西州立大学

专知会员服务

24+阅读 · 2020年2月17日

【Science最新论文】XAI—可解释人工智能简述，机遇与挑战

【Science最新论文】XAI—可解释人工智能简述，机遇与挑战

专知会员服务

165+阅读 · 2019年12月21日

【AAAI2010接受论文】故事实现：将情节事件展开成句子（Story Realization: Expanding Plot Events into Sentences）

【AAAI2010接受论文】故事实现：将情节事件展开成句子（Story Realization: Expanding Plot Events into Sentences）

专知会员服务

8+阅读 · 2019年11月15日

深度学习算法与架构回顾

深度学习算法与架构回顾

专知会员服务

84+阅读 · 2019年10月20日

让半监督学习再次伟大！谷歌最新无监督数据增强研究，全面超越现有半监督学习方法

让半监督学习再次伟大！谷歌最新无监督数据增强研究，全面超越现有半监督学习方法

新智元

20+阅读 · 2019年7月11日

如何可视化BERT？你需要先理解神经网络的语言、树和几何性质

如何可视化BERT？你需要先理解神经网络的语言、树和几何性质

机器之心

5+阅读 · 2019年6月14日

了解情感分析中的NLP技术么？

了解情感分析中的NLP技术么？

七月在线实验室

9+阅读 · 2019年4月12日

多图带你读懂 Transformers 的工作原理

多图带你读懂 Transformers 的工作原理

AI研习社

10+阅读 · 2019年3月18日

ELMo的朋友圈：预训练语言模型真的一枝独秀吗？

ELMo的朋友圈：预训练语言模型真的一枝独秀吗？

机器之心

10+阅读 · 2019年1月1日

这种有序神经元，像你熟知的循环神经网络吗？

这种有序神经元，像你熟知的循环神经网络吗？

机器之心

6+阅读 · 2018年12月20日

Gartner：2018人工智能技术成熟度曲线

Gartner：2018人工智能技术成熟度曲线

物联网智库

4+阅读 · 2018年8月17日

独家 | 一文读懂人工神经网络

独家 | 一文读懂人工神经网络

数据派THU

12+阅读 · 2018年2月1日

自然语言处理中的深度学习发展史和待解难题

自然语言处理中的深度学习发展史和待解难题

量子位

4+阅读 · 2017年7月31日

人工神经网络

人工神经网络

平均机器

15+阅读 · 2017年7月17日

Towards Building a Multilingual Sememe Knowledge Base: Predicting Sememes for BabelNet Synsets

Arxiv

15+阅读 · 2019年12月4日

The Deep Learning Revolution and Its Implications for Computer Architecture and Chip Design

The Deep Learning Revolution and Its Implications for Computer Architecture and Chip Design

Arxiv

7+阅读 · 2019年11月13日

Convolutional Self-Attention Network

Arxiv

6+阅读 · 2019年4月8日

Cloze-driven Pretraining of Self-attention Networks

Arxiv

6+阅读 · 2019年3月19日

The Evolved Transformer

The Evolved Transformer

Arxiv

5+阅读 · 2019年1月30日

Ordered Neurons: Integrating Tree Structures into Recurrent Neural Networks

Ordered Neurons: Integrating Tree Structures into Recurrent Neural Networks

Arxiv

4+阅读 · 2018年11月21日

Neural Ordinary Differential Equations

Arxiv

6+阅读 · 2018年10月3日

Zero-Shot Object Detection

Zero-Shot Object Detection

Arxiv

9+阅读 · 2018年7月27日

DeepFM: An End-to-End Wide & Deep Learning Framework for CTR Prediction

Arxiv

6+阅读 · 2018年4月12日

Matching Networks for One Shot Learning

Arxiv

10+阅读 · 2017年12月29日

VIP会员

相关主题

自监督训练

相关VIP内容

【NeurIPS2020提交论文】建立具有消息传递的等变图神经网络

【NeurIPS2020提交论文】建立具有消息传递的等变图神经网络

专知会员服务

50+阅读 · 2020年6月29日

【ICML2020-哈佛】深度语言表示中可分流形

【ICML2020-哈佛】深度语言表示中可分流形

专知会员服务

13+阅读 · 2020年6月2日

语言视觉预训练语言模型揭密，Behind the Scene: Revealing the Secrets of Pre-trained Vision-and-Language Models

语言视觉预训练语言模型揭密，Behind the Scene: Revealing the Secrets of Pre-trained Vision-and-Language Models

专知会员服务

36+阅读 · 2020年5月20日

【IJCAI2020】图神经网络预测结构化实体交互

【IJCAI2020】图神经网络预测结构化实体交互

专知会员服务

43+阅读 · 2020年5月13日

BERT技术体系综述论文：40项分析探究BERT如何work

BERT技术体系综述论文：40项分析探究BERT如何work

专知会员服务

140+阅读 · 2020年3月1日

【斯坦福大学-PNAS2020】人工智能中深度学习的不合理有效性unreasonable effectiveness of DL

专知会员服务

14+阅读 · 2020年2月23日

Nature论文：用于自主血管通路的深度学习机器人导航，新泽西州立大学

Nature论文：用于自主血管通路的深度学习机器人导航，新泽西州立大学

专知会员服务

24+阅读 · 2020年2月17日

【Science最新论文】XAI—可解释人工智能简述，机遇与挑战

【Science最新论文】XAI—可解释人工智能简述，机遇与挑战

专知会员服务

165+阅读 · 2019年12月21日

【AAAI2010接受论文】故事实现：将情节事件展开成句子（Story Realization: Expanding Plot Events into Sentences）

【AAAI2010接受论文】故事实现：将情节事件展开成句子（Story Realization: Expanding Plot Events into Sentences）

专知会员服务

8+阅读 · 2019年11月15日

深度学习算法与架构回顾

深度学习算法与架构回顾

专知会员服务

84+阅读 · 2019年10月20日

热门VIP内容

开通专知VIP会员享更多权益服务

面向具身智能的多模态数据存储与检索：综述

《算法战争研究计划全景评估》35页

【CMU博士论文】水下三维视觉感知与生成

智能体战争：自主人工智能军备竞赛全景透视

相关资讯

让半监督学习再次伟大！谷歌最新无监督数据增强研究，全面超越现有半监督学习方法

让半监督学习再次伟大！谷歌最新无监督数据增强研究，全面超越现有半监督学习方法

新智元

20+阅读 · 2019年7月11日

如何可视化BERT？你需要先理解神经网络的语言、树和几何性质

如何可视化BERT？你需要先理解神经网络的语言、树和几何性质

机器之心

5+阅读 · 2019年6月14日

了解情感分析中的NLP技术么？

了解情感分析中的NLP技术么？

七月在线实验室

9+阅读 · 2019年4月12日

多图带你读懂 Transformers 的工作原理

多图带你读懂 Transformers 的工作原理

AI研习社

10+阅读 · 2019年3月18日

ELMo的朋友圈：预训练语言模型真的一枝独秀吗？

ELMo的朋友圈：预训练语言模型真的一枝独秀吗？

机器之心

10+阅读 · 2019年1月1日

这种有序神经元，像你熟知的循环神经网络吗？

这种有序神经元，像你熟知的循环神经网络吗？

机器之心

6+阅读 · 2018年12月20日

Gartner：2018人工智能技术成熟度曲线

Gartner：2018人工智能技术成熟度曲线

物联网智库

4+阅读 · 2018年8月17日

独家 | 一文读懂人工神经网络

独家 | 一文读懂人工神经网络

数据派THU

12+阅读 · 2018年2月1日

自然语言处理中的深度学习发展史和待解难题

自然语言处理中的深度学习发展史和待解难题

量子位

4+阅读 · 2017年7月31日

人工神经网络

人工神经网络

平均机器

15+阅读 · 2017年7月17日

相关论文

Towards Building a Multilingual Sememe Knowledge Base: Predicting Sememes for BabelNet Synsets

Arxiv

15+阅读 · 2019年12月4日

The Deep Learning Revolution and Its Implications for Computer Architecture and Chip Design

The Deep Learning Revolution and Its Implications for Computer Architecture and Chip Design

Arxiv

7+阅读 · 2019年11月13日

Convolutional Self-Attention Network

Arxiv

6+阅读 · 2019年4月8日

Cloze-driven Pretraining of Self-attention Networks

Arxiv

6+阅读 · 2019年3月19日

The Evolved Transformer

The Evolved Transformer

Arxiv

5+阅读 · 2019年1月30日

Ordered Neurons: Integrating Tree Structures into Recurrent Neural Networks

Ordered Neurons: Integrating Tree Structures into Recurrent Neural Networks

Arxiv

4+阅读 · 2018年11月21日

Neural Ordinary Differential Equations

Arxiv

6+阅读 · 2018年10月3日

Zero-Shot Object Detection

Zero-Shot Object Detection

Arxiv

9+阅读 · 2018年7月27日

DeepFM: An End-to-End Wide & Deep Learning Framework for CTR Prediction

Arxiv

6+阅读 · 2018年4月12日

Matching Networks for One Shot Learning

Arxiv

10+阅读 · 2017年12月29日

微信扫码咨询专知VIP会员