语言是一种固有的时间现象。当我们理解和产生口语时,我们处理不确定长度的连续输入流。即使在处理书面文本时,我们通常也按顺序处理。语言的时代性反映在我们使用的隐喻中;我们谈论的是对话流、新闻源和twitter流,所有这些都唤起了这样一种观念:语言是一个随时间展开的序列。这种时间性质反映在我们用来处理语言的算法中。例如,当应用于词性标注问题时,维特比算法每次递增地输入一个单词,并将沿途收集到的信息传递下去。另一方面,我们研究的用于情感分析和其他文本分类任务的机器学习方法没有这种时间性质——它们假设同时访问输入的所有方面。前馈神经网络尤其如此,包括它们在神经语言模型中的应用。这些完全连接的网络使用固定大小的输入,以及相关的权重,一次性捕获示例的所有相关方面。这使得处理不同长度的序列变得困难,并且无法捕捉语言的重要时间方面。

本章涵盖了两个密切相关的深度学习架构,旨在解决这些挑战:循环神经网络和transformer网络。这两种方法都具有直接处理语言的顺序性质的机制,允许它们处理可变长度的输入,而不使用任意固定大小的窗口,并捕获和利用语言的时间性质。

成为VIP会员查看完整内容
55

相关内容

机器学习的一个分支,它基于试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
MIT最新《贝叶斯深度学习》综述论文,37页pdf
专知会员服务
50+阅读 · 2021年1月4日
专知会员服务
78+阅读 · 2020年12月22日
最新《可解释机器学习:原理与实践》综述论文,33页pdf
专知会员服务
159+阅读 · 2020年10月10日
最新【图神经网络计算】2020综述论文,23页PDF
专知会员服务
192+阅读 · 2020年10月3日
最新《深度持续学习》综述论文,32页pdf
专知会员服务
179+阅读 · 2020年9月7日
专知会员服务
132+阅读 · 2020年8月24日
机器学习速查手册,135页pdf
专知会员服务
338+阅读 · 2020年3月15日
深度学习的下一步:Transformer和注意力机制
云头条
56+阅读 · 2019年9月14日
针对初学者的循环神经网络介绍
Python程序员
8+阅读 · 2019年8月20日
脉冲神经网络(SNN)概述
人工智能前沿讲习班
60+阅读 · 2019年5月30日
自然语言处理常识推理综述论文,60页pdf
专知
73+阅读 · 2019年4月4日
图神经网络概述第三弹:来自IEEE Fellow的GNN综述
机器之心
46+阅读 · 2019年1月7日
卷积神经网络概述及Python实现
云栖社区
4+阅读 · 2018年9月1日
一文读懂LSTM和循环神经网络
七月在线实验室
8+阅读 · 2018年4月18日
长文 | LSTM和循环神经网络基础教程(PDF下载)
机器学习算法与Python学习
14+阅读 · 2018年2月28日
深度学习基础之LSTM
全球人工智能
28+阅读 · 2017年12月18日
Arxiv
6+阅读 · 2020年10月8日
Arxiv
23+阅读 · 2020年9月16日
AutoML: A Survey of the State-of-the-Art
Arxiv
69+阅读 · 2019年8月14日
Arxiv
7+阅读 · 2019年5月31日
Arxiv
5+阅读 · 2017年9月8日
VIP会员
相关VIP内容
MIT最新《贝叶斯深度学习》综述论文,37页pdf
专知会员服务
50+阅读 · 2021年1月4日
专知会员服务
78+阅读 · 2020年12月22日
最新《可解释机器学习:原理与实践》综述论文,33页pdf
专知会员服务
159+阅读 · 2020年10月10日
最新【图神经网络计算】2020综述论文,23页PDF
专知会员服务
192+阅读 · 2020年10月3日
最新《深度持续学习》综述论文,32页pdf
专知会员服务
179+阅读 · 2020年9月7日
专知会员服务
132+阅读 · 2020年8月24日
机器学习速查手册,135页pdf
专知会员服务
338+阅读 · 2020年3月15日
相关资讯
深度学习的下一步:Transformer和注意力机制
云头条
56+阅读 · 2019年9月14日
针对初学者的循环神经网络介绍
Python程序员
8+阅读 · 2019年8月20日
脉冲神经网络(SNN)概述
人工智能前沿讲习班
60+阅读 · 2019年5月30日
自然语言处理常识推理综述论文,60页pdf
专知
73+阅读 · 2019年4月4日
图神经网络概述第三弹:来自IEEE Fellow的GNN综述
机器之心
46+阅读 · 2019年1月7日
卷积神经网络概述及Python实现
云栖社区
4+阅读 · 2018年9月1日
一文读懂LSTM和循环神经网络
七月在线实验室
8+阅读 · 2018年4月18日
长文 | LSTM和循环神经网络基础教程(PDF下载)
机器学习算法与Python学习
14+阅读 · 2018年2月28日
深度学习基础之LSTM
全球人工智能
28+阅读 · 2017年12月18日
相关论文
微信扫码咨询专知VIP会员