注意力模型已经成为神经网络中的一个重要概念,在不同的应用领域得到了广泛的研究。本综述提供了一个关于注意力建模的结构化的和全面的概述。特别地,我们提出了一种分类法,将现有的注意力技术分组到一致类别中。我们回顾了显著的注意力融入的神经结构,并讨论了建模注意力已显示出重大影响的应用。最后,我们还描述了如何使用注意力来提高神经网络的可解释性。我们希望这个调查能提供一个关于注意力模型的简明介绍,并在为其应用开发方法时指导从业者。

注意力模型(AM)首先被引入到机器翻译中[Bahdanau et al. 2015],现在已经成为神经网络文献中的一个主导概念。在人工智能(AI)领域,注意力作为神经架构的重要组成部分,在自然语言处理(Galassi et al. 2020)、语音(Cho et al. 2015)和计算机视觉(Wang and Tax 2016)等大量应用中非常受欢迎。

注意力背后的直觉可以用人类生物系统来最好地解释。例如,我们的视觉处理系统倾向于选择性地关注图像的某些部分,而忽略其他可以帮助感知的无关信息[Xu et al. 2015]。同样地,在涉及语言、言语或视觉的问题中,输入的某些部分比其他部分更重要。例如,在翻译和总结任务中,只有输入序列中的特定单词可能与预测下一个单词相关。同样,在图像字幕问题中,输入图像的某些区域可能与生成标题中的下一个单词更相关。AM通过允许模型动态地只关注帮助有效执行手头任务的输入的某些部分来合并相关性的概念。使用AM对Yelp评论进行情感分类的例子[Yang et al. 2016]如图1所示。在这个例子中,AM了解到在五个句子中,第一个和第三个句子更相关。此外,这些句子中的delicious和amazing这两个词更有意义,更能决定评论的情绪。

目录内容:

  • 注意力基础知识
  • 注意力模型
  • 注意力分类法
  • 注意力网络架构
  • 应用
  • 注意力可解释

成为VIP会员查看完整内容
136

相关内容

自然语言处理现代方法,176页pdf
专知会员服务
267+阅读 · 2021年2月22日
注意力机制综述
专知会员服务
82+阅读 · 2021年1月26日
专知会员服务
312+阅读 · 2020年11月24日
最新《可解释机器学习:原理与实践》综述论文,33页pdf
专知会员服务
159+阅读 · 2020年10月10日
最新《深度学习视频异常检测》2020综述论文,21页pdf
专知会员服务
84+阅读 · 2020年9月30日
专知会员服务
132+阅读 · 2020年8月24日
最新《图神经网络知识图谱补全》综述论文
专知会员服务
155+阅读 · 2020年7月29日
注意力机制模型最新综述
专知会员服务
266+阅读 · 2019年10月20日
深度学习的下一步:Transformer和注意力机制
云头条
56+阅读 · 2019年9月14日
Attention!注意力机制模型最新综述(附下载)
数据派THU
36+阅读 · 2019年4月14日
Attention!注意力机制模型最新综述
专知
65+阅读 · 2019年4月8日
自然语言处理中注意力机制综述
黑龙江大学自然语言处理实验室
11+阅读 · 2019年2月26日
【干货】注意力机制(Attention)最新综述论文及相关源码
GAN生成式对抗网络
11+阅读 · 2018年11月16日
深度学习中的注意力机制
CSDN大数据
24+阅读 · 2017年11月2日
Arxiv
1+阅读 · 2021年2月22日
One-Class Classification: A Survey
Arxiv
7+阅读 · 2021年1月8日
Arxiv
92+阅读 · 2020年2月28日
Music Transformer
Arxiv
5+阅读 · 2018年12月12日
VIP会员
相关VIP内容
自然语言处理现代方法,176页pdf
专知会员服务
267+阅读 · 2021年2月22日
注意力机制综述
专知会员服务
82+阅读 · 2021年1月26日
专知会员服务
312+阅读 · 2020年11月24日
最新《可解释机器学习:原理与实践》综述论文,33页pdf
专知会员服务
159+阅读 · 2020年10月10日
最新《深度学习视频异常检测》2020综述论文,21页pdf
专知会员服务
84+阅读 · 2020年9月30日
专知会员服务
132+阅读 · 2020年8月24日
最新《图神经网络知识图谱补全》综述论文
专知会员服务
155+阅读 · 2020年7月29日
注意力机制模型最新综述
专知会员服务
266+阅读 · 2019年10月20日
相关资讯
深度学习的下一步:Transformer和注意力机制
云头条
56+阅读 · 2019年9月14日
Attention!注意力机制模型最新综述(附下载)
数据派THU
36+阅读 · 2019年4月14日
Attention!注意力机制模型最新综述
专知
65+阅读 · 2019年4月8日
自然语言处理中注意力机制综述
黑龙江大学自然语言处理实验室
11+阅读 · 2019年2月26日
【干货】注意力机制(Attention)最新综述论文及相关源码
GAN生成式对抗网络
11+阅读 · 2018年11月16日
深度学习中的注意力机制
CSDN大数据
24+阅读 · 2017年11月2日
相关论文
微信扫码咨询专知VIP会员