Attention！注意力机制模型最新综述（附下载） - 专知

会员服务 ·

0

Attention！注意力机制模型最新综述（附下载）

2019 年 4 月 14 日 数据派THU

来源：专知

本文多资源，建议阅读5分钟。

本文详细描述了Attention模型的概念、定义、影响以及如何着手进行实践工作。

[导读]Attention模型目前已经成为神经网络中的一个重要概念，本文为大家带来了该模型的最新综述文章，详细描述了该模型的概念、定义、影响以及如何着手进行实践工作。

介绍

本篇综述提供了关于注意力模型的全面概述，并且提供了一种将现有注意力模型进行有效分类的分类法，我们调查了用于不同网络结构的注意力模型，并显示了注意力机制如何提高模型的可解释性，最后，我们讨论了一些受到注意力模型较大影响的应用问题。我们希望本次综述能够为为大家提供一份简明扼要的介绍，帮助大家理解这一模型并着手进行实践。

注意力模型（AM）自机器翻译任务【Bahdanau et al 2014】首次引入进来，现在已经成为主流的神经网络概念。这一模型在研究社区中非常受欢迎，适用领域非常广泛，包括自然语言处理、统计学习、语音和计算机视觉方面的应用。

注意力模型的思想可以通过人类生物系统来进行解释，例如，在我们的视觉系统中，更倾向于关注图片的某一部分，而忽视其他不相干的信息，这样有助于提高感受能力。相似的，在某些问题涉及到文字、语音与视觉的任务中，部分信息的重要程度要明显高于其他信息，例如，在翻译与摘要任务中，输入序列中只有部分词汇与下个词的预测有关。同样的，在图片描述问题中，输入图像的某些区域可能对描述词更加相关。AM整合了这种相关信息，允许模型对某些有用的输入信息，动态的提供注意力，以此提高模型的性能，例如在文本分类任务中。

注意力模型的飞快发展可以被总结为三个理由：

这些模型是很多任务的state-of-the-art，例如机器翻译、问答系统、情感分析、词性标注、对话系统等；
除了提高任务性能之外，还带来了其他几种优势。如，提高模型的可解释性等；
AM解决了RNN模型的很多问题，例如在面对长文本时的性能衰减，以及计算序列数据对任务的权重影响等。

文章从Number of Sequences、Number of Abstraction Levels、Number of Positions、Number of Representations等多个维度对注意力模型进行了分类，具体结果如下：

后台回复“20190408” 即可获取《Attention 模型最新综述》的下载链接~

附全文预览：

编辑：文婧

校对：林亦霖

登录查看更多

36

相关内容

注意力模型

注意力模型

自然语言处理中的注意力机制，Attention in Natural Language Processing

自然语言处理中的注意力机制，Attention in Natural Language Processing

专知会员服务

136+阅读 · 2020年5月30日

【综述】交通流量预测，附15页论文下载

【综述】交通流量预测，附15页论文下载

专知会员服务

132+阅读 · 2020年4月23日

综述：NLP中的深度学习优势，附21页论文下载

专知会员服务

104+阅读 · 2020年3月12日

机器翻译深度学习最新综述

机器翻译深度学习最新综述

专知会员服务

99+阅读 · 2020年2月20日

语音处理中的深度表示学习综述论文:挑战、最新进展和未来趋势，25页pdf

语音处理中的深度表示学习综述论文:挑战、最新进展和未来趋势，25页pdf

专知会员服务

32+阅读 · 2020年1月2日

2019->2020必看的十篇「深度学习领域综述」论文

2019->2020必看的十篇「深度学习领域综述」论文

专知会员服务

275+阅读 · 2020年1月1日

【图机器学习论文】综述：图注意力模型（Attention Models in Graphs: A Survey）

【图机器学习论文】综述：图注意力模型（Attention Models in Graphs: A Survey）

专知会员服务

143+阅读 · 2019年12月16日

注意力机制模型最新综述

注意力机制模型最新综述

专知会员服务

270+阅读 · 2019年10月20日

注意力机制介绍，Attention Mechanism

注意力机制介绍，Attention Mechanism

专知会员服务

171+阅读 · 2019年10月13日

深度学习自然语言处理综述，266篇参考文献

深度学习自然语言处理综述，266篇参考文献

专知会员服务

231+阅读 · 2019年10月12日

注意力模型深度综述：注意力类型和网络架构都有什么

注意力模型深度综述：注意力类型和网络架构都有什么

极市平台

35+阅读 · 2019年5月6日

Attention！注意力机制模型最新综述

Attention！注意力机制模型最新综述

中国人工智能学会

18+阅读 · 2019年4月8日

自然语言处理中注意力机制综述

自然语言处理中注意力机制综述

Python开发者

11+阅读 · 2019年1月31日

图神经网络综述：模型与应用

图神经网络综述：模型与应用

PaperWeekly

198+阅读 · 2018年12月26日

注意力机制(Attention)最新综述论文及相关源码

注意力机制(Attention)最新综述论文及相关源码

人工智能学家

30+阅读 · 2018年11月17日

【干货】注意力机制(Attention)最新综述论文及相关源码

【干货】注意力机制(Attention)最新综述论文及相关源码

GAN生成式对抗网络

11+阅读 · 2018年11月16日

注意力机制（Attention Mechanism）在自然语言处理中的应用

注意力机制（Attention Mechanism）在自然语言处理中的应用

全球人工智能

6+阅读 · 2018年3月28日

深度学习中的注意力机制

深度学习中的注意力机制

CSDN大数据

24+阅读 · 2017年11月2日

A Survey on Contextual Embeddings

Arxiv

29+阅读 · 2020年3月16日

Talking-Heads Attention

Talking-Heads Attention

Arxiv

15+阅读 · 2020年3月5日

A Comprehensive Survey on Graph Neural Networks

A Comprehensive Survey on Graph Neural Networks

Arxiv

21+阅读 · 2019年1月3日

A Hierarchical Neural Network for Sequence-to-Sequences Learning

A Hierarchical Neural Network for Sequence-to-Sequences Learning

Arxiv

4+阅读 · 2018年11月23日

Global-and-local attention networks for visual recognition

Global-and-local attention networks for visual recognition

Arxiv

5+阅读 · 2018年9月6日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

Hyperbolic Attention Networks

Arxiv

9+阅读 · 2018年5月24日

Metric for Automatic Machine Translation Evaluation based on Universal Sentence Representations

Arxiv

4+阅读 · 2018年5月18日

Dual Recurrent Attention Units for Visual Question Answering

Arxiv

7+阅读 · 2018年2月1日

A Hierarchical Contextual Attention-based GRU Network for Sequential Recommendation

Arxiv

5+阅读 · 2017年12月7日

VIP会员

相关主题

注意力模型

注意力机制

相关VIP内容

自然语言处理中的注意力机制，Attention in Natural Language Processing

自然语言处理中的注意力机制，Attention in Natural Language Processing

专知会员服务

136+阅读 · 2020年5月30日

【综述】交通流量预测，附15页论文下载

【综述】交通流量预测，附15页论文下载

专知会员服务

132+阅读 · 2020年4月23日

综述：NLP中的深度学习优势，附21页论文下载

专知会员服务

104+阅读 · 2020年3月12日

机器翻译深度学习最新综述

机器翻译深度学习最新综述

专知会员服务

99+阅读 · 2020年2月20日

语音处理中的深度表示学习综述论文:挑战、最新进展和未来趋势，25页pdf

语音处理中的深度表示学习综述论文:挑战、最新进展和未来趋势，25页pdf

专知会员服务

32+阅读 · 2020年1月2日

2019->2020必看的十篇「深度学习领域综述」论文

2019->2020必看的十篇「深度学习领域综述」论文

专知会员服务

275+阅读 · 2020年1月1日

【图机器学习论文】综述：图注意力模型（Attention Models in Graphs: A Survey）

【图机器学习论文】综述：图注意力模型（Attention Models in Graphs: A Survey）

专知会员服务

143+阅读 · 2019年12月16日

注意力机制模型最新综述

注意力机制模型最新综述

专知会员服务

270+阅读 · 2019年10月20日

注意力机制介绍，Attention Mechanism

注意力机制介绍，Attention Mechanism

专知会员服务

171+阅读 · 2019年10月13日

深度学习自然语言处理综述，266篇参考文献

深度学习自然语言处理综述，266篇参考文献

专知会员服务

231+阅读 · 2019年10月12日

热门VIP内容

开通专知VIP会员享更多权益服务

《乌克兰无人机产业：志愿者与政策在构建新兴无人机产业中的协同作用》最新报告

《人工智能辅助决策中的数据可视化：系统性综述》

人工智能驱动弹药制造现代化：美国陆军转型之路

《敏捷作战部署中枢纽-辐条基地选址优化研究》80页

相关资讯

注意力模型深度综述：注意力类型和网络架构都有什么

注意力模型深度综述：注意力类型和网络架构都有什么

极市平台

35+阅读 · 2019年5月6日

Attention！注意力机制模型最新综述

Attention！注意力机制模型最新综述

中国人工智能学会

18+阅读 · 2019年4月8日

自然语言处理中注意力机制综述

自然语言处理中注意力机制综述

Python开发者

11+阅读 · 2019年1月31日

图神经网络综述：模型与应用

图神经网络综述：模型与应用

PaperWeekly

198+阅读 · 2018年12月26日

注意力机制(Attention)最新综述论文及相关源码

注意力机制(Attention)最新综述论文及相关源码

人工智能学家

30+阅读 · 2018年11月17日

【干货】注意力机制(Attention)最新综述论文及相关源码

【干货】注意力机制(Attention)最新综述论文及相关源码

GAN生成式对抗网络

11+阅读 · 2018年11月16日

注意力机制（Attention Mechanism）在自然语言处理中的应用

注意力机制（Attention Mechanism）在自然语言处理中的应用

全球人工智能

6+阅读 · 2018年3月28日

深度学习中的注意力机制

深度学习中的注意力机制

CSDN大数据

24+阅读 · 2017年11月2日

相关论文

A Survey on Contextual Embeddings

Arxiv

29+阅读 · 2020年3月16日

Talking-Heads Attention

Talking-Heads Attention

Arxiv

15+阅读 · 2020年3月5日

A Comprehensive Survey on Graph Neural Networks

A Comprehensive Survey on Graph Neural Networks

Arxiv

21+阅读 · 2019年1月3日

A Hierarchical Neural Network for Sequence-to-Sequences Learning

A Hierarchical Neural Network for Sequence-to-Sequences Learning

Arxiv

4+阅读 · 2018年11月23日

Global-and-local attention networks for visual recognition

Global-and-local attention networks for visual recognition

Arxiv

5+阅读 · 2018年9月6日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

Hyperbolic Attention Networks

Arxiv

9+阅读 · 2018年5月24日

Metric for Automatic Machine Translation Evaluation based on Universal Sentence Representations

Arxiv

4+阅读 · 2018年5月18日

Dual Recurrent Attention Units for Visual Question Answering

Arxiv

7+阅读 · 2018年2月1日

A Hierarchical Contextual Attention-based GRU Network for Sequential Recommendation

Arxiv

5+阅读 · 2017年12月7日

大家都在搜

CMU博士论文

无人机集群

软件无线电

国防科技创新

久别重逢话双塔

无人机测控通信自组网技术综述

微信扫码咨询专知VIP会员