【亚马逊网络服务总监Alexander J. Smola报告】深度学习注意力机制-Attention in Deep learning-附101页PPT - 专知VIP

会员服务 ·

16

非参数化回归 · 非参数模型 · Aston Zhang · 深度学习 · 专知公众号VIP ·

2019 年 6 月 11 日

【亚马逊网络服务总监Alexander J. Smola报告】深度学习注意力机制-Attention in Deep learning-附101页PPT

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

报告题目： Attention in Deep learning

摘要：

注意力是非参数模型在深度学习中的关键机制。可以说，这是深度学习模型最新进展的基础。除了在神经机器翻译中介绍，它还可以追溯到神经科学。并且可以说是通过LSTMs的门控或遗忘机制引入的。在过去的5年里，注意力一直是推动自然语言处理、计算机视觉、语音识别、图像合成、解决旅行推销员问题或强化学习等领域的技术发展的关键。本教程对各种注意事项提供了一个连贯的概述，让其亲身体验如何复制和应用注意力机制，并且更深入地了解潜在的理论，详细展示了从最早的NWE到最新的Multiple Attention Heads的相关内容。

报告主要分为六个部分：

Watson Nadaraya Estimator（NWE）：最早的非参数回归（Nonparametric Regression）的工具之一，更具体地说是最早核回归技术（Kernel Regression Technique）由Nadaraya和Watson两人同时于1964年独立的提出。
池化 Pooling
- 单目标 - 从池化 pooling 到注意力池化 attention pooling
- 层次结构 - 分层注意力网络 Hierarchical attention network
迭代池化 Iterative Pooling
- 问答 Question answering / 记忆网络 memory networks
迭代池化与生成器 Iterative Pooling and Generation
- 神经机器翻译
多头注意力网络 Multiple Attention Heads
- Transformers / BERT
- Lightweight, structured, sparse
资源

邀请嘉宾：

Alexander J. Smola是亚马逊网络服务总监,2016年7月，加入了亚马逊网络服务(Amazon Web Services)，打造人工智能和机器学习工具。主要研究兴趣包括深度学习：特别是状态更新、不变性和统计测试的算法；算法的可伸缩性、统计建模。

Aston Zhang是亚马逊网络服务人工智能的一名应用科学家。他的研究兴趣是深度学习。他在伊利诺伊大学香槟分校获得了计算机科学博士学位。他曾担任大数据前沿的编委会成员和ICML、NeurIPS、WWW、KDD、SIGIR和WSDM的项目委员会成员(审稿人)。他的书《深入学习》(Dive into Deep Learning)于2019年春季在加州大学伯克利分校(UC Berkeley)教授，并已被全世界用作教科书。

成为VIP会员查看完整内容

Attention in Deep Learning.pdf

68

相关内容

非参数化回归

非参数化回归

非参数化回归是指并不需要知道总的分布的情况下进行的一种统计推断回归方法。

【DeepMind硬核课】深度学习注意力与记忆机制，附70页ppt与视频

【DeepMind硬核课】深度学习注意力与记忆机制，附70页ppt与视频

专知会员服务

172+阅读 · 2020年6月25日

MIT-深度学习Deep Learning State of the Art in 2020，87页ppt

MIT-深度学习Deep Learning State of the Art in 2020，87页ppt

专知会员服务

62+阅读 · 2020年2月17日

【Yoshua Bengio演讲NeurIPS2019报告】深度学习系统1代到2代，36页ppt，From System 1 Deep Learning to System 2 Deep Learning

【Yoshua Bengio演讲NeurIPS2019报告】深度学习系统1代到2代，36页ppt，From System 1 Deep Learning to System 2 Deep Learning

专知会员服务

106+阅读 · 2019年12月11日

【北京智源大会2019】贝叶斯深度学习（ Bayesian Deep Learning ），清华大学| 朱军

【北京智源大会2019】贝叶斯深度学习（ Bayesian Deep Learning ），清华大学| 朱军

专知会员服务

105+阅读 · 2019年11月22日

【南洋理工大学课程】图神经网络，Graph Neural Networks，附121页PPT

【南洋理工大学课程】图神经网络，Graph Neural Networks，附121页PPT

专知会员服务

254+阅读 · 2019年11月9日

【南洋理工大学课程】注意力神经网络，Attention Neural Networks，附78页PPT

【南洋理工大学课程】注意力神经网络，Attention Neural Networks，附78页PPT

专知会员服务

157+阅读 · 2019年11月9日

【Amazon AWS】深度学习编译器（Deep Learning Compiler），附35页ppt

【Amazon AWS】深度学习编译器（Deep Learning Compiler），附35页ppt

专知会员服务

43+阅读 · 2019年11月5日

知识指导的自然语言处理 [微信模式识别中心林衍凯] CCKS ATT 16-2019

知识指导的自然语言处理 [微信模式识别中心林衍凯] CCKS ATT 16-2019

专知会员服务

47+阅读 · 2019年10月25日

注意力机制介绍，Attention Mechanism

注意力机制介绍，Attention Mechanism

专知会员服务

171+阅读 · 2019年10月13日

【ICML2019 Tutorials】深度学习中的注意力（A Tutorial on Attention in Deep Learning），Amazon Web Services应用科学家| Aston Zhang，Amazon Web Services机器学习总监| Alex Smola

【ICML2019 Tutorials】深度学习中的注意力（A Tutorial on Attention in Deep Learning），Amazon Web Services应用科学家| Aston Zhang，Amazon Web Services机器学习总监| Alex Smola

专知会员服务

33+阅读 · 2019年6月10日

深度学习注意力机制-Attention in Deep learning-附101页PPT

深度学习注意力机制-Attention in Deep learning-附101页PPT

专知

139+阅读 · 2019年9月23日

台大李宏毅：生成式对抗网络GAN在语音自然语言处理中的应用|附247页PPT下载

台大李宏毅：生成式对抗网络GAN在语音自然语言处理中的应用|附247页PPT下载

新智元

18+阅读 · 2019年9月22日

深度学习的下一步：Transformer和注意力机制

深度学习的下一步：Transformer和注意力机制

云头条

56+阅读 · 2019年9月14日

【复旦大学邱锡鹏老师】面向自然语言处理的深度学习基础，199页ppt

【复旦大学邱锡鹏老师】面向自然语言处理的深度学习基础，199页ppt

专知

159+阅读 · 2019年9月8日

BERT/Transformer/迁移学习NLP资源大列表

BERT/Transformer/迁移学习NLP资源大列表

专知

19+阅读 · 2019年6月9日

【PPT】大规模网络的社区检测和排序问题综述

【PPT】大规模网络的社区检测和排序问题综述

专知

12+阅读 · 2019年5月30日

亚马逊首席科学家MXNet作者李沐开讲: 伯克利2019深度学习课程，不可错过

亚马逊首席科学家MXNet作者李沐开讲: 伯克利2019深度学习课程，不可错过

专知

12+阅读 · 2018年12月23日

2018斯坦福CS 20深度学习Tensorflow实战课程（附PPT下载）

2018斯坦福CS 20深度学习Tensorflow实战课程（附PPT下载）

专知

28+阅读 · 2018年1月13日

DeepMind深度学习最佳实践与新技术展望，181页PPT全景展示最近深度学习技术

DeepMind深度学习最佳实践与新技术展望，181页PPT全景展示最近深度学习技术

人工智能学家

5+阅读 · 2017年12月14日

深度学习中的注意力机制

深度学习中的注意力机制

人工智能头条

16+阅读 · 2017年11月2日

Do RNN and LSTM have Long Memory?

Do RNN and LSTM have Long Memory?

Arxiv

19+阅读 · 2020年6月10日

Talking-Heads Attention

Talking-Heads Attention

Arxiv

15+阅读 · 2020年3月5日

Learning to Propagate Labels: Transductive Propagation Network for Few-shot Learning

Arxiv

21+阅读 · 2018年12月25日

Graph2Seq: Graph to Sequence Learning with Attention-based Neural Networks

Graph2Seq: Graph to Sequence Learning with Attention-based Neural Networks

Arxiv

7+阅读 · 2018年12月3日

Deep learning in agriculture: A survey

Arxiv

11+阅读 · 2018年7月31日

Aspect Based Sentiment Analysis with Gated Convolutional Networks

Arxiv

12+阅读 · 2018年5月18日

Online Deep Metric Learning

Arxiv

8+阅读 · 2018年5月15日

Recent Trends in Deep Learning Based Natural Language Processing

Arxiv

7+阅读 · 2018年2月20日

Learning Hierarchical Features for Visual Object Tracking with Recursive Neural Networks

Arxiv

13+阅读 · 2018年1月6日

Deep CTR Prediction in Display Advertising

Arxiv

4+阅读 · 2016年9月20日

VIP会员

相关主题

非参数化回归

非参数模型

专知公众号VIP

相关VIP内容

【DeepMind硬核课】深度学习注意力与记忆机制，附70页ppt与视频

【DeepMind硬核课】深度学习注意力与记忆机制，附70页ppt与视频

专知会员服务

172+阅读 · 2020年6月25日

MIT-深度学习Deep Learning State of the Art in 2020，87页ppt

MIT-深度学习Deep Learning State of the Art in 2020，87页ppt

专知会员服务

62+阅读 · 2020年2月17日

【Yoshua Bengio演讲NeurIPS2019报告】深度学习系统1代到2代，36页ppt，From System 1 Deep Learning to System 2 Deep Learning

【Yoshua Bengio演讲NeurIPS2019报告】深度学习系统1代到2代，36页ppt，From System 1 Deep Learning to System 2 Deep Learning

专知会员服务

106+阅读 · 2019年12月11日

【北京智源大会2019】贝叶斯深度学习（ Bayesian Deep Learning ），清华大学| 朱军

【北京智源大会2019】贝叶斯深度学习（ Bayesian Deep Learning ），清华大学| 朱军

专知会员服务

105+阅读 · 2019年11月22日

【南洋理工大学课程】图神经网络，Graph Neural Networks，附121页PPT

【南洋理工大学课程】图神经网络，Graph Neural Networks，附121页PPT

专知会员服务

254+阅读 · 2019年11月9日

【南洋理工大学课程】注意力神经网络，Attention Neural Networks，附78页PPT

【南洋理工大学课程】注意力神经网络，Attention Neural Networks，附78页PPT

专知会员服务

157+阅读 · 2019年11月9日

【Amazon AWS】深度学习编译器（Deep Learning Compiler），附35页ppt

【Amazon AWS】深度学习编译器（Deep Learning Compiler），附35页ppt

专知会员服务

43+阅读 · 2019年11月5日

知识指导的自然语言处理 [微信模式识别中心林衍凯] CCKS ATT 16-2019

知识指导的自然语言处理 [微信模式识别中心林衍凯] CCKS ATT 16-2019

专知会员服务

47+阅读 · 2019年10月25日

注意力机制介绍，Attention Mechanism

注意力机制介绍，Attention Mechanism

专知会员服务

171+阅读 · 2019年10月13日

【ICML2019 Tutorials】深度学习中的注意力（A Tutorial on Attention in Deep Learning），Amazon Web Services应用科学家| Aston Zhang，Amazon Web Services机器学习总监| Alex Smola

【ICML2019 Tutorials】深度学习中的注意力（A Tutorial on Attention in Deep Learning），Amazon Web Services应用科学家| Aston Zhang，Amazon Web Services机器学习总监| Alex Smola

专知会员服务

33+阅读 · 2019年6月10日

热门VIP内容

开通专知VIP会员享更多权益服务

操作系统智能体：基于多模态大模型（MLLM）的通用计算设备智能体综述

《美国太空军系统全生命周期建模、仿真与分析效能提升方案》最新84页报告

【博士论文】推进数据高效的深度学习：非参数 Transformer、主动测试与上下文学习

自主人工智能：未来战争是否将是自主化的？

相关资讯

深度学习注意力机制-Attention in Deep learning-附101页PPT

深度学习注意力机制-Attention in Deep learning-附101页PPT

专知

139+阅读 · 2019年9月23日

台大李宏毅：生成式对抗网络GAN在语音自然语言处理中的应用|附247页PPT下载

台大李宏毅：生成式对抗网络GAN在语音自然语言处理中的应用|附247页PPT下载

新智元

18+阅读 · 2019年9月22日

深度学习的下一步：Transformer和注意力机制

深度学习的下一步：Transformer和注意力机制

云头条

56+阅读 · 2019年9月14日

【复旦大学邱锡鹏老师】面向自然语言处理的深度学习基础，199页ppt

【复旦大学邱锡鹏老师】面向自然语言处理的深度学习基础，199页ppt

专知

159+阅读 · 2019年9月8日

BERT/Transformer/迁移学习NLP资源大列表

BERT/Transformer/迁移学习NLP资源大列表

专知

19+阅读 · 2019年6月9日

【PPT】大规模网络的社区检测和排序问题综述

【PPT】大规模网络的社区检测和排序问题综述

专知

12+阅读 · 2019年5月30日

亚马逊首席科学家MXNet作者李沐开讲: 伯克利2019深度学习课程，不可错过

亚马逊首席科学家MXNet作者李沐开讲: 伯克利2019深度学习课程，不可错过

专知

12+阅读 · 2018年12月23日

2018斯坦福CS 20深度学习Tensorflow实战课程（附PPT下载）

2018斯坦福CS 20深度学习Tensorflow实战课程（附PPT下载）

专知

28+阅读 · 2018年1月13日

DeepMind深度学习最佳实践与新技术展望，181页PPT全景展示最近深度学习技术

DeepMind深度学习最佳实践与新技术展望，181页PPT全景展示最近深度学习技术

人工智能学家

5+阅读 · 2017年12月14日

深度学习中的注意力机制

深度学习中的注意力机制

人工智能头条

16+阅读 · 2017年11月2日

相关论文

Do RNN and LSTM have Long Memory?

Do RNN and LSTM have Long Memory?

Arxiv

19+阅读 · 2020年6月10日

Talking-Heads Attention

Talking-Heads Attention

Arxiv

15+阅读 · 2020年3月5日

Learning to Propagate Labels: Transductive Propagation Network for Few-shot Learning

Arxiv

21+阅读 · 2018年12月25日

Graph2Seq: Graph to Sequence Learning with Attention-based Neural Networks

Graph2Seq: Graph to Sequence Learning with Attention-based Neural Networks

Arxiv

7+阅读 · 2018年12月3日

Deep learning in agriculture: A survey

Arxiv

11+阅读 · 2018年7月31日

Aspect Based Sentiment Analysis with Gated Convolutional Networks

Arxiv

12+阅读 · 2018年5月18日

Online Deep Metric Learning

Arxiv

8+阅读 · 2018年5月15日

Recent Trends in Deep Learning Based Natural Language Processing

Arxiv

7+阅读 · 2018年2月20日

Learning Hierarchical Features for Visual Object Tracking with Recursive Neural Networks

Arxiv

13+阅读 · 2018年1月6日

Deep CTR Prediction in Display Advertising

Arxiv

4+阅读 · 2016年9月20日

微信扫码咨询专知VIP会员