【ICML2021】贝叶斯注意力信念网络 - 专知VIP

会员服务 ·

5

ICML 2021 · 贝叶斯建模 · 神经网络 · 注意力 ·

2021 年 6 月 11 日

【ICML2021】贝叶斯注意力信念网络

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

基于注意力的神经网络已经在许多任务上取得了最先进的成果。这类模型大多采用确定性注意力，而随机注意力由于优化困难或模型设计复杂，研究较少。本文介绍了贝叶斯注意力信念网络，该网络通过将非归一化的注意力权值建立在伽马分布的层次上来构造解码器网络，通过将具有确定性-向上-随机-向下结构的Weibull分布叠加来近似后变分布来构造编码器网络。所得到的自编码网络可以以一种变分下界的可微方式进行优化。任何具有确定性注意力的模型，包括预训练过的模型，都可以简单地转换为所提出的贝叶斯注意力信念网络。在各种语言理解任务中，我们证明了我们的方法在准确性、不确定性估计、跨域泛化和对抗攻击的鲁棒性方面优于确定性注意和最新的随机注意力。我们进一步证明了该方法在神经机器翻译和视觉问答方面的普遍适用性，显示了将该方法整合到各种注意力相关任务中的巨大潜力。

https://www.zhuanzhi.ai/paper/0488b7f68e55c8ab23e726bc5b66d5f5

成为VIP会员查看完整内容

39

相关内容

ICML 2021

【ICML2021】在线与非随机控制，普林斯顿等教程，82页ppt

专知会员服务

20+阅读 · 2021年7月28日

【ICML2021】动量残差神经网络

专知会员服务

31+阅读 · 2021年7月19日

【ICML2021】弹性图神经网络

专知会员服务

37+阅读 · 2021年7月17日

【ICML2021】统一鲁棒半监督变分自编码器

专知会员服务

27+阅读 · 2021年7月11日

【ICML2021】数据表示的几何评估

专知会员服务

38+阅读 · 2021年6月3日

【ICML2021】深度残差网络的可扩展特性

专知会员服务

20+阅读 · 2021年5月30日

【ICML2021】贝叶斯神经网络的后验到底是什么样的?

专知会员服务

33+阅读 · 2021年5月18日

【ICML2021】图神经网络优化：通过跳过连接和更多深度隐含加速

专知会员服务

34+阅读 · 2021年5月17日

【ICML2021】有向图网络

专知会员服务

82+阅读 · 2021年5月10日

WSDM 2020教程《深度贝叶斯数据挖掘》，附257页PPT下载

WSDM 2020教程《深度贝叶斯数据挖掘》，附257页PPT下载

专知会员服务

157+阅读 · 2020年2月7日

注意力图神经网络的多标签文本分类

注意力图神经网络的多标签文本分类

专知

8+阅读 · 2020年3月28日

基于关系网络的视觉建模：有望替代卷积神经网络

基于关系网络的视觉建模：有望替代卷积神经网络

微软研究院AI头条

10+阅读 · 2019年7月12日

论文浅尝 | 混合注意力原型网络的含噪音少样本的关系分类

论文浅尝 | 混合注意力原型网络的含噪音少样本的关系分类

开放知识图谱

12+阅读 · 2019年5月26日

已删除

架构文摘

3+阅读 · 2019年4月17日

AAAI2019教程抢先看！《深度贝叶斯与序列学习》，279页PPT带你知晓深度贝叶斯序列模型在NLP最新进展

AAAI2019教程抢先看！《深度贝叶斯与序列学习》，279页PPT带你知晓深度贝叶斯序列模型在NLP最新进展

专知

28+阅读 · 2019年1月27日

贝叶斯卷积神经网络：架起深度学习与统计学的桥梁-附PDF下载

贝叶斯卷积神经网络：架起深度学习与统计学的桥梁-附PDF下载

专知

41+阅读 · 2019年1月22日

学界 | 稳定、表征丰富的球面变分自编码器

学界 | 稳定、表征丰富的球面变分自编码器

机器之心

5+阅读 · 2018年10月12日

深度学习贝叶斯，这是一份密集的6天速成课程（附视频与PPT）

深度学习贝叶斯，这是一份密集的6天速成课程（附视频与PPT）

数据派THU

17+阅读 · 2018年9月23日

再谈变分自编码器VAE：从贝叶斯观点出发

再谈变分自编码器VAE：从贝叶斯观点出发

PaperWeekly

13+阅读 · 2018年4月2日

一文帮你理解什么是深层置信网络（DBN）

一文帮你理解什么是深层置信网络（DBN）

AI100

6+阅读 · 2018年1月11日

Tikhonov Regularization of Circle-Valued Signals

Tikhonov Regularization of Circle-Valued Signals

Arxiv

0+阅读 · 2021年8月5日

Existence and polynomial time construction of biregular, bipartite Ramanujan graphs of all degrees

Arxiv

0+阅读 · 2021年8月5日

Machine Learning Classification Methods and Portfolio Allocation: An Examination of Market Efficiency

Arxiv

0+阅读 · 2021年8月4日

Efficient Data Management with a Flexible Address Space

Arxiv

0+阅读 · 2021年8月4日

Pay Attention to MLPs

Arxiv

28+阅读 · 2021年5月17日

Colorization Transformer

Arxiv

9+阅读 · 2021年2月8日

Stock Chart Pattern recognition with Deep Learning

Stock Chart Pattern recognition with Deep Learning

Arxiv

6+阅读 · 2018年8月1日

Approximability of Discriminators Implies Diversity in GANs

Approximability of Discriminators Implies Diversity in GANs

Arxiv

4+阅读 · 2018年6月27日

Dependent Gated Reading for Cloze-Style Question Answering

Arxiv

4+阅读 · 2018年6月1日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

VIP会员

相关主题

贝叶斯建模

相关VIP内容

【ICML2021】在线与非随机控制，普林斯顿等教程，82页ppt

专知会员服务

20+阅读 · 2021年7月28日

【ICML2021】动量残差神经网络

专知会员服务

31+阅读 · 2021年7月19日

【ICML2021】弹性图神经网络

专知会员服务

37+阅读 · 2021年7月17日

【ICML2021】统一鲁棒半监督变分自编码器

专知会员服务

27+阅读 · 2021年7月11日

【ICML2021】数据表示的几何评估

专知会员服务

38+阅读 · 2021年6月3日

【ICML2021】深度残差网络的可扩展特性

专知会员服务

20+阅读 · 2021年5月30日

【ICML2021】贝叶斯神经网络的后验到底是什么样的?

专知会员服务

33+阅读 · 2021年5月18日

【ICML2021】图神经网络优化：通过跳过连接和更多深度隐含加速

专知会员服务

34+阅读 · 2021年5月17日

【ICML2021】有向图网络

专知会员服务

82+阅读 · 2021年5月10日

WSDM 2020教程《深度贝叶斯数据挖掘》，附257页PPT下载

WSDM 2020教程《深度贝叶斯数据挖掘》，附257页PPT下载

专知会员服务

157+阅读 · 2020年2月7日

热门VIP内容

开通专知VIP会员享更多权益服务

《战区安全决策课程体系》最新244页

《"无人机航母"原型平台》

任务规划与地形分析：现代复杂环境作战导航体系

《攻击场景描述形式化模型研究》

相关资讯

注意力图神经网络的多标签文本分类

注意力图神经网络的多标签文本分类

专知

8+阅读 · 2020年3月28日

基于关系网络的视觉建模：有望替代卷积神经网络

基于关系网络的视觉建模：有望替代卷积神经网络

微软研究院AI头条

10+阅读 · 2019年7月12日

论文浅尝 | 混合注意力原型网络的含噪音少样本的关系分类

论文浅尝 | 混合注意力原型网络的含噪音少样本的关系分类

开放知识图谱

12+阅读 · 2019年5月26日

已删除

架构文摘

3+阅读 · 2019年4月17日

AAAI2019教程抢先看！《深度贝叶斯与序列学习》，279页PPT带你知晓深度贝叶斯序列模型在NLP最新进展

AAAI2019教程抢先看！《深度贝叶斯与序列学习》，279页PPT带你知晓深度贝叶斯序列模型在NLP最新进展

专知

28+阅读 · 2019年1月27日

贝叶斯卷积神经网络：架起深度学习与统计学的桥梁-附PDF下载

贝叶斯卷积神经网络：架起深度学习与统计学的桥梁-附PDF下载

专知

41+阅读 · 2019年1月22日

学界 | 稳定、表征丰富的球面变分自编码器

学界 | 稳定、表征丰富的球面变分自编码器

机器之心

5+阅读 · 2018年10月12日

深度学习贝叶斯，这是一份密集的6天速成课程（附视频与PPT）

深度学习贝叶斯，这是一份密集的6天速成课程（附视频与PPT）

数据派THU

17+阅读 · 2018年9月23日

再谈变分自编码器VAE：从贝叶斯观点出发

再谈变分自编码器VAE：从贝叶斯观点出发

PaperWeekly

13+阅读 · 2018年4月2日

一文帮你理解什么是深层置信网络（DBN）

一文帮你理解什么是深层置信网络（DBN）

AI100

6+阅读 · 2018年1月11日

相关论文

Tikhonov Regularization of Circle-Valued Signals

Tikhonov Regularization of Circle-Valued Signals

Arxiv

0+阅读 · 2021年8月5日

Existence and polynomial time construction of biregular, bipartite Ramanujan graphs of all degrees

Arxiv

0+阅读 · 2021年8月5日

Machine Learning Classification Methods and Portfolio Allocation: An Examination of Market Efficiency

Arxiv

0+阅读 · 2021年8月4日

Efficient Data Management with a Flexible Address Space

Arxiv

0+阅读 · 2021年8月4日

Pay Attention to MLPs

Arxiv

28+阅读 · 2021年5月17日

Colorization Transformer

Arxiv

9+阅读 · 2021年2月8日

Stock Chart Pattern recognition with Deep Learning

Stock Chart Pattern recognition with Deep Learning

Arxiv

6+阅读 · 2018年8月1日

Approximability of Discriminators Implies Diversity in GANs

Approximability of Discriminators Implies Diversity in GANs

Arxiv

4+阅读 · 2018年6月27日

Dependent Gated Reading for Cloze-Style Question Answering

Arxiv

4+阅读 · 2018年6月1日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

微信扫码咨询专知VIP会员