【ICML2022】基于自适应上下文池化的高效表示学习 - 专知

会员服务 ·

0

【ICML2022】基于自适应上下文池化的高效表示学习

2022 年 7 月 9 日 专知

自注意力机制利用所有输入标记之间的成对注意力对长上下文进行建模。在此过程中，他们假设单个标记(例如，文本字符或图像像素)定义了固定的注意力粒度，这对于在更高级别上建模复杂依赖关系可能不是最优的。在本文中，我们提出了ContextPool，通过调整每个标记的注意粒度来解决这个问题。受ConvNets成功结合池化来捕获远程依赖的启发，我们学会了在给定的注意力层中计算注意力之前，为每个令牌池化邻近的特性。池权和支持大小是自适应确定的，允许池特性以不同的规模编码有意义的上下文。我们表明，ContextPool使注意力模型更具表现力，通常用更少的层实现强大的性能，从而显著降低成本。实验验证，当我们的ContextPool模块插入transformer 模型时，在几种语言和图像基准上使用较少的计算，匹配或超过了最先进的性能，在学习上下文大小或稀疏注意力模式方面优于最近的工作，也适用于ConvNets的高效特征学习。

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“RLCP” 就可以获取《【ICML2022】基于自适应上下文池化的高效表示学习》专知下载链接

专知，专业可信的人工智能知识分发 ，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取100000+AI(AI与军事、医药、公安等)主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取100000+AI主题知识资料

登录查看更多

0

相关内容

上下文

【ICML2022】在线决策Transformer

【ICML2022】在线决策Transformer

专知会员服务

34+阅读 · 2022年7月27日

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

专知会员服务

25+阅读 · 2022年7月8日

Transformer如何用于视频？最新「视频Transformer」2022综述

Transformer如何用于视频？最新「视频Transformer」2022综述

专知会员服务

76+阅读 · 2022年1月20日

【AAAI2022】基于双流更新的视觉Transformer动态加速方法

【AAAI2022】基于双流更新的视觉Transformer动态加速方法

专知会员服务

24+阅读 · 2021年12月11日

[ICML2021]记忆高效在线元学习

专知会员服务

25+阅读 · 2021年9月25日

【ICML2021】PoolingFormer：具有池化注意力机制的长序列输入模型

专知会员服务

35+阅读 · 2021年7月25日

新想法！Geoffrey Hinton独自署名论文，如何在神经网络中表示部分-整体层次结构，结构化表示获取可解释性

新想法！Geoffrey Hinton独自署名论文，如何在神经网络中表示部分-整体层次结构，结构化表示获取可解释性

专知会员服务

42+阅读 · 2021年2月27日

【AAAI2021】基于双任务一致性的半监督医学图像分割

专知会员服务

45+阅读 · 2021年1月31日

【NeurIPS2020】图神经网络中的池化再思考

【NeurIPS2020】图神经网络中的池化再思考

专知会员服务

52+阅读 · 2020年10月25日

【ACMMM2020-北航】KBGN:用于视觉对话中自适应视觉-文本推理的知识桥图网络

【ACMMM2020-北航】KBGN:用于视觉对话中自适应视觉-文本推理的知识桥图网络

专知会员服务

22+阅读 · 2020年8月12日

【ICML2022】时序自监督视频transformer

【ICML2022】时序自监督视频transformer

专知

1+阅读 · 2022年7月28日

【ICML2022】在线决策Transformer

【ICML2022】在线决策Transformer

专知

2+阅读 · 2022年7月27日

【ICML2022】几何多模态对比表示学习

【ICML2022】几何多模态对比表示学习

专知

2+阅读 · 2022年7月17日

【ICML2022】基于少样本策略泛化的决策Transformer

【ICML2022】基于少样本策略泛化的决策Transformer

专知

3+阅读 · 2022年7月11日

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

专知

0+阅读 · 2022年7月8日

【TMI2022】C2FTrans:用于医学图像分割的从粗到细的Transformers

【TMI2022】C2FTrans:用于医学图像分割的从粗到细的Transformers

专知

1+阅读 · 2022年7月4日

【ICML2022】深度潜在粒子的无监督图像表示学习

【ICML2022】深度潜在粒子的无监督图像表示学习

专知

2+阅读 · 2022年6月6日

【ICML2022】深度神经网络中的特征学习与信号传播

【ICML2022】深度神经网络中的特征学习与信号传播

专知

0+阅读 · 2022年6月2日

【ICML2022】刻画与克服多模态深度神经网络中的学习贪心特性

【ICML2022】刻画与克服多模态深度神经网络中的学习贪心特性

专知

0+阅读 · 2022年5月28日

【AAAI2022】注意力机制的快速蒙特卡罗近似

【AAAI2022】注意力机制的快速蒙特卡罗近似

专知

0+阅读 · 2022年2月5日

云环境多用户的情景化动态信任决策模型及算法的研究

国家自然科学基金

0+阅读 · 2015年12月31日

针对GPU的高效并行任务执行设计研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于视觉感知的HEVC优化策略研究

国家自然科学基金

0+阅读 · 2013年12月31日

语义知识驱动的网络上下文广告投放高效方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于自适应压缩感知的地震信号稀疏表示与高效重构

国家自然科学基金

0+阅读 · 2012年12月31日

基于自适应约束传播的约束求解方法研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于二维随机映射和一范数优化的有监督图像分类研究

国家自然科学基金

3+阅读 · 2011年12月31日

基于广义知识耦合的应急决策方法研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于网络编码的无线传感器网络能效与可靠安全的研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于MDL原理的图像语义特征分析方法研究

国家自然科学基金

0+阅读 · 2008年12月31日

Small Transformers Compute Universal Metric Embeddings

Arxiv

0+阅读 · 2022年9月14日

Neural Collaborative Reasoning

Arxiv

13+阅读 · 2021年5月3日

Contrastive Transformation for Self-supervised Correspondence Learning

Contrastive Transformation for Self-supervised Correspondence Learning

Arxiv

13+阅读 · 2020年12月9日

A Simple Framework for Contrastive Learning of Visual Representations

Arxiv

21+阅读 · 2020年2月13日

Learning Conceptual-Contexual Embeddings for Medical Text

Arxiv

27+阅读 · 2019年8月16日

Dynamic Graph Representation Learning via Self-Attention Networks

Arxiv

52+阅读 · 2019年6月15日

Self-Attention Graph Pooling

Self-Attention Graph Pooling

Arxiv

13+阅读 · 2019年6月13日

Cross-lingual Knowledge Graph Alignment via Graph Matching Neural Network

Arxiv

15+阅读 · 2019年5月28日

Learning Embedding Adaptation for Few-Shot Learning

Learning Embedding Adaptation for Few-Shot Learning

Arxiv

17+阅读 · 2018年12月10日

Dynamic Graph Neural Networks

Arxiv

24+阅读 · 2018年10月24日

VIP会员

相关主题

相关VIP内容

【ICML2022】在线决策Transformer

【ICML2022】在线决策Transformer

专知会员服务

34+阅读 · 2022年7月27日

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

专知会员服务

25+阅读 · 2022年7月8日

Transformer如何用于视频？最新「视频Transformer」2022综述

Transformer如何用于视频？最新「视频Transformer」2022综述

专知会员服务

76+阅读 · 2022年1月20日

【AAAI2022】基于双流更新的视觉Transformer动态加速方法

【AAAI2022】基于双流更新的视觉Transformer动态加速方法

专知会员服务

24+阅读 · 2021年12月11日

[ICML2021]记忆高效在线元学习

专知会员服务

25+阅读 · 2021年9月25日

【ICML2021】PoolingFormer：具有池化注意力机制的长序列输入模型

专知会员服务

35+阅读 · 2021年7月25日

新想法！Geoffrey Hinton独自署名论文，如何在神经网络中表示部分-整体层次结构，结构化表示获取可解释性

新想法！Geoffrey Hinton独自署名论文，如何在神经网络中表示部分-整体层次结构，结构化表示获取可解释性

专知会员服务

42+阅读 · 2021年2月27日

【AAAI2021】基于双任务一致性的半监督医学图像分割

专知会员服务

45+阅读 · 2021年1月31日

【NeurIPS2020】图神经网络中的池化再思考

【NeurIPS2020】图神经网络中的池化再思考

专知会员服务

52+阅读 · 2020年10月25日

【ACMMM2020-北航】KBGN:用于视觉对话中自适应视觉-文本推理的知识桥图网络

【ACMMM2020-北航】KBGN:用于视觉对话中自适应视觉-文本推理的知识桥图网络

专知会员服务

22+阅读 · 2020年8月12日

热门VIP内容

开通专知VIP会员享更多权益服务

新质生成式AI赋能产业变革的实践与路径

用于多模态大模型的离散标记化：全面综述

Nature综述：金融网络中的物理学

【CMU博士论文】通信高效且差分隐私的优化方法

相关资讯

【ICML2022】时序自监督视频transformer

【ICML2022】时序自监督视频transformer

专知

1+阅读 · 2022年7月28日

【ICML2022】在线决策Transformer

【ICML2022】在线决策Transformer

专知

2+阅读 · 2022年7月27日

【ICML2022】几何多模态对比表示学习

【ICML2022】几何多模态对比表示学习

专知

2+阅读 · 2022年7月17日

【ICML2022】基于少样本策略泛化的决策Transformer

【ICML2022】基于少样本策略泛化的决策Transformer

专知

3+阅读 · 2022年7月11日

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

专知

0+阅读 · 2022年7月8日

【TMI2022】C2FTrans:用于医学图像分割的从粗到细的Transformers

【TMI2022】C2FTrans:用于医学图像分割的从粗到细的Transformers

专知

1+阅读 · 2022年7月4日

【ICML2022】深度潜在粒子的无监督图像表示学习

【ICML2022】深度潜在粒子的无监督图像表示学习

专知

2+阅读 · 2022年6月6日

【ICML2022】深度神经网络中的特征学习与信号传播

【ICML2022】深度神经网络中的特征学习与信号传播

专知

0+阅读 · 2022年6月2日

【ICML2022】刻画与克服多模态深度神经网络中的学习贪心特性

【ICML2022】刻画与克服多模态深度神经网络中的学习贪心特性

专知

0+阅读 · 2022年5月28日

【AAAI2022】注意力机制的快速蒙特卡罗近似

【AAAI2022】注意力机制的快速蒙特卡罗近似

专知

0+阅读 · 2022年2月5日

相关基金

云环境多用户的情景化动态信任决策模型及算法的研究

国家自然科学基金

0+阅读 · 2015年12月31日

针对GPU的高效并行任务执行设计研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于视觉感知的HEVC优化策略研究

国家自然科学基金

0+阅读 · 2013年12月31日

语义知识驱动的网络上下文广告投放高效方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于自适应压缩感知的地震信号稀疏表示与高效重构

国家自然科学基金

0+阅读 · 2012年12月31日

基于自适应约束传播的约束求解方法研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于二维随机映射和一范数优化的有监督图像分类研究

国家自然科学基金

3+阅读 · 2011年12月31日

基于广义知识耦合的应急决策方法研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于网络编码的无线传感器网络能效与可靠安全的研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于MDL原理的图像语义特征分析方法研究

国家自然科学基金

0+阅读 · 2008年12月31日

相关论文

Small Transformers Compute Universal Metric Embeddings

Arxiv

0+阅读 · 2022年9月14日

Neural Collaborative Reasoning

Arxiv

13+阅读 · 2021年5月3日

Contrastive Transformation for Self-supervised Correspondence Learning

Contrastive Transformation for Self-supervised Correspondence Learning

Arxiv

13+阅读 · 2020年12月9日

A Simple Framework for Contrastive Learning of Visual Representations

Arxiv

21+阅读 · 2020年2月13日

Learning Conceptual-Contexual Embeddings for Medical Text

Arxiv

27+阅读 · 2019年8月16日

Dynamic Graph Representation Learning via Self-Attention Networks

Arxiv

52+阅读 · 2019年6月15日

Self-Attention Graph Pooling

Self-Attention Graph Pooling

Arxiv

13+阅读 · 2019年6月13日

Cross-lingual Knowledge Graph Alignment via Graph Matching Neural Network

Arxiv

15+阅读 · 2019年5月28日

Learning Embedding Adaptation for Few-Shot Learning

Learning Embedding Adaptation for Few-Shot Learning

Arxiv

17+阅读 · 2018年12月10日

Dynamic Graph Neural Networks

Arxiv

24+阅读 · 2018年10月24日

大家都在搜

大型语言模型

CMU博士论文

软件无线电

无人机测控通信自组网技术综述

微信扫码咨询专知VIP会员