【ICML2022】基于自适应上下文池化的高效表示学习 - 专知VIP

会员服务 ·

9

ICML 2022 · 表示学习 · 自注意力机制 ·

2022 年 7 月 9 日

【ICML2022】基于自适应上下文池化的高效表示学习

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

自注意力机制利用所有输入标记之间的成对注意力对长上下文进行建模。在此过程中，他们假设单个标记(例如，文本字符或图像像素)定义了固定的注意力粒度，这对于在更高级别上建模复杂依赖关系可能不是最优的。在本文中，我们提出了ContextPool，通过调整每个标记的注意粒度来解决这个问题。受ConvNets成功结合池化来捕获远程依赖的启发，我们学会了在给定的注意力层中计算注意力之前，为每个令牌池化邻近的特性。池权和支持大小是自适应确定的，允许池特性以不同的规模编码有意义的上下文。我们表明，ContextPool使注意力模型更具表现力，通常用更少的层实现强大的性能，从而显著降低成本。实验验证，当我们的ContextPool模块插入transformer 模型时，在几种语言和图像基准上使用较少的计算，匹配或超过了最先进的性能，在学习上下文大小或稀疏注意力模式方面优于最近的工作，也适用于ConvNets的高效特征学习。

成为VIP会员查看完整内容

20

相关内容

ICML 2022

国际机器学习大会(International Conference on Machine Learning，简称ICML ) 是由国际机器学习学会（IMLS）主办的机器学习国际顶级会议，也是CCF-A类学术会议。ICML 2022 共收到5630 投稿，接收1117 篇 short oral，118篇 long oral，录用率为21.94%。

【ICML2022】几何多模态对比表示学习

【ICML2022】几何多模态对比表示学习

专知会员服务

45+阅读 · 2022年7月17日

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

专知会员服务

25+阅读 · 2022年7月8日

【ICML2022】结构感知Transformer的图表示学习

【ICML2022】结构感知Transformer的图表示学习

专知会员服务

49+阅读 · 2022年6月17日

【ICML2022】Transformer是元强化学习器

【ICML2022】Transformer是元强化学习器

专知会员服务

56+阅读 · 2022年6月15日

【ICML2022】深度潜在粒子的无监督图像表示学习

【ICML2022】深度潜在粒子的无监督图像表示学习

专知会员服务

8+阅读 · 2022年6月6日

[ICML2021]记忆高效在线元学习

专知会员服务

25+阅读 · 2021年9月25日

【ICML2021】PoolingFormer：具有池化注意力机制的长序列输入模型

专知会员服务

35+阅读 · 2021年7月25日

【视频】几何数据嵌入表示学习，74页ppt

【视频】几何数据嵌入表示学习，74页ppt

专知会员服务

35+阅读 · 2020年7月24日

Transformer文本分类代码

Transformer文本分类代码

专知会员服务

118+阅读 · 2020年2月3日

【CCF优秀博士学位论文奖-2019】表示学习的高效算法，清华大学陈健飞

【CCF优秀博士学位论文奖-2019】表示学习的高效算法，清华大学陈健飞

专知会员服务

48+阅读 · 2019年11月8日

【ICML2022】几何多模态对比表示学习

【ICML2022】几何多模态对比表示学习

专知

2+阅读 · 2022年7月17日

论文浅尝 | 基于正交普鲁克分析的高效知识图嵌入学习

论文浅尝 | 基于正交普鲁克分析的高效知识图嵌入学习

开放知识图谱

2+阅读 · 2022年1月9日

Meta AI提出PatchConvNet：利用基于注意力的聚合来增强卷积网络

Meta AI提出PatchConvNet：利用基于注意力的聚合来增强卷积网络

CVer

0+阅读 · 2022年1月8日

88.8%准确率！FAIR提出：改进多尺度视觉Transformer

88.8%准确率！FAIR提出：改进多尺度视觉Transformer

CVer

0+阅读 · 2021年12月5日

把Transformer结构剪成ResNet结构！新的MSA和卷积操作之间的权重共享方案

把Transformer结构剪成ResNet结构！新的MSA和卷积操作之间的权重共享方案

极市平台

3+阅读 · 2021年11月28日

【WSDM2022】具有分层注意力的表示学习

【WSDM2022】具有分层注意力的表示学习

图与推荐

1+阅读 · 2021年11月17日

【论文笔记】通过自注意力网络的动态图表示学习

【论文笔记】通过自注意力网络的动态图表示学习

专知

89+阅读 · 2019年12月2日

【论文笔记】自注意力图池化

【论文笔记】自注意力图池化

专知

82+阅读 · 2019年11月18日

学界 | 图神经网络+池化模块，斯坦福等提出层级图表征学习

学界 | 图神经网络+池化模块，斯坦福等提出层级图表征学习

机器之心

30+阅读 · 2018年7月16日

短文本情感分析关键技术研究

国家自然科学基金

9+阅读 · 2015年12月31日

基于深层神经网络的多模态快速稀疏表征器

国家自然科学基金

3+阅读 · 2014年12月31日

基于社会网络的图像语义特征提取与描述方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于语义多边图的多物体图像类别发现及其在图像检索中的应用

国家自然科学基金

0+阅读 · 2012年12月31日

语义知识驱动的网络上下文广告投放高效方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于域知识的自定义Web对象自动抽取技术

国家自然科学基金

0+阅读 · 2012年12月31日

文本多粒度关系抽取半监督自适应学习的研究

国家自然科学基金

4+阅读 · 2012年12月31日

基于动态邻域的空间实体自适应最优匹配方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于二维随机映射和一范数优化的有监督图像分类研究

国家自然科学基金

3+阅读 · 2011年12月31日

基于半监督结构化学习的跨语言映射研究

国家自然科学基金

2+阅读 · 2011年12月31日

A Self-supervised Riemannian GNN with Time Varying Curvature for Temporal Graph Learning

Arxiv

0+阅读 · 2022年8月30日

Latent Heterogeneous Graph Network for Incomplete Multi-View Learning

Arxiv

0+阅读 · 2022年8月29日

SiT: Self-supervised vIsion Transformer

Arxiv

19+阅读 · 2021年4月8日

Multi-Label Text Classification using Attention-based Graph Neural Network

Arxiv

46+阅读 · 2020年3月22日

Graph Transformer Networks

Arxiv

15+阅读 · 2020年2月5日

UNITER: Learning UNiversal Image-TExt Representations

UNITER: Learning UNiversal Image-TExt Representations

Arxiv

23+阅读 · 2019年9月25日

Learning Embedding Adaptation for Few-Shot Learning

Learning Embedding Adaptation for Few-Shot Learning

Arxiv

17+阅读 · 2018年12月10日

Distance-based Self-Attention Network for Natural Language Inference

Arxiv

10+阅读 · 2017年12月6日

Deep Semantic Role Labeling with Self-Attention

Arxiv

13+阅读 · 2017年12月5日

DiSAN: Directional Self-Attention Network for RNN/CNN-Free Language Understanding

Arxiv

16+阅读 · 2017年11月20日

VIP会员

相关主题

自注意力机制

相关VIP内容

【ICML2022】几何多模态对比表示学习

【ICML2022】几何多模态对比表示学习

专知会员服务

45+阅读 · 2022年7月17日

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

专知会员服务

25+阅读 · 2022年7月8日

【ICML2022】结构感知Transformer的图表示学习

【ICML2022】结构感知Transformer的图表示学习

专知会员服务

49+阅读 · 2022年6月17日

【ICML2022】Transformer是元强化学习器

【ICML2022】Transformer是元强化学习器

专知会员服务

56+阅读 · 2022年6月15日

【ICML2022】深度潜在粒子的无监督图像表示学习

【ICML2022】深度潜在粒子的无监督图像表示学习

专知会员服务

8+阅读 · 2022年6月6日

[ICML2021]记忆高效在线元学习

专知会员服务

25+阅读 · 2021年9月25日

【ICML2021】PoolingFormer：具有池化注意力机制的长序列输入模型

专知会员服务

35+阅读 · 2021年7月25日

【视频】几何数据嵌入表示学习，74页ppt

【视频】几何数据嵌入表示学习，74页ppt

专知会员服务

35+阅读 · 2020年7月24日

Transformer文本分类代码

Transformer文本分类代码

专知会员服务

118+阅读 · 2020年2月3日

【CCF优秀博士学位论文奖-2019】表示学习的高效算法，清华大学陈健飞

【CCF优秀博士学位论文奖-2019】表示学习的高效算法，清华大学陈健飞

专知会员服务

48+阅读 · 2019年11月8日

热门VIP内容

开通专知VIP会员享更多权益服务

操作系统智能体：基于多模态大模型（MLLM）的通用计算设备智能体综述

《美国太空军系统全生命周期建模、仿真与分析效能提升方案》最新84页报告

【博士论文】推进数据高效的深度学习：非参数 Transformer、主动测试与上下文学习

自主人工智能：未来战争是否将是自主化的？

相关资讯

【ICML2022】几何多模态对比表示学习

【ICML2022】几何多模态对比表示学习

专知

2+阅读 · 2022年7月17日

论文浅尝 | 基于正交普鲁克分析的高效知识图嵌入学习

论文浅尝 | 基于正交普鲁克分析的高效知识图嵌入学习

开放知识图谱

2+阅读 · 2022年1月9日

Meta AI提出PatchConvNet：利用基于注意力的聚合来增强卷积网络

Meta AI提出PatchConvNet：利用基于注意力的聚合来增强卷积网络

CVer

0+阅读 · 2022年1月8日

88.8%准确率！FAIR提出：改进多尺度视觉Transformer

88.8%准确率！FAIR提出：改进多尺度视觉Transformer

CVer

0+阅读 · 2021年12月5日

把Transformer结构剪成ResNet结构！新的MSA和卷积操作之间的权重共享方案

把Transformer结构剪成ResNet结构！新的MSA和卷积操作之间的权重共享方案

极市平台

3+阅读 · 2021年11月28日

【WSDM2022】具有分层注意力的表示学习

【WSDM2022】具有分层注意力的表示学习

图与推荐

1+阅读 · 2021年11月17日

【论文笔记】通过自注意力网络的动态图表示学习

【论文笔记】通过自注意力网络的动态图表示学习

专知

89+阅读 · 2019年12月2日

【论文笔记】自注意力图池化

【论文笔记】自注意力图池化

专知

82+阅读 · 2019年11月18日

学界 | 图神经网络+池化模块，斯坦福等提出层级图表征学习

学界 | 图神经网络+池化模块，斯坦福等提出层级图表征学习

机器之心

30+阅读 · 2018年7月16日

相关基金

短文本情感分析关键技术研究

国家自然科学基金

9+阅读 · 2015年12月31日

基于深层神经网络的多模态快速稀疏表征器

国家自然科学基金

3+阅读 · 2014年12月31日

基于社会网络的图像语义特征提取与描述方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于语义多边图的多物体图像类别发现及其在图像检索中的应用

国家自然科学基金

0+阅读 · 2012年12月31日

语义知识驱动的网络上下文广告投放高效方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于域知识的自定义Web对象自动抽取技术

国家自然科学基金

0+阅读 · 2012年12月31日

文本多粒度关系抽取半监督自适应学习的研究

国家自然科学基金

4+阅读 · 2012年12月31日

基于动态邻域的空间实体自适应最优匹配方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于二维随机映射和一范数优化的有监督图像分类研究

国家自然科学基金

3+阅读 · 2011年12月31日

基于半监督结构化学习的跨语言映射研究

国家自然科学基金

2+阅读 · 2011年12月31日

相关论文

A Self-supervised Riemannian GNN with Time Varying Curvature for Temporal Graph Learning

Arxiv

0+阅读 · 2022年8月30日

Latent Heterogeneous Graph Network for Incomplete Multi-View Learning

Arxiv

0+阅读 · 2022年8月29日

SiT: Self-supervised vIsion Transformer

Arxiv

19+阅读 · 2021年4月8日

Multi-Label Text Classification using Attention-based Graph Neural Network

Arxiv

46+阅读 · 2020年3月22日

Graph Transformer Networks

Arxiv

15+阅读 · 2020年2月5日

UNITER: Learning UNiversal Image-TExt Representations

UNITER: Learning UNiversal Image-TExt Representations

Arxiv

23+阅读 · 2019年9月25日

Learning Embedding Adaptation for Few-Shot Learning

Learning Embedding Adaptation for Few-Shot Learning

Arxiv

17+阅读 · 2018年12月10日

Distance-based Self-Attention Network for Natural Language Inference

Arxiv

10+阅读 · 2017年12月6日

Deep Semantic Role Labeling with Self-Attention

Arxiv

13+阅读 · 2017年12月5日

DiSAN: Directional Self-Attention Network for RNN/CNN-Free Language Understanding

Arxiv

16+阅读 · 2017年11月20日

微信扫码咨询专知VIP会员