【ICML2022】超立方Transformers：你需要什么样的密集图来集中自注意力? - 专知VIP

会员服务 ·

6

Transformers · 自注意力 · 超立方Transformers · ICML 2022 ·

2022 年 5 月 31 日

【ICML2022】超立方Transformers：你需要什么样的密集图来集中自注意力?

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

Transformers 在多种任务上取得了进展，但却受到二次元计算和内存复杂性的困扰。最近的工作提出了稀疏Transformers，关注稀疏图，以降低复杂性和保持强大的性能。虽然很有效，但是对于图需要多密集才能很好地执行的关键部分，还没有进行充分的探讨。在本文中，我们提出了归一化信息有效载荷(NIP)，这是一种测量图上信息传递的图评分函数，它提供了一个在性能和复杂性之间进行权衡的分析工具。在理论分析的指导下，我们提出了超立方Transformers，一个稀疏的Transformer，它在超立方体中建模标记交互，并显示与普通Transformer相当甚至更好的结果，同时在序列长度为N的情况下产生O(N log N)复杂度。在需要不同序列长度的任务上的实验为我们的图函数提供了验证。

https://www.zhuanzhi.ai/paper/8318e8175a50804b8f5157bbd8679a00

成为VIP会员查看完整内容

18

相关内容

Transformers

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

专知会员服务

25+阅读 · 2022年7月8日

【ICML2022】Orchestra: 通过全局一致聚类的无监督联邦学习

【ICML2022】Orchestra: 通过全局一致聚类的无监督联邦学习

专知会员服务

17+阅读 · 2022年5月27日

【CVPR2022】提示分布学习

【CVPR2022】提示分布学习

专知会员服务

31+阅读 · 2022年5月17日

[ICML2021]记忆高效在线元学习

专知会员服务

25+阅读 · 2021年9月25日

【ICML2021】全局鲁棒神经网络

专知会员服务

22+阅读 · 2021年8月26日

【ICML2021】具有局部和全局的自监督图表示学习

专知会员服务

32+阅读 · 2021年8月7日

【ICML2021】弹性图神经网络

专知会员服务

37+阅读 · 2021年7月17日

【ICML2021】突破图神经网络中消息传递的限制

专知会员服务

41+阅读 · 2021年6月10日

【ICML2021】基于小波变换的图神经网络

专知会员服务

51+阅读 · 2021年5月19日

【ICML2021】有向图网络

专知会员服务

82+阅读 · 2021年5月10日

【ICML2022】Orchestra: 通过全局一致聚类的无监督联邦学习

【ICML2022】Orchestra: 通过全局一致聚类的无监督联邦学习

专知

1+阅读 · 2022年5月27日

朝着卷积进一步迈进！PAIR等开源NAT：新分层注意力Transformer ，超越ConvNeXt

朝着卷积进一步迈进！PAIR等开源NAT：新分层注意力Transformer ，超越ConvNeXt

极市平台

0+阅读 · 2022年4月27日

CVPR 2022｜MPViT：用于密集预测的多路径视觉Transformer

CVPR 2022｜MPViT：用于密集预测的多路径视觉Transformer

极市平台

0+阅读 · 2022年3月15日

在注意力中重新思考Softmax：分解非线性，这个线性transformer变体实现多项SOTA

在注意力中重新思考Softmax：分解非线性，这个线性transformer变体实现多项SOTA

极市平台

0+阅读 · 2022年2月21日

【AAAI2022】注意力机制的快速蒙特卡罗近似

【AAAI2022】注意力机制的快速蒙特卡罗近似

专知

0+阅读 · 2022年2月5日

物尽其用，卷积和自注意力在Transformer中实现统一：多SOTA、ICLR 2022接收

物尽其用，卷积和自注意力在Transformer中实现统一：多SOTA、ICLR 2022接收

机器之心

0+阅读 · 2022年1月29日

涨点神器！ELSA：增强视觉Transformer的局部自注意力

涨点神器！ELSA：增强视觉Transformer的局部自注意力

CVer

0+阅读 · 2021年12月28日

谷歌提出「卷积+注意力」新模型，超越ResNet最强变体！

谷歌提出「卷积+注意力」新模型，超越ResNet最强变体！

量子位

1+阅读 · 2021年6月25日

【论文笔记】自注意力图池化

【论文笔记】自注意力图池化

专知

82+阅读 · 2019年11月18日

用自注意力增强卷积：这是新老两代神经网络的对话（附实现）

用自注意力增强卷积：这是新老两代神经网络的对话（附实现）

机器之心

18+阅读 · 2019年4月26日

基于ERs-PI3K通路的三七皂苷类成分防治心肌缺血再灌注损伤的分子机理研究

国家自然科学基金

0+阅读 · 2015年12月31日

十字花科黑腐病菌与致病相关的一个小RNA的作用机理研究

国家自然科学基金

0+阅读 · 2014年12月31日

过渡金属化合物中自旋轨道耦合的新奇效应

国家自然科学基金

0+阅读 · 2014年12月31日

个性化模式下在线评论有用性形成机制研究

国家自然科学基金

2+阅读 · 2013年12月31日

融合网络编码的无线协作中继网络资源分配与实现机制研究

国家自然科学基金

1+阅读 · 2012年12月31日

无线传感器网络不依赖位置信息的拓扑识别与构建技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

粗粒度可重构架构的软错误自适应防护模型与方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

中等强度关联电子系统中的新奇量子态

国家自然科学基金

0+阅读 · 2011年12月31日

惰性气体与O2,N2,CO,NO、CN相互作用势及碰撞激发截面的同位素效应研究

国家自然科学基金

0+阅读 · 2009年12月31日

分布式计算环境下的并行数据挖掘算法与理论研究

国家自然科学基金

0+阅读 · 2009年12月31日

Belief Evolution Network-based Probability Transformation and Fusion

Arxiv

0+阅读 · 2022年7月17日

A Lightweight Graph Transformer Network for Human Mesh Reconstruction from 2D Human Pose

Arxiv

0+阅读 · 2022年7月17日

Multimodal Token Fusion for Vision Transformers

Arxiv

0+阅读 · 2022年7月15日

Scoring Aave Accounts for Creditworthiness

Scoring Aave Accounts for Creditworthiness

Arxiv

0+阅读 · 2022年7月14日

Contrastive Triple Extraction with Generative Transformer

Arxiv

13+阅读 · 2021年2月4日

Contrastive Clustering

Arxiv

31+阅读 · 2020年9月21日

已删除

Arxiv

32+阅读 · 2020年3月23日

Dynamic Graph Representation Learning via Self-Attention Networks

Arxiv

52+阅读 · 2019年6月15日

End-to-End Dense Video Captioning with Masked Transformer

Arxiv

14+阅读 · 2018年4月3日

Zero-Shot Transfer Learning for Event Extraction

Arxiv

10+阅读 · 2017年7月4日

VIP会员

相关主题

超立方Transformers

相关VIP内容

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

专知会员服务

25+阅读 · 2022年7月8日

【ICML2022】Orchestra: 通过全局一致聚类的无监督联邦学习

【ICML2022】Orchestra: 通过全局一致聚类的无监督联邦学习

专知会员服务

17+阅读 · 2022年5月27日

【CVPR2022】提示分布学习

【CVPR2022】提示分布学习

专知会员服务

31+阅读 · 2022年5月17日

[ICML2021]记忆高效在线元学习

专知会员服务

25+阅读 · 2021年9月25日

【ICML2021】全局鲁棒神经网络

专知会员服务

22+阅读 · 2021年8月26日

【ICML2021】具有局部和全局的自监督图表示学习

专知会员服务

32+阅读 · 2021年8月7日

【ICML2021】弹性图神经网络

专知会员服务

37+阅读 · 2021年7月17日

【ICML2021】突破图神经网络中消息传递的限制

专知会员服务

41+阅读 · 2021年6月10日

【ICML2021】基于小波变换的图神经网络

专知会员服务

51+阅读 · 2021年5月19日

【ICML2021】有向图网络

专知会员服务

82+阅读 · 2021年5月10日

热门VIP内容

开通专知VIP会员享更多权益服务

【博士论文】低维与高维空间中潜在表征的分析、建模与变换

《生态建模密码破译：建模与编程实践》美陆军最新报告

大模型解决方案白皮书：社交陪伴场景全流程落地指南

面向具身操作的视觉-语言-动作模型综述

相关资讯

【ICML2022】Orchestra: 通过全局一致聚类的无监督联邦学习

【ICML2022】Orchestra: 通过全局一致聚类的无监督联邦学习

专知

1+阅读 · 2022年5月27日

朝着卷积进一步迈进！PAIR等开源NAT：新分层注意力Transformer ，超越ConvNeXt

朝着卷积进一步迈进！PAIR等开源NAT：新分层注意力Transformer ，超越ConvNeXt

极市平台

0+阅读 · 2022年4月27日

CVPR 2022｜MPViT：用于密集预测的多路径视觉Transformer

CVPR 2022｜MPViT：用于密集预测的多路径视觉Transformer

极市平台

0+阅读 · 2022年3月15日

在注意力中重新思考Softmax：分解非线性，这个线性transformer变体实现多项SOTA

在注意力中重新思考Softmax：分解非线性，这个线性transformer变体实现多项SOTA

极市平台

0+阅读 · 2022年2月21日

【AAAI2022】注意力机制的快速蒙特卡罗近似

【AAAI2022】注意力机制的快速蒙特卡罗近似

专知

0+阅读 · 2022年2月5日

物尽其用，卷积和自注意力在Transformer中实现统一：多SOTA、ICLR 2022接收

物尽其用，卷积和自注意力在Transformer中实现统一：多SOTA、ICLR 2022接收

机器之心

0+阅读 · 2022年1月29日

涨点神器！ELSA：增强视觉Transformer的局部自注意力

涨点神器！ELSA：增强视觉Transformer的局部自注意力

CVer

0+阅读 · 2021年12月28日

谷歌提出「卷积+注意力」新模型，超越ResNet最强变体！

谷歌提出「卷积+注意力」新模型，超越ResNet最强变体！

量子位

1+阅读 · 2021年6月25日

【论文笔记】自注意力图池化

【论文笔记】自注意力图池化

专知

82+阅读 · 2019年11月18日

用自注意力增强卷积：这是新老两代神经网络的对话（附实现）

用自注意力增强卷积：这是新老两代神经网络的对话（附实现）

机器之心

18+阅读 · 2019年4月26日

相关基金

基于ERs-PI3K通路的三七皂苷类成分防治心肌缺血再灌注损伤的分子机理研究

国家自然科学基金

0+阅读 · 2015年12月31日

十字花科黑腐病菌与致病相关的一个小RNA的作用机理研究

国家自然科学基金

0+阅读 · 2014年12月31日

过渡金属化合物中自旋轨道耦合的新奇效应

国家自然科学基金

0+阅读 · 2014年12月31日

个性化模式下在线评论有用性形成机制研究

国家自然科学基金

2+阅读 · 2013年12月31日

融合网络编码的无线协作中继网络资源分配与实现机制研究

国家自然科学基金

1+阅读 · 2012年12月31日

无线传感器网络不依赖位置信息的拓扑识别与构建技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

粗粒度可重构架构的软错误自适应防护模型与方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

中等强度关联电子系统中的新奇量子态

国家自然科学基金

0+阅读 · 2011年12月31日

惰性气体与O2,N2,CO,NO、CN相互作用势及碰撞激发截面的同位素效应研究

国家自然科学基金

0+阅读 · 2009年12月31日

分布式计算环境下的并行数据挖掘算法与理论研究

国家自然科学基金

0+阅读 · 2009年12月31日

相关论文

Belief Evolution Network-based Probability Transformation and Fusion

Arxiv

0+阅读 · 2022年7月17日

A Lightweight Graph Transformer Network for Human Mesh Reconstruction from 2D Human Pose

Arxiv

0+阅读 · 2022年7月17日

Multimodal Token Fusion for Vision Transformers

Arxiv

0+阅读 · 2022年7月15日

Scoring Aave Accounts for Creditworthiness

Scoring Aave Accounts for Creditworthiness

Arxiv

0+阅读 · 2022年7月14日

Contrastive Triple Extraction with Generative Transformer

Arxiv

13+阅读 · 2021年2月4日

Contrastive Clustering

Arxiv

31+阅读 · 2020年9月21日

已删除

Arxiv

32+阅读 · 2020年3月23日

Dynamic Graph Representation Learning via Self-Attention Networks

Arxiv

52+阅读 · 2019年6月15日

End-to-End Dense Video Captioning with Masked Transformer

Arxiv

14+阅读 · 2018年4月3日

Zero-Shot Transfer Learning for Event Extraction

Arxiv

10+阅读 · 2017年7月4日

微信扫码咨询专知VIP会员