【ICML2022】从block-Toeplitz矩阵到图上的微分方程:迈向可扩展掩码Transformers的一般理论 - 专知VIP

会员服务 ·

6

Transformers · ICML 2022 ·

2022 年 8 月 8 日

【ICML2022】从block-Toeplitz矩阵到图上的微分方程:迈向可扩展掩码Transformers的一般理论

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

据我们所知，在本文中，我们提供了第一个全面的方法，以可扩展的方式将各种掩码机制整合到transformer架构中。我们表明，线性因果注意力(Choromanski et al.， 2021)和对数线性RPE -注意力(Luo et al.， 2021)的最新结果是这种一般机制的特殊情况。然而，通过将问题转化为未被掩盖的注意力的拓扑(基于图的)调制，我们获得了一些未知的结果，包括有效的d维RPE-掩码和图核掩码。我们利用了许多数学技术，从光谱分析、动态规划和随机漫步到解决图上马尔可夫过程的新算法。我们给出了相应的实证评价。 https://www.zhuanzhi.ai/paper/3183b33e9b7618679826d3ed338c41d8

成为VIP会员查看完整内容

18

相关内容

Transformers

【ICML2022】时序自监督视频transformer

【ICML2022】时序自监督视频transformer

专知会员服务

31+阅读 · 2022年7月28日

【ICML2022】在线决策Transformer

【ICML2022】在线决策Transformer

专知会员服务

34+阅读 · 2022年7月27日

【ICML2022】结构感知Transformer的图表示学习

【ICML2022】结构感知Transformer的图表示学习

专知会员服务

49+阅读 · 2022年6月17日

人大最新《基于Transformer 的视频语言预训练》综述论文

人大最新《基于Transformer 的视频语言预训练》综述论文

专知会员服务

47+阅读 · 2021年9月27日

【ICML2021】使用Transformers编码的计算感知神经架构

专知会员服务

18+阅读 · 2021年9月15日

[ICML2021] 伪黎曼流形中的有向图嵌入

专知会员服务

33+阅读 · 2021年6月24日

【ICML2021】数据表示的几何评估

专知会员服务

38+阅读 · 2021年6月3日

【ICML2021】基于经典迭代算法的图神经网络

专知会员服务

30+阅读 · 2021年5月21日

【ICML2021】具有线性复杂度的Transformer的相对位置编码

【ICML2021】具有线性复杂度的Transformer的相对位置编码

专知会员服务

25+阅读 · 2021年5月20日

【ICML2021】SparseBERT: 自注意力机制的重要性分析再思考

专知会员服务

37+阅读 · 2021年5月15日

【ICML2022】时序自监督视频transformer

【ICML2022】时序自监督视频transformer

专知

1+阅读 · 2022年7月28日

【ICML2022】在线决策Transformer

【ICML2022】在线决策Transformer

专知

2+阅读 · 2022年7月27日

李飞飞团队新作MaskViT：用于视频预测的掩码视觉预训练

李飞飞团队新作MaskViT：用于视频预测的掩码视觉预训练

极市平台

0+阅读 · 2022年6月27日

【ICML2022】通过凸对偶揭示注意力:视觉Transformers的分析与解读

【ICML2022】通过凸对偶揭示注意力:视觉Transformers的分析与解读

专知

1+阅读 · 2022年5月30日

纯MLP在下游任务上欠佳？Meta AI等提出稀疏MLP，超越transformer

纯MLP在下游任务上欠佳？Meta AI等提出稀疏MLP，超越transformer

机器之心

0+阅读 · 2022年4月16日

ICLR 2022 | 无需训练！As-ViT：自动扩展视觉Transformer

ICLR 2022 | 无需训练！As-ViT：自动扩展视觉Transformer

CVer

0+阅读 · 2022年4月15日

无需训练，自动扩展的视觉Transformer来了

无需训练，自动扩展的视觉Transformer来了

机器之心

0+阅读 · 2022年4月10日

Google最新《高效Transformers》2022综述大全，39页pdf阐述九大类提升Transformers效率方式

Google最新《高效Transformers》2022综述大全，39页pdf阐述九大类提升Transformers效率方式

专知

0+阅读 · 2022年3月18日

Swin Transformer升级版来了！30亿参数，刷榜多项视觉任务

Swin Transformer升级版来了！30亿参数，刷榜多项视觉任务

PaperWeekly

0+阅读 · 2021年11月21日

普林斯顿陈丹琦组：无需任何修改，片段检索模型也能学习段落检索

普林斯顿陈丹琦组：无需任何修改，片段检索模型也能学习段落检索

PaperWeekly

0+阅读 · 2021年10月25日

几类非线性微分方程的变分和拓扑方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

凸可分半定规划的数值算法

国家自然科学基金

0+阅读 · 2013年12月31日

控制系统的约束矩阵方程及其高效数值算法

国家自然科学基金

0+阅读 · 2013年12月31日

分支随机游动及其相关问题的研究

国家自然科学基金

0+阅读 · 2013年12月31日

变系数微分方程的谱方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

Drazin逆理论及其应用的研究

国家自然科学基金

0+阅读 · 2012年12月31日

半线性微分方程的数值理论及其应用

国家自然科学基金

0+阅读 · 2012年12月31日

McMullen函数族及其推广的动力系统

国家自然科学基金

0+阅读 · 2011年12月31日

网络新媒体服务系统的建模及其动力学行为分析研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于两重网格的Navier-Stokes方程并行自适应后处理及变分多尺度算法研究

国家自然科学基金

0+阅读 · 2011年12月31日

SemMAE: Semantic-Guided Masking for Learning Masked Autoencoders

Arxiv

0+阅读 · 2022年10月5日

Probabilistic reconciliation of forecasts via importance sampling

Arxiv

0+阅读 · 2022年10月5日

Q-learning Decision Transformer: Leveraging Dynamic Programming for Conditional Sequence Modelling in Offline RL

Arxiv

0+阅读 · 2022年10月4日

Long-Term Localization using Semantic Cues in Floor Plan Maps

Arxiv

0+阅读 · 2022年10月4日

Dual-former: Hybrid Self-attention Transformer for Efficient Image Restoration

Arxiv

0+阅读 · 2022年10月3日

BEiT v2: Masked Image Modeling with Vector-Quantized Visual Tokenizers

Arxiv

1+阅读 · 2022年10月3日

Survey: Transformer based Video-Language Pre-training

Arxiv

20+阅读 · 2021年9月21日

Transformer Tracking

Arxiv

17+阅读 · 2021年3月29日

A Primer in BERTology: What we know about how BERT works

A Primer in BERTology: What we know about how BERT works

Arxiv

34+阅读 · 2020年2月27日

Machine Learning: Basic Principles

Arxiv

26+阅读 · 2018年8月19日

VIP会员

相关主题

相关VIP内容

【ICML2022】时序自监督视频transformer

【ICML2022】时序自监督视频transformer

专知会员服务

31+阅读 · 2022年7月28日

【ICML2022】在线决策Transformer

【ICML2022】在线决策Transformer

专知会员服务

34+阅读 · 2022年7月27日

【ICML2022】结构感知Transformer的图表示学习

【ICML2022】结构感知Transformer的图表示学习

专知会员服务

49+阅读 · 2022年6月17日

人大最新《基于Transformer 的视频语言预训练》综述论文

人大最新《基于Transformer 的视频语言预训练》综述论文

专知会员服务

47+阅读 · 2021年9月27日

【ICML2021】使用Transformers编码的计算感知神经架构

专知会员服务

18+阅读 · 2021年9月15日

[ICML2021] 伪黎曼流形中的有向图嵌入

专知会员服务

33+阅读 · 2021年6月24日

【ICML2021】数据表示的几何评估

专知会员服务

38+阅读 · 2021年6月3日

【ICML2021】基于经典迭代算法的图神经网络

专知会员服务

30+阅读 · 2021年5月21日

【ICML2021】具有线性复杂度的Transformer的相对位置编码

【ICML2021】具有线性复杂度的Transformer的相对位置编码

专知会员服务

25+阅读 · 2021年5月20日

【ICML2021】SparseBERT: 自注意力机制的重要性分析再思考

专知会员服务

37+阅读 · 2021年5月15日

热门VIP内容

开通专知VIP会员享更多权益服务

新质生成式AI赋能产业变革的实践与路径

用于多模态大模型的离散标记化：全面综述

Nature综述：金融网络中的物理学

【CMU博士论文】通信高效且差分隐私的优化方法

相关资讯

【ICML2022】时序自监督视频transformer

【ICML2022】时序自监督视频transformer

专知

1+阅读 · 2022年7月28日

【ICML2022】在线决策Transformer

【ICML2022】在线决策Transformer

专知

2+阅读 · 2022年7月27日

李飞飞团队新作MaskViT：用于视频预测的掩码视觉预训练

李飞飞团队新作MaskViT：用于视频预测的掩码视觉预训练

极市平台

0+阅读 · 2022年6月27日

【ICML2022】通过凸对偶揭示注意力:视觉Transformers的分析与解读

【ICML2022】通过凸对偶揭示注意力:视觉Transformers的分析与解读

专知

1+阅读 · 2022年5月30日

纯MLP在下游任务上欠佳？Meta AI等提出稀疏MLP，超越transformer

纯MLP在下游任务上欠佳？Meta AI等提出稀疏MLP，超越transformer

机器之心

0+阅读 · 2022年4月16日

ICLR 2022 | 无需训练！As-ViT：自动扩展视觉Transformer

ICLR 2022 | 无需训练！As-ViT：自动扩展视觉Transformer

CVer

0+阅读 · 2022年4月15日

无需训练，自动扩展的视觉Transformer来了

无需训练，自动扩展的视觉Transformer来了

机器之心

0+阅读 · 2022年4月10日

Google最新《高效Transformers》2022综述大全，39页pdf阐述九大类提升Transformers效率方式

Google最新《高效Transformers》2022综述大全，39页pdf阐述九大类提升Transformers效率方式

专知

0+阅读 · 2022年3月18日

Swin Transformer升级版来了！30亿参数，刷榜多项视觉任务

Swin Transformer升级版来了！30亿参数，刷榜多项视觉任务

PaperWeekly

0+阅读 · 2021年11月21日

普林斯顿陈丹琦组：无需任何修改，片段检索模型也能学习段落检索

普林斯顿陈丹琦组：无需任何修改，片段检索模型也能学习段落检索

PaperWeekly

0+阅读 · 2021年10月25日

相关基金

几类非线性微分方程的变分和拓扑方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

凸可分半定规划的数值算法

国家自然科学基金

0+阅读 · 2013年12月31日

控制系统的约束矩阵方程及其高效数值算法

国家自然科学基金

0+阅读 · 2013年12月31日

分支随机游动及其相关问题的研究

国家自然科学基金

0+阅读 · 2013年12月31日

变系数微分方程的谱方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

Drazin逆理论及其应用的研究

国家自然科学基金

0+阅读 · 2012年12月31日

半线性微分方程的数值理论及其应用

国家自然科学基金

0+阅读 · 2012年12月31日

McMullen函数族及其推广的动力系统

国家自然科学基金

0+阅读 · 2011年12月31日

网络新媒体服务系统的建模及其动力学行为分析研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于两重网格的Navier-Stokes方程并行自适应后处理及变分多尺度算法研究

国家自然科学基金

0+阅读 · 2011年12月31日

相关论文

SemMAE: Semantic-Guided Masking for Learning Masked Autoencoders

Arxiv

0+阅读 · 2022年10月5日

Probabilistic reconciliation of forecasts via importance sampling

Arxiv

0+阅读 · 2022年10月5日

Q-learning Decision Transformer: Leveraging Dynamic Programming for Conditional Sequence Modelling in Offline RL

Arxiv

0+阅读 · 2022年10月4日

Long-Term Localization using Semantic Cues in Floor Plan Maps

Arxiv

0+阅读 · 2022年10月4日

Dual-former: Hybrid Self-attention Transformer for Efficient Image Restoration

Arxiv

0+阅读 · 2022年10月3日

BEiT v2: Masked Image Modeling with Vector-Quantized Visual Tokenizers

Arxiv

1+阅读 · 2022年10月3日

Survey: Transformer based Video-Language Pre-training

Arxiv

20+阅读 · 2021年9月21日

Transformer Tracking

Arxiv

17+阅读 · 2021年3月29日

A Primer in BERTology: What we know about how BERT works

A Primer in BERTology: What we know about how BERT works

Arxiv

34+阅读 · 2020年2月27日

Machine Learning: Basic Principles

Arxiv

26+阅读 · 2018年8月19日

微信扫码咨询专知VIP会员