【NeurIPS 2021】流形上的注意力机制：规范等变的Transformer - 专知

会员服务 ·

0

【NeurIPS 2021】流形上的注意力机制：规范等变的Transformer

2021 年 12 月 2 日 专知

近几年来，Transformer模型在学界和工业界正受到越来越广泛的关注，它的一大特点就是可以根据附近上下文信息的内容赋予不同的注意力权重。Transformer的优越性也促使研究者们希望将其应用到其它的研究领域上，例如计算机视觉或者图网络学习等。

现在我们希望将Transformer结构应用到流形（Manifold）上。先回忆一种简单的情况：当Transformer应用到2D图片上时，它会以一个像素为中心点，综合考虑附近邻域中每一个像素的内容并进行加权信息聚合。在这个过程中，附近邻域中的每一个像素相对中心像素都有一个明确而清晰的位置，并且这个相对位置有一个统一的参数化模式。然而，对于流形这种不规则的数据结构，在Transformer进行信息聚合时，邻域点的相对位置信息存在无数种参数化模式，这种不唯一性会影响计算机进行数据处理和模式识别的结果。

https://openreview.net/pdf?id=fyL9HD-kImm

本文主要贡献如下：

我们首次提出了规范等变的注意力机制模型（Gauge Equivariant Transformer，简称为GET）。我们从数学上证明了GET对于旋转角度为（N为正整数）的规范改变上是完全等变的，并且对其它的旋转角度给出了等变误差的上界。
我们精心设计了一种与全局坐标系无关的模型输入。这种输入与规范等变性相结合可以实现三维空间内物体的旋转不变性。
我们提出了一种新的平行移动方法，即把循环群的正规表示扩展到了2D空间任意旋转群的表示。相比传统的截断或插值方法，我们的方法可以保留更多的流形几何信息。
我们使用泰勒级数来求解等变的限制条件，从而在邻域中有更好的近似效果。
我们通过实验证明了模型的有效性。在SHREC数据集上，GET比最好的baseline模型HSN有3.1%的准确率提升；在Human Body Segmentation数据集上，GET比最好的baseline模型MeshCNN有0.3%的准确率提升。

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“GET” 就可以获取《【NeurIPS 2021】流形上的注意力机制：规范等变的Transformer》专知下载链接

专知，专业可信的人工智能知识分发 ，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取5000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取5000+AI主题知识资源

登录查看更多

3

相关内容

【AAAI2022】注意力机制的快速蒙特卡罗近似

【AAAI2022】注意力机制的快速蒙特卡罗近似

专知会员服务

20+阅读 · 2022年2月5日

NeurIPS 2021 | 华为诺亚Oral论文：基于频域的二值神经网络训练方法

NeurIPS 2021 | 华为诺亚Oral论文：基于频域的二值神经网络训练方法

专知会员服务

16+阅读 · 2021年12月16日

【WSDM2022】具有分层注意力的图嵌入

【WSDM2022】具有分层注意力的图嵌入

专知会员服务

36+阅读 · 2021年11月17日

【ICML2021】学习分子构象生成的梯度场

【ICML2021】学习分子构象生成的梯度场

专知会员服务

15+阅读 · 2021年5月30日

【NeurIPS 2020】学习神经网络中的不变性

专知会员服务

29+阅读 · 2020年10月24日

【NeurIPS 2020】核基渐进蒸馏加法器神经网络

专知会员服务

18+阅读 · 2020年10月18日

【NeurIPS 2020 】生成式的基于动态图网络学习的三维部件拼装

【NeurIPS 2020 】生成式的基于动态图网络学习的三维部件拼装

专知会员服务

16+阅读 · 2020年10月18日

【Mila】通用表示Transformer少样本图像分类

【Mila】通用表示Transformer少样本图像分类

专知会员服务

33+阅读 · 2020年9月7日

【NeurIPS2020提交论文】通用表示Transformer层的小样本图像分类

【NeurIPS2020提交论文】通用表示Transformer层的小样本图像分类

专知会员服务

58+阅读 · 2020年6月29日

【斯坦福大学】图卷积神经网络和标签传播统一建模学习

专知会员服务

100+阅读 · 2020年2月20日

【AAAI 2022】 GeomGCL:用于分子性质预测的几何图对比学习

【AAAI 2022】 GeomGCL:用于分子性质预测的几何图对比学习

专知

1+阅读 · 2022年2月27日

【ICLR2022】Vision Transformer 模型工作机制的最新理论

【ICLR2022】Vision Transformer 模型工作机制的最新理论

专知

0+阅读 · 2022年2月19日

【AAAI2022】注意力机制的快速蒙特卡罗近似

【AAAI2022】注意力机制的快速蒙特卡罗近似

专知

0+阅读 · 2022年2月5日

NeurIPS 2021 | 通过动态图评分匹配预测分子构象

NeurIPS 2021 | 通过动态图评分匹配预测分子构象

专知

1+阅读 · 2021年12月4日

【NeurIPS 2021】如何使用 Transformer 模型在图表示任务中胜过 GNN

【NeurIPS 2021】如何使用 Transformer 模型在图表示任务中胜过 GNN

专知

1+阅读 · 2021年11月21日

【WSDM2022】具有分层注意力的图嵌入

【WSDM2022】具有分层注意力的图嵌入

专知

0+阅读 · 2021年11月17日

【ICML2021】统一鲁棒半监督变分自编码器

【ICML2021】统一鲁棒半监督变分自编码器

专知

1+阅读 · 2021年7月12日

【CVPR2021】通道注意力的高效移动网络设计

【CVPR2021】通道注意力的高效移动网络设计

专知

1+阅读 · 2021年4月28日

【NeurIPS 2020】核基渐进蒸馏加法器神经网络

【NeurIPS 2020】核基渐进蒸馏加法器神经网络

专知

13+阅读 · 2020年10月19日

认知下视雷达空时滤波的几何机制与流形上的优化方法研究

国家自然科学基金

1+阅读 · 2017年12月31日

视觉媒体的结构感知处理与分析模型研究

国家自然科学基金

1+阅读 · 2015年12月31日

非线性双曲方程的间断有限元超收敛分析和应用

国家自然科学基金

1+阅读 · 2015年12月31日

分数阶偏微分方程的不变流形

国家自然科学基金

0+阅读 · 2015年12月31日

加权紧黎曼流形上函数逼近问题的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于稀疏表示和流形理论的半监督分类研究

国家自然科学基金

0+阅读 · 2014年12月31日

几何结构形变空间的几何拓扑

国家自然科学基金

0+阅读 · 2012年12月31日

随机泛函微分方程的渐近行为

国家自然科学基金

0+阅读 · 2012年12月31日

保几何特征的逼近造型方法及其应用

国家自然科学基金

1+阅读 · 2010年12月31日

基于参数化表示的三维形体分析及其应用研究

国家自然科学基金

0+阅读 · 2008年12月31日

Not All Tokens Are Equal: Human-centric Visual Analysis via Token Clustering Transformer

Arxiv

0+阅读 · 2022年4月20日

SVIP: Sequence VerIfication for Procedures in Videos

Arxiv

0+阅读 · 2022年4月17日

Vision-Language Pre-Training for Multimodal Aspect-Based Sentiment Analysis

Arxiv

0+阅读 · 2022年4月17日

Cross-Domain Few-Shot Graph Classification

Arxiv

13+阅读 · 2022年1月20日

Masked Autoencoders Are Scalable Vision Learners

Arxiv

27+阅读 · 2021年11月11日

A Survey on Visual Transformer

Arxiv

19+阅读 · 2020年12月23日

UP-DETR: Unsupervised Pre-training for Object Detection with Transformers

UP-DETR: Unsupervised Pre-training for Object Detection with Transformers

Arxiv

19+阅读 · 2020年11月18日

Contrastive Clustering

Arxiv

31+阅读 · 2020年9月21日

Heterogeneous Graph Transformer

Heterogeneous Graph Transformer

Arxiv

27+阅读 · 2020年3月3日

Graph Transformer Networks

Arxiv

15+阅读 · 2020年2月5日

VIP会员

相关主题

注意力机制

相关VIP内容

【AAAI2022】注意力机制的快速蒙特卡罗近似

【AAAI2022】注意力机制的快速蒙特卡罗近似

专知会员服务

20+阅读 · 2022年2月5日

NeurIPS 2021 | 华为诺亚Oral论文：基于频域的二值神经网络训练方法

NeurIPS 2021 | 华为诺亚Oral论文：基于频域的二值神经网络训练方法

专知会员服务

16+阅读 · 2021年12月16日

【WSDM2022】具有分层注意力的图嵌入

【WSDM2022】具有分层注意力的图嵌入

专知会员服务

36+阅读 · 2021年11月17日

【ICML2021】学习分子构象生成的梯度场

【ICML2021】学习分子构象生成的梯度场

专知会员服务

15+阅读 · 2021年5月30日

【NeurIPS 2020】学习神经网络中的不变性

专知会员服务

29+阅读 · 2020年10月24日

【NeurIPS 2020】核基渐进蒸馏加法器神经网络

专知会员服务

18+阅读 · 2020年10月18日

【NeurIPS 2020 】生成式的基于动态图网络学习的三维部件拼装

【NeurIPS 2020 】生成式的基于动态图网络学习的三维部件拼装

专知会员服务

16+阅读 · 2020年10月18日

【Mila】通用表示Transformer少样本图像分类

【Mila】通用表示Transformer少样本图像分类

专知会员服务

33+阅读 · 2020年9月7日

【NeurIPS2020提交论文】通用表示Transformer层的小样本图像分类

【NeurIPS2020提交论文】通用表示Transformer层的小样本图像分类

专知会员服务

58+阅读 · 2020年6月29日

【斯坦福大学】图卷积神经网络和标签传播统一建模学习

专知会员服务

100+阅读 · 2020年2月20日

热门VIP内容

开通专知VIP会员享更多权益服务

《乌克兰无人机产业：志愿者与政策在构建新兴无人机产业中的协同作用》最新报告

《人工智能辅助决策中的数据可视化：系统性综述》

人工智能驱动弹药制造现代化：美国陆军转型之路

《敏捷作战部署中枢纽-辐条基地选址优化研究》80页

相关资讯

【AAAI 2022】 GeomGCL:用于分子性质预测的几何图对比学习

【AAAI 2022】 GeomGCL:用于分子性质预测的几何图对比学习

专知

1+阅读 · 2022年2月27日

【ICLR2022】Vision Transformer 模型工作机制的最新理论

【ICLR2022】Vision Transformer 模型工作机制的最新理论

专知

0+阅读 · 2022年2月19日

【AAAI2022】注意力机制的快速蒙特卡罗近似

【AAAI2022】注意力机制的快速蒙特卡罗近似

专知

0+阅读 · 2022年2月5日

NeurIPS 2021 | 通过动态图评分匹配预测分子构象

NeurIPS 2021 | 通过动态图评分匹配预测分子构象

专知

1+阅读 · 2021年12月4日

【NeurIPS 2021】如何使用 Transformer 模型在图表示任务中胜过 GNN

【NeurIPS 2021】如何使用 Transformer 模型在图表示任务中胜过 GNN

专知

1+阅读 · 2021年11月21日

【WSDM2022】具有分层注意力的图嵌入

【WSDM2022】具有分层注意力的图嵌入

专知

0+阅读 · 2021年11月17日

【ICML2021】统一鲁棒半监督变分自编码器

【ICML2021】统一鲁棒半监督变分自编码器

专知

1+阅读 · 2021年7月12日

【CVPR2021】通道注意力的高效移动网络设计

【CVPR2021】通道注意力的高效移动网络设计

专知

1+阅读 · 2021年4月28日

【NeurIPS 2020】核基渐进蒸馏加法器神经网络

【NeurIPS 2020】核基渐进蒸馏加法器神经网络

专知

13+阅读 · 2020年10月19日

相关基金

认知下视雷达空时滤波的几何机制与流形上的优化方法研究

国家自然科学基金

1+阅读 · 2017年12月31日

视觉媒体的结构感知处理与分析模型研究

国家自然科学基金

1+阅读 · 2015年12月31日

非线性双曲方程的间断有限元超收敛分析和应用

国家自然科学基金

1+阅读 · 2015年12月31日

分数阶偏微分方程的不变流形

国家自然科学基金

0+阅读 · 2015年12月31日

加权紧黎曼流形上函数逼近问题的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于稀疏表示和流形理论的半监督分类研究

国家自然科学基金

0+阅读 · 2014年12月31日

几何结构形变空间的几何拓扑

国家自然科学基金

0+阅读 · 2012年12月31日

随机泛函微分方程的渐近行为

国家自然科学基金

0+阅读 · 2012年12月31日

保几何特征的逼近造型方法及其应用

国家自然科学基金

1+阅读 · 2010年12月31日

基于参数化表示的三维形体分析及其应用研究

国家自然科学基金

0+阅读 · 2008年12月31日

相关论文

Not All Tokens Are Equal: Human-centric Visual Analysis via Token Clustering Transformer

Arxiv

0+阅读 · 2022年4月20日

SVIP: Sequence VerIfication for Procedures in Videos

Arxiv

0+阅读 · 2022年4月17日

Vision-Language Pre-Training for Multimodal Aspect-Based Sentiment Analysis

Arxiv

0+阅读 · 2022年4月17日

Cross-Domain Few-Shot Graph Classification

Arxiv

13+阅读 · 2022年1月20日

Masked Autoencoders Are Scalable Vision Learners

Arxiv

27+阅读 · 2021年11月11日

A Survey on Visual Transformer

Arxiv

19+阅读 · 2020年12月23日

UP-DETR: Unsupervised Pre-training for Object Detection with Transformers

UP-DETR: Unsupervised Pre-training for Object Detection with Transformers

Arxiv

19+阅读 · 2020年11月18日

Contrastive Clustering

Arxiv

31+阅读 · 2020年9月21日

Heterogeneous Graph Transformer

Heterogeneous Graph Transformer

Arxiv

27+阅读 · 2020年3月3日

Graph Transformer Networks

Arxiv

15+阅读 · 2020年2月5日

大家都在搜

CMU博士论文

无人机集群

久别重逢话双塔

软件无线电

再见，TD-SCDMA！

微信扫码咨询专知VIP会员