【IJCAI2024】Gradformer：具有指数衰减的图变换器 - 专知VIP

会员服务 ·

9

IJCAI 2024 · Gradformer · Graph Transformer ·

【IJCAI2024】Gradformer：具有指数衰减的图变换器

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

图变换器（GTs）已在广泛的任务中展示了其优势。然而，GTs中的自注意力机制忽略了图的归纳偏见，尤其是与结构相关的偏见，这些对图任务至关重要。尽管一些方法利用位置编码和注意力偏差来模拟归纳偏见，但从分析角度来看，它们的效果仍然不是最佳的。因此，本文提出了Gradformer，这是一种创新性地将GT与内在归纳偏见整合的方法，通过在注意力矩阵上应用指数衰减掩码来实现。具体来说，衰减掩码矩阵中的值呈指数级减小，与图结构内减小的节点邻近度相关联。这种设计使Gradformer能够在关注图的局部细节的同时，保持从远处节点捕获信息的能力。此外，Gradformer引入了一个可学习的约束到衰减掩码中，允许不同的注意力头学习不同的衰减掩码。这样的设计使注意力头多样化，使得能够更有效地同化图中的多样化结构信息。在各种基准测试上的广泛实验表明，Gradformer在各种图分类和回归任务中始终优于图神经网络和GT基线模型。此外，Gradformer已被证明是训练深层GT模型的有效方法，在网络加深的情况下，与其他GT模型观察到的显著准确率下降相比，它保持甚至提高了准确率。代码可在 https://github.com/LiuChuang0059/Gradformer 获取。

成为VIP会员查看完整内容

14

相关内容

IJCAI 2024

【CIKM2023】GiGaMAE: 通过协同潜在空间重建的可泛化图掩码自编码器

【CIKM2023】GiGaMAE: 通过协同潜在空间重建的可泛化图掩码自编码器

专知会员服务

20+阅读 · 2023年8月22日

【ICCV2023】StyleDiffusion:基于扩散模型的可控解缠风格迁移

【ICCV2023】StyleDiffusion:基于扩散模型的可控解缠风格迁移

专知会员服务

24+阅读 · 2023年8月20日

【NeurIPS2022】GENIE:高阶去噪扩散求解器

【NeurIPS2022】GENIE:高阶去噪扩散求解器

专知会员服务

16+阅读 · 2022年11月13日

【ICML2022】FEDformer:用于长期序列预测的频率增强分解Transformer

【ICML2022】FEDformer:用于长期序列预测的频率增强分解Transformer

专知会员服务

24+阅读 · 2022年5月19日

【ICML2021】GeomCA: 数据表示几何评估

专知会员服务

14+阅读 · 2021年9月11日

【KDD2021】基于生成对抗图网络的不平衡网络嵌入

专知会员服务

24+阅读 · 2021年9月10日

【ICML2021】用于对比表示学习的分解互信息估计

专知会员服务

25+阅读 · 2021年9月9日

【KDD2021】CNFGNN: 用于时空数据建模的跨节点联合图神经网络

专知会员服务

20+阅读 · 2021年8月15日

【WSDM2021】基于演化状态图的时间序列事件预测

【WSDM2021】基于演化状态图的时间序列事件预测

专知会员服务

50+阅读 · 2020年12月1日

【KDD2020】AutoFIS: 因数分解模型中用于预测点击率的自动特征交互选择

专知会员服务

11+阅读 · 2020年5月27日

【AAAI2023】用于图对比学习的谱特征增强

【AAAI2023】用于图对比学习的谱特征增强

专知

18+阅读 · 2022年12月11日

【ICML2021】因果匹配领域泛化

【ICML2021】因果匹配领域泛化

专知

10+阅读 · 2021年8月12日

【CVPR2021】CausalVAE: 引入因果结构的解耦表示学习

【CVPR2021】CausalVAE: 引入因果结构的解耦表示学习

专知

18+阅读 · 2021年3月28日

【CVPR2021】跨模态检索的概率嵌入

【CVPR2021】跨模态检索的概率嵌入

专知

16+阅读 · 2021年3月2日

【NeurIPS2020-MIT】子图神经网络，Subgraph Neural Networks

【NeurIPS2020-MIT】子图神经网络，Subgraph Neural Networks

专知

37+阅读 · 2020年9月30日

【MIT】最优传输图神经网络，Optimal Transport Graph Neural Networks

【MIT】最优传输图神经网络，Optimal Transport Graph Neural Networks

专知

18+阅读 · 2020年6月22日

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

专知

16+阅读 · 2020年6月7日

【CVPR2020-旷视】DPGN：分布传播图网络的小样本学习

【CVPR2020-旷视】DPGN：分布传播图网络的小样本学习

专知

12+阅读 · 2020年4月1日

【MIT-伯克利-ICLR2020】对比表示蒸馏，Contrastive Representation Distillation

【MIT-伯克利-ICLR2020】对比表示蒸馏，Contrastive Representation Distillation

专知

54+阅读 · 2020年3月12日

【NeurIPS2019】图变换网络：Graph Transformer Network

【NeurIPS2019】图变换网络：Graph Transformer Network

专知

244+阅读 · 2019年11月18日

退化Fisher方程解的渐进性研究

国家自然科学基金

0+阅读 · 2015年12月31日

关于随机MAX SAT和(2+p)-SAT模型可满足阈值的研究

国家自然科学基金

0+阅读 · 2015年12月31日

两类Markov排队模型的衰减性质

国家自然科学基金

0+阅读 · 2015年12月31日

非参数核方法的样本外扩展研究

国家自然科学基金

2+阅读 · 2015年12月31日

Choquet期望下极限定理及其收敛速度的刻画

国家自然科学基金

0+阅读 · 2015年12月31日

基于Spark的大图数据最优子模式匹配查询方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

有理 Krylov 子空间算法的最优参数选取

国家自然科学基金

0+阅读 · 2015年12月31日

一般误差分布下若干半参数模型的复合分位数方法

国家自然科学基金

0+阅读 · 2014年12月31日

Kahler 曲面中特殊曲面的研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于狄利克雷过程的潜变量模型贝叶斯半参数分析

国家自然科学基金

2+阅读 · 2014年12月31日

Common pitfalls to avoid while using multiobjective optimization in machine learning

Arxiv

0+阅读 · 5月2日

Helmholtz preconditioning for the compressible Euler equations using mixed finite elements with Lorenz staggering

Arxiv

0+阅读 · 5月2日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

131+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

30+阅读 · 2023年4月19日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

71+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

135+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

52+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

326+阅读 · 2023年3月31日

Nature Language Reasoning, A Survey

Arxiv

53+阅读 · 2023年3月26日

Data-centric Artificial Intelligence: A Survey

Arxiv

15+阅读 · 2023年3月17日

VIP会员

相关主题

Graph Transformer

相关VIP内容

【CIKM2023】GiGaMAE: 通过协同潜在空间重建的可泛化图掩码自编码器

【CIKM2023】GiGaMAE: 通过协同潜在空间重建的可泛化图掩码自编码器

专知会员服务

20+阅读 · 2023年8月22日

【ICCV2023】StyleDiffusion:基于扩散模型的可控解缠风格迁移

【ICCV2023】StyleDiffusion:基于扩散模型的可控解缠风格迁移

专知会员服务

24+阅读 · 2023年8月20日

【NeurIPS2022】GENIE:高阶去噪扩散求解器

【NeurIPS2022】GENIE:高阶去噪扩散求解器

专知会员服务

16+阅读 · 2022年11月13日

【ICML2022】FEDformer:用于长期序列预测的频率增强分解Transformer

【ICML2022】FEDformer:用于长期序列预测的频率增强分解Transformer

专知会员服务

24+阅读 · 2022年5月19日

【ICML2021】GeomCA: 数据表示几何评估

专知会员服务

14+阅读 · 2021年9月11日

【KDD2021】基于生成对抗图网络的不平衡网络嵌入

专知会员服务

24+阅读 · 2021年9月10日

【ICML2021】用于对比表示学习的分解互信息估计

专知会员服务

25+阅读 · 2021年9月9日

【KDD2021】CNFGNN: 用于时空数据建模的跨节点联合图神经网络

专知会员服务

20+阅读 · 2021年8月15日

【WSDM2021】基于演化状态图的时间序列事件预测

【WSDM2021】基于演化状态图的时间序列事件预测

专知会员服务

50+阅读 · 2020年12月1日

【KDD2020】AutoFIS: 因数分解模型中用于预测点击率的自动特征交互选择

专知会员服务

11+阅读 · 2020年5月27日

热门VIP内容

相关资讯

【AAAI2023】用于图对比学习的谱特征增强

【AAAI2023】用于图对比学习的谱特征增强

专知

18+阅读 · 2022年12月11日

【ICML2021】因果匹配领域泛化

【ICML2021】因果匹配领域泛化

专知

10+阅读 · 2021年8月12日

【CVPR2021】CausalVAE: 引入因果结构的解耦表示学习

【CVPR2021】CausalVAE: 引入因果结构的解耦表示学习

专知

18+阅读 · 2021年3月28日

【CVPR2021】跨模态检索的概率嵌入

【CVPR2021】跨模态检索的概率嵌入

专知

16+阅读 · 2021年3月2日

【NeurIPS2020-MIT】子图神经网络，Subgraph Neural Networks

【NeurIPS2020-MIT】子图神经网络，Subgraph Neural Networks

专知

37+阅读 · 2020年9月30日

【MIT】最优传输图神经网络，Optimal Transport Graph Neural Networks

【MIT】最优传输图神经网络，Optimal Transport Graph Neural Networks

专知

18+阅读 · 2020年6月22日

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

专知

16+阅读 · 2020年6月7日

【CVPR2020-旷视】DPGN：分布传播图网络的小样本学习

【CVPR2020-旷视】DPGN：分布传播图网络的小样本学习

专知

12+阅读 · 2020年4月1日

【MIT-伯克利-ICLR2020】对比表示蒸馏，Contrastive Representation Distillation

【MIT-伯克利-ICLR2020】对比表示蒸馏，Contrastive Representation Distillation

专知

54+阅读 · 2020年3月12日

【NeurIPS2019】图变换网络：Graph Transformer Network

【NeurIPS2019】图变换网络：Graph Transformer Network

专知

244+阅读 · 2019年11月18日

相关基金

退化Fisher方程解的渐进性研究

国家自然科学基金

0+阅读 · 2015年12月31日

关于随机MAX SAT和(2+p)-SAT模型可满足阈值的研究

国家自然科学基金

0+阅读 · 2015年12月31日

两类Markov排队模型的衰减性质

国家自然科学基金

0+阅读 · 2015年12月31日

非参数核方法的样本外扩展研究

国家自然科学基金

2+阅读 · 2015年12月31日

Choquet期望下极限定理及其收敛速度的刻画

国家自然科学基金

0+阅读 · 2015年12月31日

基于Spark的大图数据最优子模式匹配查询方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

有理 Krylov 子空间算法的最优参数选取

国家自然科学基金

0+阅读 · 2015年12月31日

一般误差分布下若干半参数模型的复合分位数方法

国家自然科学基金

0+阅读 · 2014年12月31日

Kahler 曲面中特殊曲面的研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于狄利克雷过程的潜变量模型贝叶斯半参数分析

国家自然科学基金

2+阅读 · 2014年12月31日

相关论文

Common pitfalls to avoid while using multiobjective optimization in machine learning

Arxiv

0+阅读 · 5月2日

Helmholtz preconditioning for the compressible Euler equations using mixed finite elements with Lorenz staggering

Arxiv

0+阅读 · 5月2日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

131+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

30+阅读 · 2023年4月19日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

71+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

135+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

52+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

326+阅读 · 2023年3月31日

Nature Language Reasoning, A Survey

Arxiv

53+阅读 · 2023年3月26日

Data-centric Artificial Intelligence: A Survey

Arxiv

15+阅读 · 2023年3月17日

微信扫码咨询专知VIP会员