注意力机制论文 - 专知

会员服务 ·

注意力机制

注意力机制

Attention机制最早是在视觉图像领域提出来的，但是真正火起来应该算是google mind团队的这篇论文《Recurrent Models of Visual Attention》[14]，他们在RNN模型上使用了attention机制来进行图像分类。随后，Bahdanau等人在论文《Neural Machine Translation by Jointly Learning to Align and Translate》 [1]中，使用类似attention的机制在机器翻译任务上将翻译和对齐同时进行，他们的工作算是是第一个提出attention机制应用到NLP领域中。接着类似的基于attention机制的RNN模型扩展开始应用到各种NLP任务中。最近，如何在CNN中使用attention机制也成为了大家的研究热点。下图表示了attention研究进展的大概趋势。

Multi-label Classification with Panoptic Context Aggregation Networks

Arxiv

0+阅读 · 12月29日

Multi Modal Attention Networks with Uncertainty Quantification for Automated Concrete Bridge Deck Delamination Detection

Arxiv

0+阅读 · 12月29日

WeDLM: Reconciling Diffusion Language Models with Standard Causal Attention for Fast Inference

Arxiv

0+阅读 · 12月28日

The Bayesian Geometry of Transformer Attention

Arxiv

0+阅读 · 12月27日

DSwinIR: Rethinking Window-based Attention for Image Restoration

Arxiv

0+阅读 · 12月28日

Explainable Statute Prediction via Attention-based Model and LLM Prompting

Arxiv

0+阅读 · 12月26日

Don't Pay Attention, PLANT It: Pretraining Attention via Learning-to-Rank

Arxiv

0+阅读 · 12月26日

Comp-Attn: Present-and-Align Attention for Compositional Video Generation

Arxiv

0+阅读 · 12月21日

Enhancing Multi-Agent Collaboration with Attention-Based Actor-Critic Policies

Arxiv

0+阅读 · 12月22日

Multi Modal Attention Networks with Uncertainty Quantification for Automated Concrete Bridge Deck Delamination Detection

Arxiv

0+阅读 · 12月23日

CrossLMM: Decoupling Long Video Sequences from LMMs via Dual Cross-Attention Mechanisms

Arxiv

0+阅读 · 12月21日

Spatially-informed transformers: Injecting geostatistical covariance biases into self-attention for spatio-temporal forecasting

Arxiv

0+阅读 · 12月19日

Don't Pay Attention, PLANT It: Pretraining Attention via Learning-to-Rank

Arxiv

0+阅读 · 12月23日

Optimizing Mixture of Block Attention

Arxiv

0+阅读 · 12月19日

FluencyVE: Marrying Temporal-Aware Mamba with Bypass Attention for Video Editing

Arxiv

0+阅读 · 12月24日

参考链接

微信扫码咨询专知VIP会员