位置嵌入论文 - 专知

会员服务 ·

位置嵌入

VRoPE: Rotary Position Embedding for Video Large Language Models

VRoPE: Rotary Position Embedding for Video Large Language Models

Arxiv

0+阅读 · 10月31日

Revisiting Multimodal Positional Encoding in Vision-Language Models

Arxiv

0+阅读 · 10月27日

Rethinking Addressing in Language Models via Contexualized Equivariant Positional Encoding

Arxiv

0+阅读 · 8月21日

FetFIDS: A Feature Embedding Attention based Federated Network Intrusion Detection Algorithm

Arxiv

0+阅读 · 8月12日

Latent Diffusion U-Net Representations Contain Positional Embeddings and Anomalies

Arxiv

0+阅读 · 4月9日

Positional Encoding via Token-Aware Phase Attention

Arxiv

0+阅读 · 9月16日

Context-aware Rotary Position Embedding

Arxiv

0+阅读 · 7月30日

RoMedFormer: A Rotary-Embedding Transformer Foundation Model for 3D Genito-Pelvic Structure Segmentation in MRI and CT

Arxiv

0+阅读 · 3月18日

VALL-T: Decoder-Only Generative Transducer for Robust and Decoding-Controllable Text-to-Speech

Arxiv

0+阅读 · 3月14日

DRoPE: Directional Rotary Position Embedding for Efficient Agent Interaction Modeling

Arxiv

0+阅读 · 3月19日

Timer-XL: Long-Context Transformers for Unified Time Series Forecasting

Arxiv

0+阅读 · 3月2日

On Conformal Isometry of Grid Cells: Learning Distance-Preserving Position Embedding

Arxiv

0+阅读 · 2月27日

VideoRoPE: What Makes for Good Video Rotary Position Embedding?

Arxiv

0+阅读 · 2月7日

Advancing General Multimodal Capability of Vision-language Models with Pyramid-descent Visual Position Encoding

Arxiv

0+阅读 · 2月12日

Rope to Nope and Back Again: A New Hybrid Attention Strategy

Arxiv

0+阅读 · 1月30日

参考链接

微信扫码咨询专知VIP会员