【NeurIPS 2021】类比进化算法：设计统一的序列模型 - 专知VIP

会员服务 ·

3

NeurIPS 2021 · Transformer · 序列模型 · 论文 ·

2021 年 10 月 30 日

【NeurIPS 2021】类比进化算法：设计统一的序列模型

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

自从ViT提出之后，许多基于Transformer的改进工作在图像分类中取得了不错的结果。然而，很少有工作对Transformer结构的有效性进行研究并解释，同时也尚未有工作采用统一的思想探究如何使用一个模型来解决多模态问题。我们首次通过进化算法的角度对Transformer结构进行解释，并提出了一个统一的序列模型范式去解决多模态问题。我们的贡献有以下几点：

理论上，我们通过类比进化算法（EA）来解释Vision Transformer（TR）的合理性，并推导出它们具有一致的数学表示。
方法上，类比EA中的动态局部种群概念，我们对ViT模型进行改进，设计了一个效率更高、效果更好的EAT模型，并提出了Task-related Head模块来更灵活、更优雅地处理多个任务。
框架上，我们引入了空间填充曲线（SFC）模块作为二维图像数据和一维序列数据之间的桥梁，使得仅用一个统一模型解决多模态任务的统一范式成为可能，同时将网络架构设计和数据结构独立开来。
分类和多模态实验证明了我们方法的优越性和灵活性。

成为VIP会员查看完整内容

16

相关内容

NeurIPS 2021

清华大学提出ACmix | 这才是Self-Attention与CNN正确的融合范式，性能速度全面提升

清华大学提出ACmix | 这才是Self-Attention与CNN正确的融合范式，性能速度全面提升

专知会员服务

27+阅读 · 2021年12月3日

【NeurIPS 2021】流形上的注意力机制：规范等变的Transformer

【NeurIPS 2021】流形上的注意力机制：规范等变的Transformer

专知会员服务

30+阅读 · 2021年12月2日

【NeurIPS 2021】寻找视觉Transformer的搜索空间

【NeurIPS 2021】寻找视觉Transformer的搜索空间

专知会员服务

14+阅读 · 2021年12月1日

NeurIPS 2021丨K-Net: 迈向统一的图像分割

NeurIPS 2021丨K-Net: 迈向统一的图像分割

专知会员服务

17+阅读 · 2021年11月25日

【ICML2021】通过文本生成统一视觉和语言任务

专知会员服务

19+阅读 · 2021年9月13日

WWW2021 | 同源共流：一个优化框架统一与解释图神经网络

专知会员服务

30+阅读 · 2021年2月26日

【WWW2021】用优化框架解释和统一图神经网络

【WWW2021】用优化框架解释和统一图神经网络

专知会员服务

45+阅读 · 2021年2月1日

【NeurIPS 2020】学习神经网络中的不变性

专知会员服务

29+阅读 · 2020年10月24日

【NeurIPS 2020 】神经网络结构生成优化

【NeurIPS 2020 】神经网络结构生成优化

专知会员服务

21+阅读 · 2020年10月24日

【ICCV 2019】贝叶斯优化的1-Bit CNNs 《Bayesian Optimized 1-Bit CNNs》

【ICCV 2019】贝叶斯优化的1-Bit CNNs 《Bayesian Optimized 1-Bit CNNs》

专知会员服务

16+阅读 · 2019年11月17日

【ICML2021】低秩Sinkhorn 分解

【ICML2021】低秩Sinkhorn 分解

专知

9+阅读 · 2021年8月20日

【NeurIPS2019论文PPT】多模态模型无关的元学习 MMAML

【NeurIPS2019论文PPT】多模态模型无关的元学习 MMAML

专知

5+阅读 · 2019年12月30日

【论文笔记】自注意力图池化

【论文笔记】自注意力图池化

专知

82+阅读 · 2019年11月18日

基于关系网络的视觉建模：有望替代卷积神经网络

基于关系网络的视觉建模：有望替代卷积神经网络

微软研究院AI头条

10+阅读 · 2019年7月12日

元学习(Meta-Learning) 综述及五篇顶会论文推荐

元学习(Meta-Learning) 综述及五篇顶会论文推荐

专知

194+阅读 · 2019年4月14日

用这种方法实现无监督端到端图像分类！（附论文）

用这种方法实现无监督端到端图像分类！（附论文）

数据派THU

8+阅读 · 2018年8月10日

基于多篇经典论文综述Attention模型方法（附源码）

基于多篇经典论文综述Attention模型方法（附源码）

数据派THU

7+阅读 · 2018年6月17日

论文浅尝 | 利用 RNN 和 CNN 构建基于 FreeBase 的问答系统

论文浅尝 | 利用 RNN 和 CNN 构建基于 FreeBase 的问答系统

开放知识图谱

11+阅读 · 2018年4月25日

谷歌大脑AutoML最新进展：用进化算法发现神经网络架构

谷歌大脑AutoML最新进展：用进化算法发现神经网络架构

AI前线

7+阅读 · 2018年3月16日

深度判别和共享特征学习的图像分类

深度判别和共享特征学习的图像分类

计算机视觉战队

6+阅读 · 2017年9月27日

Low-Dimensional Hyperbolic Knowledge Graph Embeddings

Arxiv

14+阅读 · 2020年5月1日

Talking-Heads Attention

Talking-Heads Attention

Arxiv

15+阅读 · 2020年3月5日

Reinforcement Learning Enhanced Quantum-inspired Algorithm for Combinatorial Optimization

Arxiv

4+阅读 · 2020年2月14日

UNITER: Learning UNiversal Image-TExt Representations

UNITER: Learning UNiversal Image-TExt Representations

Arxiv

23+阅读 · 2019年9月25日

Learning to Walk via Deep Reinforcement Learning

Arxiv

7+阅读 · 2018年12月26日

Embedding Logical Queries on Knowledge Graphs

Embedding Logical Queries on Knowledge Graphs

Arxiv

5+阅读 · 2018年9月6日

The Bottleneck Simulator: A Model-based Deep Reinforcement Learning Approach

The Bottleneck Simulator: A Model-based Deep Reinforcement Learning Approach

Arxiv

11+阅读 · 2018年7月12日

OpenNMT: Neural Machine Translation Toolkit

Arxiv

3+阅读 · 2018年5月28日

Billion-scale Network Embedding with Iterative Random Projection

Arxiv

5+阅读 · 2018年5月7日

Improved Fusion of Visual and Language Representations by Dense Symmetric Co-Attention for Visual Question Answering

Arxiv

4+阅读 · 2018年4月3日

VIP会员

相关主题

相关VIP内容

清华大学提出ACmix | 这才是Self-Attention与CNN正确的融合范式，性能速度全面提升

清华大学提出ACmix | 这才是Self-Attention与CNN正确的融合范式，性能速度全面提升

专知会员服务

27+阅读 · 2021年12月3日

【NeurIPS 2021】流形上的注意力机制：规范等变的Transformer

【NeurIPS 2021】流形上的注意力机制：规范等变的Transformer

专知会员服务

30+阅读 · 2021年12月2日

【NeurIPS 2021】寻找视觉Transformer的搜索空间

【NeurIPS 2021】寻找视觉Transformer的搜索空间

专知会员服务

14+阅读 · 2021年12月1日

NeurIPS 2021丨K-Net: 迈向统一的图像分割

NeurIPS 2021丨K-Net: 迈向统一的图像分割

专知会员服务

17+阅读 · 2021年11月25日

【ICML2021】通过文本生成统一视觉和语言任务

专知会员服务

19+阅读 · 2021年9月13日

WWW2021 | 同源共流：一个优化框架统一与解释图神经网络

专知会员服务

30+阅读 · 2021年2月26日

【WWW2021】用优化框架解释和统一图神经网络

【WWW2021】用优化框架解释和统一图神经网络

专知会员服务

45+阅读 · 2021年2月1日

【NeurIPS 2020】学习神经网络中的不变性

专知会员服务

29+阅读 · 2020年10月24日

【NeurIPS 2020 】神经网络结构生成优化

【NeurIPS 2020 】神经网络结构生成优化

专知会员服务

21+阅读 · 2020年10月24日

【ICCV 2019】贝叶斯优化的1-Bit CNNs 《Bayesian Optimized 1-Bit CNNs》

【ICCV 2019】贝叶斯优化的1-Bit CNNs 《Bayesian Optimized 1-Bit CNNs》

专知会员服务

16+阅读 · 2019年11月17日

热门VIP内容

开通专知VIP会员享更多权益服务

《多智能体不确定环境追逃博弈研究》216页

美智库最新发布《解放军"人机编组协同作战"发展路径：理论与实践》53页

现代战争"杀伤区"理论：空间尺度与结构特征、控制手段与毁伤机制、生存策略与战线转移

《俄军无人机创新技术或已在乌克兰达成"战场空中封锁"作战效果》最新18页报告

相关资讯

【ICML2021】低秩Sinkhorn 分解

【ICML2021】低秩Sinkhorn 分解

专知

9+阅读 · 2021年8月20日

【NeurIPS2019论文PPT】多模态模型无关的元学习 MMAML

【NeurIPS2019论文PPT】多模态模型无关的元学习 MMAML

专知

5+阅读 · 2019年12月30日

【论文笔记】自注意力图池化

【论文笔记】自注意力图池化

专知

82+阅读 · 2019年11月18日

基于关系网络的视觉建模：有望替代卷积神经网络

基于关系网络的视觉建模：有望替代卷积神经网络

微软研究院AI头条

10+阅读 · 2019年7月12日

元学习(Meta-Learning) 综述及五篇顶会论文推荐

元学习(Meta-Learning) 综述及五篇顶会论文推荐

专知

194+阅读 · 2019年4月14日

用这种方法实现无监督端到端图像分类！（附论文）

用这种方法实现无监督端到端图像分类！（附论文）

数据派THU

8+阅读 · 2018年8月10日

基于多篇经典论文综述Attention模型方法（附源码）

基于多篇经典论文综述Attention模型方法（附源码）

数据派THU

7+阅读 · 2018年6月17日

论文浅尝 | 利用 RNN 和 CNN 构建基于 FreeBase 的问答系统

论文浅尝 | 利用 RNN 和 CNN 构建基于 FreeBase 的问答系统

开放知识图谱

11+阅读 · 2018年4月25日

谷歌大脑AutoML最新进展：用进化算法发现神经网络架构

谷歌大脑AutoML最新进展：用进化算法发现神经网络架构

AI前线

7+阅读 · 2018年3月16日

深度判别和共享特征学习的图像分类

深度判别和共享特征学习的图像分类

计算机视觉战队

6+阅读 · 2017年9月27日

相关论文

Low-Dimensional Hyperbolic Knowledge Graph Embeddings

Arxiv

14+阅读 · 2020年5月1日

Talking-Heads Attention

Talking-Heads Attention

Arxiv

15+阅读 · 2020年3月5日

Reinforcement Learning Enhanced Quantum-inspired Algorithm for Combinatorial Optimization

Arxiv

4+阅读 · 2020年2月14日

UNITER: Learning UNiversal Image-TExt Representations

UNITER: Learning UNiversal Image-TExt Representations

Arxiv

23+阅读 · 2019年9月25日

Learning to Walk via Deep Reinforcement Learning

Arxiv

7+阅读 · 2018年12月26日

Embedding Logical Queries on Knowledge Graphs

Embedding Logical Queries on Knowledge Graphs

Arxiv

5+阅读 · 2018年9月6日

The Bottleneck Simulator: A Model-based Deep Reinforcement Learning Approach

The Bottleneck Simulator: A Model-based Deep Reinforcement Learning Approach

Arxiv

11+阅读 · 2018年7月12日

OpenNMT: Neural Machine Translation Toolkit

Arxiv

3+阅读 · 2018年5月28日

Billion-scale Network Embedding with Iterative Random Projection

Arxiv

5+阅读 · 2018年5月7日

Improved Fusion of Visual and Language Representations by Dense Symmetric Co-Attention for Visual Question Answering

Arxiv

4+阅读 · 2018年4月3日

微信扫码咨询专知VIP会员