The nonlocal-based blocks are designed for capturing long-range spatial-temporal dependencies in computer vision tasks. Although having shown excellent performance, they still lack the mechanism to encode the rich, structured information among elements in an image or video. In this paper, to theoretically analyze the property of these nonlocal-based blocks, we provide a new perspective to interpret them, where we view them as a set of graph filters generated on a fully-connected graph. Specifically, when choosing the Chebyshev graph filter, a unified formulation can be derived for explaining and analyzing the existing nonlocal-based blocks (e.g., nonlocal block, nonlocal stage, double attention block). Furthermore, by concerning the property of spectral, we propose an efficient and robust spectral nonlocal block, which can be more robust and flexible to catch long-range dependencies when inserted into deep neural networks than the existing nonlocal blocks. Experimental results demonstrate the clear-cut improvements and practical applicabilities of our method on image classification, action recognition, semantic segmentation, and person re-identification tasks.


翻译:非本地区块的设计是为了捕捉计算机视觉任务中的远程空间-时空依赖性。虽然它们表现良好,但它们仍然缺乏在图像或视频中对元素中含有的丰富、结构化信息进行编码的机制。在本文件中,为了从理论上分析这些非本地区块的属性,我们提供了一个新的视角来解释这些区块,我们将它们视为完全连接的图表上生成的一组图表过滤器。具体地说,在选择Chebyshev图过滤器时,可以产生一种统一的配方,用于解释和分析现有的非本地区块(例如,非本地区块、非本地区块、双地段、双地段)。此外,关于光谱特性,我们提议了一个高效和稳健的光谱非本地区块,在与现有非本地区块相连接的深层神经网络连接时,可以更有力和灵活地捕捉长距离依赖性。实验结果表明,我们在图像分类、行动识别、语义分割和人再识别任务方面,我们的方法有明确的改进和实际相适应性。

0
下载
关闭预览

相关内容

专知会员服务
32+阅读 · 2021年6月12日
注意力机制综述
专知会员服务
83+阅读 · 2021年1月26日
专知会员服务
54+阅读 · 2020年11月3日
IJCAI2020接受论文列表,592篇论文pdf都在这了!
专知会员服务
64+阅读 · 2020年7月16日
【ICLR2020-】基于记忆的图网络,MEMORY-BASED GRAPH NETWORKS
专知会员服务
110+阅读 · 2020年2月22日
[综述]深度学习下的场景文本检测与识别
专知会员服务
78+阅读 · 2019年10月10日
语义分割中的Attention和低秩重建
极市平台
37+阅读 · 2019年9月1日
Transferring Knowledge across Learning Processes
CreateAMind
28+阅读 · 2019年5月18日
《pyramid Attention Network for Semantic Segmentation》
统计学习与视觉计算组
44+阅读 · 2018年8月30日
计算机视觉领域顶会CVPR 2018 接受论文列表
Hierarchical Imitation - Reinforcement Learning
CreateAMind
19+阅读 · 2018年5月25日
视频超分辨 Detail-revealing Deep Video Super-resolution 论文笔记
统计学习与视觉计算组
17+阅读 · 2018年3月16日
Adversarial Variational Bayes: Unifying VAE and GAN 代码
CreateAMind
7+阅读 · 2017年10月4日
【论文】图上的表示学习综述
机器学习研究会
14+阅读 · 2017年9月24日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Arxiv
0+阅读 · 2021年10月14日
Arxiv
7+阅读 · 2021年7月5日
Arxiv
8+阅读 · 2021年2月19日
Arxiv
3+阅读 · 2018年10月25日
Arxiv
3+阅读 · 2018年2月11日
Arxiv
3+阅读 · 2015年11月29日
VIP会员
相关VIP内容
专知会员服务
32+阅读 · 2021年6月12日
注意力机制综述
专知会员服务
83+阅读 · 2021年1月26日
专知会员服务
54+阅读 · 2020年11月3日
IJCAI2020接受论文列表,592篇论文pdf都在这了!
专知会员服务
64+阅读 · 2020年7月16日
【ICLR2020-】基于记忆的图网络,MEMORY-BASED GRAPH NETWORKS
专知会员服务
110+阅读 · 2020年2月22日
[综述]深度学习下的场景文本检测与识别
专知会员服务
78+阅读 · 2019年10月10日
相关资讯
语义分割中的Attention和低秩重建
极市平台
37+阅读 · 2019年9月1日
Transferring Knowledge across Learning Processes
CreateAMind
28+阅读 · 2019年5月18日
《pyramid Attention Network for Semantic Segmentation》
统计学习与视觉计算组
44+阅读 · 2018年8月30日
计算机视觉领域顶会CVPR 2018 接受论文列表
Hierarchical Imitation - Reinforcement Learning
CreateAMind
19+阅读 · 2018年5月25日
视频超分辨 Detail-revealing Deep Video Super-resolution 论文笔记
统计学习与视觉计算组
17+阅读 · 2018年3月16日
Adversarial Variational Bayes: Unifying VAE and GAN 代码
CreateAMind
7+阅读 · 2017年10月4日
【论文】图上的表示学习综述
机器学习研究会
14+阅读 · 2017年9月24日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
相关论文
Arxiv
0+阅读 · 2021年10月14日
Arxiv
7+阅读 · 2021年7月5日
Arxiv
8+阅读 · 2021年2月19日
Arxiv
3+阅读 · 2018年10月25日
Arxiv
3+阅读 · 2018年2月11日
Arxiv
3+阅读 · 2015年11月29日
Top
微信扫码咨询专知VIP会员