近年来,卷积神经网络(ConvNets)在大量计算机视觉任务中的应用出现了戏剧性的增长。卷积结构在许多任务中都是非常强大的,它可以从图像像素中提取相关性和抽象概念。然而,当面对一些更困难的计算机视觉任务时,ConvNets在建模中也有相当多的属性方面存在缺陷。这些属性包括成对关系、全局上下文和处理超越空间网格的不规则数据的能力。
一个有效的方向是根据手头的任务重新组织要用图处理的数据,同时构建网络模块,在图内的视觉元素之间关联和传播信息。我们将这种具有传播模块的网络称为图网络结构。在本教程中,我们将介绍一系列有效的图网络结构,包括非局部神经网络、空间广义传播网络、面向对象和多主体行为建模的关系网络、面向3D领域的视频和数据的图网络。我们还将讨论如何利用图神经网络结构来研究连接模式。最后,我们将讨论在许多视觉问题中仍然存在的相关开放挑战。https://xiaolonw.github.io/graphnnv2/
专知便捷查看
便捷下载,请关注专知公众号(点击上方蓝色专知关注)
后台回复“VGSR” 可以获取《视觉的图网络结构表示学习,Google Chen Sun》专知下载链接索引