新想法！Geoffrey Hinton独自署名论文，如何在神经网络中表示部分-整体层次结构，结构化表示获取可解释性

本文没有描述一个工作系统。相反，它提出了一个关于表示的单一想法，允许几个不同群体的进步被组合成一个虚构的系统，称为GLOM。这些进展包括transformers、神经域、对比表示学习、蒸馏和胶囊。GLOM回答了这个问题: 具有固定架构的神经网络如何将图像解析为具有不同结构的部分整体层次结构?其思想是简单地使用相同向量的岛屿来表示解析树中的节点。如果GLOM能够正常工作，那么当将其应用于视觉或语言时，它将显著提高类transformer系统产生的表示的可解释性。

https://arxiv.org/abs/2102.12627

有强有力的心理学证据表明，人们将视觉场景解析为部分整体的层次结构，并将部分和整体之间的视不变空间关系建模为他们分配给部分和整体的内在坐标系之间的坐标转换[Hinton, 1979]。如果我们想让神经网络像人类一样理解图像，我们需要弄清楚神经网络是如何代表部分-整体层次结构的。这是困难的，因为一个真正的神经网络不能动态分配一组神经元来表示解析树中的一个节点。神经网络无法动态分配神经元是一系列使用“胶囊”模型的动机[Sabour et al.， 2017, Hinton et al.， 2018, Kosiorek et al.， 2019]。这些模型假设一组被称为胶囊的神经元将永久地专注于发生在图像特定区域的特定类型的一部分。然后，可以通过激活这些预先存在的特定于类型的封装的子集以及它们之间的适当连接来创建解析树。本文描述了一种非常不同的方法，使用胶囊来表示神经网络中的部分-整体层次结构。

尽管本文主要关注单个静态图像的感知，但GLOM最容易理解为处理帧序列的管道，因此静态图像将被视为相同帧序列。

GLOM体系结构由大量的列组成，这些列都使用完全相同的权重。每一列都是一个空间本地自动编码器的堆栈，它学习在一个小图像补丁中发生的多级表示。每个自动编码器使用多层自底向上编码器和多层自顶向下解码器将一层上的嵌入转换为相邻层上的嵌入。这些级别对应于部分-整体层次结构中的级别。例如，当显示一张脸的图像时，单个列可能会汇聚到表示鼻孔、鼻子、脸和人的嵌入向量上。图1显示了不同级别的嵌入如何在单个列中交互。

成为VIP会员查看完整内容

相关内容

神经网络

关注 5912

人工神经网络（Artificial Neural Network，即ANN ），是20世纪80 年代以来人工智能领域兴起的研究热点。它从信息处理角度对人脑神经元网络进行抽象，建立某种简单模型，按不同的连接方式组成不同的网络。在工程与学术界也常直接简称为神经网络或类神经网络。神经网络是一种运算模型，由大量的节点（或称神经元）之间相互联接构成。每个节点代表一种特定的输出函数，称为激励函数（activation function）。每两个节点间的连接都代表一个对于通过该连接信号的加权值，称之为权重，这相当于人工神经网络的记忆。网络的输出则依网络的连接方式，权重值和激励函数的不同而不同。而网络自身通常都是对自然界某种算法或者函数的逼近，也可能是对一种逻辑策略的表达。最近十多年来，人工神经网络的研究工作不断深入，已经取得了很大的进展，其在模式识别、智能机器人、自动控制、预测估计、生物、医学、经济等领域已成功地解决了许多现代计算机难以解决的实际问题，表现出了良好的智能特性。

[WWW2021]图结构估计神经网络

专知会员服务

43+阅读 · 2021年3月29日

剑桥大学《人工智能在药物发现中的作用》，附论文与31页PPT

专知会员服务

53+阅读 · 2021年2月20日

最新《注意力机制》教程，112页ppt

专知会员服务

326+阅读 · 2020年11月24日

最新《图神经网络实用指南》2020论文，28页pdf

专知会员服务

222+阅读 · 2020年10月17日