尽管在过去的十年里取得了巨大的进步,深度学习方法通常仍无法达到人类水平的系统性泛化。有人认为,显式地捕捉数据的底层结构应该使联结主义系统能够以更可预测和系统化的方式进行泛化。事实上,人类的证据表明,以类似符号的组合实体来解释世界对于智能行为和高层次推理可能至关重要。深度学习系统的另一个常见限制是它们需要大量的训练数据,而这可能需要高昂的成本。在表示学习中,大型数据集被用来学习通用的数据表示,这对于高效地学习任意下游任务可能非常有用。
这篇论文是关于结构化表示学习的。我们研究一些能够在很少或没有监督的情况下学习非结构化数据表示的方法,这些表示能够捕捉到数据的隐藏结构。在论文的第一部分,我们专注于能够将数据的解释性变化因素解耦的表示学习方法。我们将解耦表示学习方法扩展到一个新颖的机器人数据集,并对预训练表示在下游机器人任务的跨分布泛化能力的作用进行了系统的大规模研究。论文的第二部分侧重于面向对象的表示学习,这些表示能够以符号实体的形式捕捉输入的组合结构,例如视觉场景中的对象。面向对象的学习方法学习从非结构化的输入中形成有意义的实体,从而使连接主义基础上的符号信息处理成为可能。在本研究中,我们在多个常见数据集上训练了一系列方法,并调查它们在下游任务中的有用性和跨分布泛化能力。