作者Jacob Andreas是自然语言处理的研究者,研究兴趣为用语言作为更有效学习的支架和理解模型行为的探针,以及结合深度表示和离散组合性优点的结构化神经方法。近期公开发布了他的博士论文。
博士论文介绍:
本文探讨了语言结构在结构和参数化中用于语言处理和其他应用的机器学习模型的方法。作者将该模型应用于问答系统,指令跟踪,图像分类等多种任务。
作者首先介绍一类称为神经模块网络(NMN)的模型,并介绍它们在自然语言问答中的应用。NMN旨在实现同时利用深层网络的表征能力和构成问题的语言结构。我们的方法将问题分解为语言子结构,并使用这些子结构动态地从可重复使用的模块库构建网络。由此产生的复合网络是共同训练的。作者并在含有图像和结构化知识库的问答数据集上的方法评估模型。随后,作者将这种思想转移到策略学习中,研究在面对不同但相似的问题时,怎么组合策略。