机器阅读理解(MRC)旨在教会机器阅读和理解人类语言,这是自然语言处理(NLP)的长期目标。随着深度神经网络的爆发和上下文语言模型(CLMs)的发展,MRC的研究经历了两个重大突破。MRC和CLM作为一种现象,对NLP社区产生了巨大的影响。本文从以下几个方面对MRC进行了全面的比较研究:1)MRC和CLM的起源和发展,特别是CLM的作用;2) MRC和CLM对NLP社区的影响;3) MRC的定义、数据集和评价;(4)基于人类认知过程视角的两阶段译码解算体系结构视角下的通用MRC体系结构与技术方法;5)以往研究的亮点、新出现的课题以及我们的实证分析,其中我们特别关注了在MRC研究的不同时期的作用。针对这些主题,我们提出了一个全视图分类和新的分类法。我们的主要观点是:1)MRC促进了从语言处理到理解的进程;2) MRC系统的快速改进得益于CLMs的发展;3) MRC的主题逐渐从浅层的文本匹配转向认知推理。
https://www.zhuanzhi.ai/paper/4a9e5f961d514baf95a9ab3cae550262