命名实体识别(NER)的任务是识别提到命名实体的文本范围,并将它们分类为预定义的类别,如人员、位置、组织等。NER是各种自然语言应用的基础,如问题回答、文本摘要和机器翻译。虽然早期的NER系统能够成功地产生相当高的识别精度,但它们通常需要大量的人力来精心设计规则或特征。近年来,基于连续实值向量表示和通过非线性处理的语义组合的深度学习被应用到NER系统中,产生了最先进的性能。在这篇论文中,我们对现有的深度学习技术进行了全面的回顾。我们首先介绍NER资源,包括标记的NER语料库和现成的NER工具。然后,我们根据一个分类法沿着三个轴对现有的作品进行了系统的分类:输入的分布式表示、上下文编码器和标记解码器。接下来,我们调查了最近在新的NER问题设置和应用中应用深度学习技术的最有代表性的方法。最后,我们向读者介绍NER系统所面临的挑战,并概述该领域的未来发展方向。
南洋理工大学(简称NTU,南大),是新加坡首屈一指的世界级顶尖大学。NTU工学院是全球规模最大的工程学院之一,商学院也是亚洲顶尖商学院之一。在2015QS世界大学排名中,NTU名列第13位。