【导读】近几年来,基于神经网络的深度学习方法在计算机视觉、语音识别等领域取得了巨大成功,另外在自然语言处理领域也取得了不少进展。在NLP的关键性基础任务—命名实体识别(Named Entity Recognition,NER)的研究中,深度学习获得了不错的效果。近日,南洋理工Aixun Sun等学者在Arxiv发布一篇最新关于命名实体识别的深度学习方法综述论文,详细描述了最新方法的资源与分类,是不可多得参阅材料。
命名实体识别NER
NER又称作专名识别,是自然语言处理中的一项基础任务,应用范围非常广泛。命名实体一般指的是文本中具有特定意义或者指代性强的实体,通常包括人名、地名、组织机构名、日期时间、专有名词等。NER系统就是从非结构化的输入文本中抽取出上述实体,并且可以按照业务需求识别出更多类别的实体,比如产品名称、型号、价格等。因此实体这个概念可以很广,只要是业务需要的特殊文本片段都可以称为实体。下面是一个例子。
据<entity type=”SCOM”>彭博社</entity>最新消息,<entity type=”SCOM”>小米</entity>为时一个月的IPO静默期结束后,分析师们开始将其纳入评级范围。<entity type=”SCOM”>中金</entity>、<entity type=”SCOM”>高盛</entity>、<entity type=”SCOM”>摩根士丹利</entity>和<entity type=”SCOM”>摩根大通</entity>都给出了买入或同等评级。
NER是NLP中一项基础性关键任务。从自然语言处理的流程来看,NER可以看作词法分析中未登录词识别的一种,是未登录词中数量最多、识别难度最大、对分词效果影响最大问题。同时NER也是关系抽取、事件抽取、知识图谱、机器翻译、问答系统等诸多NLP任务的基础。
命名实体识别深度学习方法综述
【摘要】命名实体识别(Named entity recognition, NER)的任务是鉴别出提到命名实体的文本位置,并将它们划分为预定义的类别,如人员、位置、组织等。虽然早期的NER系统能够成功地产生良好的识别精度,但它们往往需要大量的人力来仔细设计规则或特征。近年来,基于连续实值向量表示和通过非线性处理的语义组合的深度学习被应用到NER系统中,产生了最好的识别性能。在本文中,我们对现有的面向NER的深度学习技术进行了全面的回顾。我们首先介绍NER资源,包括标记的NER语料库和现成的NER工具。然后,我们系统地将现有的作品按照三个轴分类:输入的分布式表示、上下文编码器和标记解码器。接下来,我们调查了在新的NER问题设置和应用中最新应用技术的最具代表性的方法。最后,我们向读者介绍了NER系统面临的挑战,并概述了这一领域的未来发展方向。
【论文地址】
http://www.zhuanzhi.ai/paper/2a575334d5f0c17b73b4f98fab99dac6
【论文下载】
请关注专知公众号(扫一扫最下面专知二维码,或者点击上方蓝色专知)
后台回复“NERDL” 就可以获取本文的下载链接~
专知2019年1月将开设一门《深度学习:算法到实战》会重点讲解深度学习序列标注模型用于命名实体识别,欢迎关注报名!
专知开课啦!《深度学习: 算法到实战》, 中科院博士为你讲授!
【论文导读】
NER数据集
NER开源工具
深度学习命名实体识别框架
基于深度神经网络的命名实体识别方法集合
论文页面:
-END-
专 · 知
请加专知小助手微信(扫一扫如下二维码添加),咨询《深度学习:算法到实战》参团限时优惠报名~
欢迎微信扫一扫加入专知人工智能知识星球群,获取专业知识教程视频资料和与专家交流咨询!
请PC登录www.zhuanzhi.ai或者点击阅读原文,注册登录专知,获取更多AI知识资料!
点击“阅读原文”,了解报名专知《深度学习:算法到实战》课程