Named entity recognition (NER) is a well-studied task in natural language processing. Traditional NER research only deals with flat entities and ignores nested entities. The span-based methods treat entity recognition as a span classification task. Although these methods have the innate ability to handle nested NER, they suffer from high computational cost, ignorance of boundary information, under-utilization of the spans that partially match with entities, and difficulties in long entity recognition. To tackle these issues, we propose a two-stage entity identifier. First we generate span proposals by filtering and boundary regression on the seed spans to locate the entities, and then label the boundary-adjusted span proposals with the corresponding categories. Our method effectively utilizes the boundary information of entities and partially matched spans during training. Through boundary regression, entities of any length can be covered theoretically, which improves the ability to recognize long entities. In addition, many low-quality seed spans are filtered out in the first stage, which reduces the time complexity of inference. Experiments on nested NER datasets demonstrate that our proposed method outperforms previous state-of-the-art models.


翻译:在自然语言处理中,命名实体识别(NER)是一项研究周密的任务。传统的NER研究仅涉及平板实体,忽视嵌套实体。基于跨区域的方法将实体识别视为一个跨类分类任务。虽然这些方法具有处理嵌套净入学率的内在能力,但它们面临着高计算成本、对边界信息的无知、对部分与实体相对应的跨度的利用不足以及实体长期识别方面的困难。为了解决这些问题,我们提议了一个两阶段实体标识。首先,我们通过过滤和边界回归来生成建议,以确定实体的位置,然后将边界调整的跨区域建议标为相应的类别。我们的方法有效利用了实体的边界信息并在培训期间部分匹配的跨度。通过边界回归,任何长度的实体都可以在理论上被覆盖,从而提高识别长实体的能力。此外,许多低质量的种子跨度在第一阶段被过滤,从而降低了推断的时间复杂性。对嵌套国家数据库的实验表明,我们拟议的方法超出了以前的状态模型。

3
下载
关闭预览

相关内容

【干货书】实体搜索,Entity-Oriented Search,358页pdf
专知会员服务
34+阅读 · 2021年4月9日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
机器学习入门的经验与建议
专知会员服务
90+阅读 · 2019年10月10日
最新BERT相关论文清单,BERT-related Papers
专知会员服务
52+阅读 · 2019年9月29日
Hierarchically Structured Meta-learning
CreateAMind
23+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
25+阅读 · 2019年5月18日
笔记 | Deep active learning for named entity recognition
黑龙江大学自然语言处理实验室
24+阅读 · 2018年5月27日
已删除
将门创投
10+阅读 · 2018年5月2日
Arxiv
5+阅读 · 2019年11月22日
Multi-Grained Named Entity Recognition
Arxiv
6+阅读 · 2019年6月20日
Arxiv
15+阅读 · 2018年2月4日
VIP会员
相关资讯
Hierarchically Structured Meta-learning
CreateAMind
23+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
25+阅读 · 2019年5月18日
笔记 | Deep active learning for named entity recognition
黑龙江大学自然语言处理实验室
24+阅读 · 2018年5月27日
已删除
将门创投
10+阅读 · 2018年5月2日
Top
微信扫码咨询专知VIP会员