主题: FLAT: Chinese NER Using Flat-Lattice Transformer
摘要: 最近,通过结合单词信息,已证明字符-单词格结构对中文命名实体识别(NER)有效。 然而,由于晶格结构复杂且动态,因此大多数现有的基于晶格的模型难以充分利用GPU的并行计算,并且推理速度通常较低。 在本文中,我们提出了FLAT:中文NER的平面格子变压器,它将晶格结构转换为由跨度组成的平面结构。 每个跨度对应一个字符或潜在单词及其在原始格中的位置。 借助Transformer的功能和精心设计的位置编码,FLAT可以充分利用晶格信息,并具有出色的并行化能力。 在四个数据集上进行的实验表明,FLAT在性能和效率上均优于其他基于词典的模型。