过去50多年来,文字识别的研究取得了巨大的进展。深度学习技术使得大类别集手写汉字识别和多语言手写文本行识别精度大幅提高。但是,单字识别研究仍然有意义:一方面好的单字识别器有助于提升文本行识别性能,另一方面有些场合(比如古籍识别)很难对所有类别收集大量样本来训练分类器。
零样本文字识别在只有部分类别样本训练的情况下,可以识别没有训练样本的新类别样本,因而在大类别集、部分类别缺乏样本的情况下有很大的应用价值。
本报告介绍一些零样本汉字识别的研究工作,包括基于部首检测的方法、基于树结构嵌入的方法、基于印刷体原型匹配的方法、基于跨模态度量学习的甲骨文字识别。这些工作显示了零样本识别的初步潜力,但面向古籍文字识别的应用需求,还需开展大量的研究工作。