过去50多年来,文字识别的研究取得了巨大的进展。深度学习技术使得大类别集手写汉字识别和多语言手写文本行识别精度大幅提高。但是,单字识别研究仍然有意义:一方面好的单字识别器有助于提升文本行识别性能,另一方面有些场合(比如古籍识别)很难对所有类别收集大量样本来训练分类器。

零样本文字识别在只有部分类别样本训练的情况下,可以识别没有训练样本的新类别样本,因而在大类别集、部分类别缺乏样本的情况下有很大的应用价值。

本报告介绍一些零样本汉字识别的研究工作,包括基于部首检测的方法、基于树结构嵌入的方法、基于印刷体原型匹配的方法、基于跨模态度量学习的甲骨文字识别。这些工作显示了零样本识别的初步潜力,但面向古籍文字识别的应用需求,还需开展大量的研究工作。

成为VIP会员查看完整内容
35

相关内容

利用计算机自动识别字符的技术,是模式识别应用的一个重要领域。人们在生产和生活中,要处理大量的文字、报表和文本。为了减轻人们的劳动,提高处理效率,50年代开始探讨一般文字识别方法,并研制出光学字符识别器。60年代出现了采用磁性墨水和特殊字体的实用机器。60年代后期,出现了多种字体和手写体文字识别机,其识别精度和机器性能都基本上能满足要求。如用于信函分拣的手写体数字识别机和印刷体英文数字识别机。70年代主要研究文字识别的基本理论和研制高性能的文字识别机,并着重于汉字识别的研究。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
专知会员服务
69+阅读 · 2021年5月21日
专知会员服务
50+阅读 · 2021年5月15日
视频人脸识别进展综述
专知会员服务
53+阅读 · 2021年3月12日
专知会员服务
28+阅读 · 2021年2月19日
最新《自然场景中文本检测与识别》综述论文,26页pdf
专知会员服务
69+阅读 · 2020年6月10日
基于深度神经网络的少样本学习综述
专知会员服务
166+阅读 · 2020年4月22日
目标检测小tricks之样本不均衡处理
PaperWeekly
49+阅读 · 2019年4月5日
【紫冬分享】自动化所团队获PRCV2018 美图短视频实时分类挑战赛冠军
中国科学院自动化研究所
10+阅读 · 2018年11月30日
【深度解读】陶建华:深度神经网络与语音
中国科学院自动化研究所
6+阅读 · 2018年7月9日
【领域报告】小样本学习年度进展|VALSE2018
深度学习大讲堂
26+阅读 · 2018年6月14日
白翔:复杂开放场景中的文本理解
深度学习大讲堂
12+阅读 · 2018年6月5日
【报告分享】刘成林:文档分析及模式识别系统学习领域研究进展与热点
OCR技术浅析
机器学习研究会
40+阅读 · 2017年12月8日
Arxiv
0+阅读 · 2021年6月7日
One-Class Classification: A Survey
Arxiv
7+阅读 · 2021年1月8日
Arxiv
29+阅读 · 2019年3月13日
Learning From Positive and Unlabeled Data: A Survey
Arxiv
4+阅读 · 2018年11月12日
Arxiv
11+阅读 · 2018年7月8日
Arxiv
4+阅读 · 2018年3月14日
VIP会员
相关VIP内容
专知会员服务
69+阅读 · 2021年5月21日
专知会员服务
50+阅读 · 2021年5月15日
视频人脸识别进展综述
专知会员服务
53+阅读 · 2021年3月12日
专知会员服务
28+阅读 · 2021年2月19日
最新《自然场景中文本检测与识别》综述论文,26页pdf
专知会员服务
69+阅读 · 2020年6月10日
基于深度神经网络的少样本学习综述
专知会员服务
166+阅读 · 2020年4月22日
相关资讯
目标检测小tricks之样本不均衡处理
PaperWeekly
49+阅读 · 2019年4月5日
【紫冬分享】自动化所团队获PRCV2018 美图短视频实时分类挑战赛冠军
中国科学院自动化研究所
10+阅读 · 2018年11月30日
【深度解读】陶建华:深度神经网络与语音
中国科学院自动化研究所
6+阅读 · 2018年7月9日
【领域报告】小样本学习年度进展|VALSE2018
深度学习大讲堂
26+阅读 · 2018年6月14日
白翔:复杂开放场景中的文本理解
深度学习大讲堂
12+阅读 · 2018年6月5日
【报告分享】刘成林:文档分析及模式识别系统学习领域研究进展与热点
OCR技术浅析
机器学习研究会
40+阅读 · 2017年12月8日
相关论文
微信扫码咨询专知VIP会员