【中科院自动化所刘成林研究员】跨模态零样本文字识别

过去50多年来，文字识别的研究取得了巨大的进展。深度学习技术使得大类别集手写汉字识别和多语言手写文本行识别精度大幅提高。但是，单字识别研究仍然有意义：一方面好的单字识别器有助于提升文本行识别性能，另一方面有些场合（比如古籍识别）很难对所有类别收集大量样本来训练分类器。

零样本文字识别在只有部分类别样本训练的情况下，可以识别没有训练样本的新类别样本，因而在大类别集、部分类别缺乏样本的情况下有很大的应用价值。

本报告介绍一些零样本汉字识别的研究工作，包括基于部首检测的方法、基于树结构嵌入的方法、基于印刷体原型匹配的方法、基于跨模态度量学习的甲骨文字识别。这些工作显示了零样本识别的初步潜力，但面向古籍文字识别的应用需求，还需开展大量的研究工作。

成为VIP会员查看完整内容

知识荟萃

精品入门和进阶教程、论文和代码整理等

查看相关VIP内容、论文、资讯等

零样本图像分类综述

专知会员服务

52+阅读 · 2021年5月15日

[IEEE TPAMI 2021]卷积原型网络在开放集识别中的应用

专知会员服务

29+阅读 · 2021年2月19日

最新《自然场景中文本检测与识别》综述论文，26页pdf

专知会员服务

70+阅读 · 2020年6月10日

【MLA 2019】面向开放环境的分类器学习，刘成林中科院自动化所研究员

专知会员服务

30+阅读 · 2019年11月6日

文档分析与识别技术回顾与反思，中国科学院自动化研究所刘成林研究员，VALSE2019: 让机器像人一样阅读：文字检测与识别新趋势

专知会员服务

38+阅读 · 2019年10月24日

ICCV2019 | 百度&港大提出CSVT：大规模弱标注中文场景文本数据集及一种新的弱监督端到端文本识别新方法

CVer

9+阅读 · 2019年11月23日

ICCV 2019 | CSVT: 中文场景文本数据集及一种文本识别新方法

极市平台

24+阅读 · 2019年11月20日

【领域报告】小样本学习年度进展|VALSE2018

深度学习大讲堂

26+阅读 · 2018年6月14日

白翔：复杂开放场景中的文本理解

深度学习大讲堂

12+阅读 · 2018年6月5日

【报告分享】刘成林：文档分析及模式识别系统学习领域研究进展与热点

中国科学院自动化研究所

7+阅读 · 2018年1月19日

Measuring Generalization with Optimal Transport

Arxiv

0+阅读 · 2021年6月7日

One-Class Classification: A Survey

Arxiv

8+阅读 · 2021年1月8日

Dynamic Transfer Learning for Named Entity Recognition

Arxiv

5+阅读 · 2019年5月1日

Learning From Positive and Unlabeled Data: A Survey

Arxiv

5+阅读 · 2018年11月12日

Large Margin Few-Shot Learning

Arxiv

11+阅读 · 2018年7月8日

VIP会员

相关内容

知识荟萃

更多