报告嘉宾:刘成林(中国科学院自动化研究所) 报告时间:2019年10月16日(星期三)晚上20:30(北京时间) 报告题目:文档分析与识别技术回顾与反思

报告人简介: 刘成林,1989年本科毕业于武汉大学,1992年获北京工业大学工学硕士学位,1995年获中国科学院自动化研究所工学博士学位。1996年至1999年先后在韩国科学技术院(KAIST)和日本东京农工大学从事博士后研究工作。1999年至2004年在日立中央研究所先后任研究员和主任研究员。2005年1月回国,入选中国科学院“百人计划”(引进海外杰出人才计划)。现任中国科学院自动化研究所研究员、副所长,模式识别国家重点实验室主任,中国科学院大学人工智能学院副院长。研究方向为模式识别、图像处理、机器学习、文字识别与文档分析等。在国内外期刊和学术会议上发表论文300余篇,其中包括国际期刊(IEEE Trans. on PAMI, Pattern Recognition等)第一作者论文20篇。合著文字识别方面的英文专著一本。获得授权发明专利5项。由于其在手写文字识别研究方面的突出成就,2005年在国际模式识别协会主办的国际文档分析与识别会议上获得IAPR/ICDAR Young Investigator Award (青年学者奖)。2008年获得国家杰出青年科学基金。现任国际期刊Pattern Recognition的副主编, Image and Vision Computing, International Journal on Document Analysis and Recognition和Cognitive Computation的编委,国内期刊《自动化学报》副主编。中国人工智能学会会士、模式识别专委会主任,中国自动化学会理事、模式识别与机器智能专委会主任,中国图象图形学学会常务理事,美国电气电子工程师协会会士 (IEEE Fellow)、国际模式识别学会会士(IAPR Fellow)。

个人主页:

http://www.nlpr.ia.ac.cn/liucl

报告摘要: 自上世纪50年代以来,文字识别(广义地,称为文档分析)的研究和应用取得了巨大的进展。50-70年代以统计模式识别和特征匹配方法为主;80-90年代提出了很多结构分析方法,并且字符切分、字符串识别和版面分析受到重视;2000年以来继续在文档分析与识别的各个方面持续提高;2013年开始深度学习(深度神经网络)逐渐成为主导性的方法,使文字检测和识别的性能得到明显提升。随着识别精度不断提升和应用的展开,文字识别的可靠性、泛化性、可解释性要求开始凸显,在这些方面传统的模式识别和文字识别方法表现出一定的优势或互补性,与深度学习方法结合可开辟新的研究途径。本报告对文字识别领域历史上主要方法进行回顾,对当前主要方法的特点和一些最新研究动态进行分析,并对将来的研究提出一些建议。

参考文献:

[1] G. Nagy, G.L. Shelton, Self-corrective character recognition systems, IEEE Trans. Information Theory, 12(2): 215-222, 1966.

[2] H. Fujisawa, Forty years of research in character and document recognition—an industrial perspective, Pattern Recognition, 41(8): 2453-2446, 2008.

[3] Cheng-Lin Liu, In-Jung Kim, Jin H. Kim, Model-based stroke extraction and matching for handwritten Chinese character recognition, Pattern Recognition, 34(12): 2339-2352, 2001.

[4] Xu-Yao Zhang, Yoshua Bengio, Cheng-Lin Liu, New benchmark for online and offline handwritten Chinese character recognition with deep convolutional network and adaptation, Pattern Recognition, 61: 348-360, 2017.

[5] Yi-Chao Wu, Fei Yin, Cheng-Lin Liu, Improving handwritten Chinese text recognition using neural network language models and convolutional neural network shape models, Pattern Recognition, 65: 251-264, 2017.

[6] Fei Yin, Yi-Chao Wu, Xu-Yao Zhang, Cheng-Lin Liu, Scene Text Recognition with Sliding Convolutional Character Models, arXiv:1709.01727, 2017.

成为VIP会员查看完整内容
文档分析与识别技术回顾与反思.pdf
37

相关内容

机器学习的一个分支,它基于试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
最新《自然场景中文本检测与识别》综述论文,26页pdf
专知会员服务
69+阅读 · 2020年6月10日
专知会员服务
36+阅读 · 2019年12月13日
【CAAI 2019】自然语言与理解,苏州大学| 周国栋教授
专知会员服务
62+阅读 · 2019年12月1日
VALSE Webinar 19-24期 去雨去雾专题
VALSE
23+阅读 · 2019年9月12日
VALSE Webinar 19-16期 云深可知处:视觉SLAM
VALSE
12+阅读 · 2019年7月4日
【紫冬快讯】自动化所雷震获国际生物特征识别青年学者奖
中国科学院自动化研究所
7+阅读 · 2019年6月7日
CNCC技术论坛 | 计算机视觉行业的挑战与契机
中国计算机学会
6+阅读 · 2018年10月21日
【报告分享】刘成林:文档分析及模式识别系统学习领域研究进展与热点
OCR技术浅析
机器学习研究会
40+阅读 · 2017年12月8日
会议征文|第一届中国模式识别与计算机视觉学术会议
中国人工智能学会
5+阅读 · 2017年12月6日
【回顾】基于深度学习的中文唇语识别
AI研习社
7+阅读 · 2017年10月20日
Arxiv
20+阅读 · 2020年6月8日
Arxiv
7+阅读 · 2019年5月31日
Arxiv
12+阅读 · 2018年9月5日
CoQA: A Conversational Question Answering Challenge
Arxiv
7+阅读 · 2018年8月21日
Arxiv
3+阅读 · 2017年11月12日
VIP会员
相关VIP内容
最新《自然场景中文本检测与识别》综述论文,26页pdf
专知会员服务
69+阅读 · 2020年6月10日
专知会员服务
36+阅读 · 2019年12月13日
【CAAI 2019】自然语言与理解,苏州大学| 周国栋教授
专知会员服务
62+阅读 · 2019年12月1日
相关资讯
VALSE Webinar 19-24期 去雨去雾专题
VALSE
23+阅读 · 2019年9月12日
VALSE Webinar 19-16期 云深可知处:视觉SLAM
VALSE
12+阅读 · 2019年7月4日
【紫冬快讯】自动化所雷震获国际生物特征识别青年学者奖
中国科学院自动化研究所
7+阅读 · 2019年6月7日
CNCC技术论坛 | 计算机视觉行业的挑战与契机
中国计算机学会
6+阅读 · 2018年10月21日
【报告分享】刘成林:文档分析及模式识别系统学习领域研究进展与热点
OCR技术浅析
机器学习研究会
40+阅读 · 2017年12月8日
会议征文|第一届中国模式识别与计算机视觉学术会议
中国人工智能学会
5+阅读 · 2017年12月6日
【回顾】基于深度学习的中文唇语识别
AI研习社
7+阅读 · 2017年10月20日
微信扫码咨询专知VIP会员