文档分析与识别技术回顾与反思，中国科学院自动化研究所刘成林研究员，VALSE2019: 让机器像人一样阅读：文字检测与识别新趋势

报告嘉宾：刘成林（中国科学院自动化研究所）报告时间：2019年10月16日（星期三）晚上20:30（北京时间）报告题目：文档分析与识别技术回顾与反思

报告人简介：刘成林，1989年本科毕业于武汉大学，1992年获北京工业大学工学硕士学位，1995年获中国科学院自动化研究所工学博士学位。1996年至1999年先后在韩国科学技术院（KAIST）和日本东京农工大学从事博士后研究工作。1999年至2004年在日立中央研究所先后任研究员和主任研究员。2005年1月回国，入选中国科学院“百人计划”（引进海外杰出人才计划）。现任中国科学院自动化研究所研究员、副所长，模式识别国家重点实验室主任，中国科学院大学人工智能学院副院长。研究方向为模式识别、图像处理、机器学习、文字识别与文档分析等。在国内外期刊和学术会议上发表论文300余篇，其中包括国际期刊（IEEE Trans. on PAMI, Pattern Recognition等）第一作者论文20篇。合著文字识别方面的英文专著一本。获得授权发明专利5项。由于其在手写文字识别研究方面的突出成就，2005年在国际模式识别协会主办的国际文档分析与识别会议上获得IAPR/ICDAR Young Investigator Award （青年学者奖）。2008年获得国家杰出青年科学基金。现任国际期刊Pattern Recognition的副主编, Image and Vision Computing, International Journal on Document Analysis and Recognition和Cognitive Computation的编委，国内期刊《自动化学报》副主编。中国人工智能学会会士、模式识别专委会主任，中国自动化学会理事、模式识别与机器智能专委会主任，中国图象图形学学会常务理事，美国电气电子工程师协会会士 (IEEE Fellow)、国际模式识别学会会士(IAPR Fellow)。

个人主页：

http://www.nlpr.ia.ac.cn/liucl

报告摘要：自上世纪50年代以来，文字识别（广义地，称为文档分析）的研究和应用取得了巨大的进展。50-70年代以统计模式识别和特征匹配方法为主；80-90年代提出了很多结构分析方法，并且字符切分、字符串识别和版面分析受到重视；2000年以来继续在文档分析与识别的各个方面持续提高；2013年开始深度学习（深度神经网络）逐渐成为主导性的方法，使文字检测和识别的性能得到明显提升。随着识别精度不断提升和应用的展开，文字识别的可靠性、泛化性、可解释性要求开始凸显，在这些方面传统的模式识别和文字识别方法表现出一定的优势或互补性，与深度学习方法结合可开辟新的研究途径。本报告对文字识别领域历史上主要方法进行回顾，对当前主要方法的特点和一些最新研究动态进行分析，并对将来的研究提出一些建议。

参考文献：

[1] G. Nagy, G.L. Shelton, Self-corrective character recognition systems, IEEE Trans. Information Theory, 12(2): 215-222, 1966.

[2] H. Fujisawa, Forty years of research in character and document recognition—an industrial perspective, Pattern Recognition, 41(8): 2453-2446, 2008.

[3] Cheng-Lin Liu, In-Jung Kim, Jin H. Kim, Model-based stroke extraction and matching for handwritten Chinese character recognition, Pattern Recognition, 34(12): 2339-2352, 2001.

[4] Xu-Yao Zhang, Yoshua Bengio, Cheng-Lin Liu, New benchmark for online and offline handwritten Chinese character recognition with deep convolutional network and adaptation, Pattern Recognition, 61: 348-360, 2017.

[5] Yi-Chao Wu, Fei Yin, Cheng-Lin Liu, Improving handwritten Chinese text recognition using neural network language models and convolutional neural network shape models, Pattern Recognition, 65: 251-264, 2017.

[6] Fei Yin, Yi-Chao Wu, Xu-Yao Zhang, Cheng-Lin Liu, Scene Text Recognition with Sliding Convolutional Character Models, arXiv:1709.01727, 2017.

成为VIP会员查看完整内容