项目名称: 中文手写文档识别中高阶上下文建模方法研究

项目编号: No.61305005

项目类型: 青年科学基金项目

立项/批准年度: 2014

项目学科: 自动化技术、计算机技术

项目作者: 王秋锋

作者单位: 中国科学院自动化研究所

项目金额: 25万元

中文摘要: 自由书写的文档识别(字符串识别)是文字识别领域中的一个重要分支,目前还有很多问题亟待解决,以满足脱机文档电子化的需要。目前中文手写文档识别性能还很低下,其中一个很大原因是上下文信息利用不足,特别是高阶上下文的建模。本项目拟对文档识别中的高阶上下文信息建模进行深入研究,以达到提高识别性能、推动实际应用的目的。主要研究内容包含:(1)高阶语言上下文建模方法的研究,包括统计和结构语言模型的研究与应用;(2)高阶几何上下文建模方法的研究,包括几何特征提取和统计模型表示与学习;(3)融合高阶上下文模型的手写文档识别中高效搜索算法研究。我们将在已有的技术基础和数据基础上,通过结合统计模型和句法结构分析技术,采用快速准确的搜索算法,在大规模的自由书写中文文档识别中检验识别性能。本项目提出的高阶上下文建模和搜索方法与书写语言关系不大,因而可以推广到其他语言的文档识别中,比如英文、阿拉伯文等。

中文关键词: 手写字符串识别;语言模型;神经网络语言模型;语言模型自适应;几何模型

英文摘要: Unconstrained handwritten document recognition (string recognition) is an important branch of character recognition field, and faces great challenges due to its limited performance for the application of document digitalization. Unlike isolated character recognition, context information is very important for string recognition, however, most systems do not consider context modeling sufficiently, especially high-order context. This project studies context modeling techniques in document recognition to improve recognition performance, which include three main issues: (1) Modeling high-order linguistic context, including statistical and structured language models; (2) Modeling high-order geometric context, including geometric features extraction and statistical modeling; (3) Developing an efficient search algorithm for a huge and ever-expanding search space due to incorporating high-order context information. Based on the developed string recognition techniques and handwriting databases, we will test the proposed methods on a larg-scale of Chiniese handwritten documents via combining statistical and structured models with an efficient search algorithm. Moreover, the context modeling and serach method can also apply to the recognition of the documents of other languages (such as English and Arabic).

英文关键词: Handwritten text recognition;language model;neural network language model;language model adaptation;geometric model

成为VIP会员查看完整内容
0

相关内容

多语言语音识别声学模型建模方法最新进展
专知会员服务
31+阅读 · 2022年2月7日
专知会员服务
55+阅读 · 2021年10月12日
专知会员服务
79+阅读 · 2021年8月20日
专知会员服务
54+阅读 · 2020年12月20日
专知会员服务
27+阅读 · 2020年10月9日
专知会员服务
29+阅读 · 2020年9月13日
【ACL2020】基于图神经网络的文本分类新方法
专知会员服务
68+阅读 · 2020年7月12日
【课程】浙大陈华钧教授《知识图谱导论》课程系列PPT
专知会员服务
163+阅读 · 2019年10月29日
微软亚洲研究院提出多语言通用文档理解预训练模型LayoutXLM
微软研究院AI头条
2+阅读 · 2021年6月1日
自然语言处理中的语言模型预训练方法
PaperWeekly
14+阅读 · 2018年10月21日
【知识图谱】中文知识图谱构建方法研究
产业智能官
98+阅读 · 2017年10月26日
从点到线:逻辑回归到条件随机场
夕小瑶的卖萌屋
15+阅读 · 2017年7月22日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
64+阅读 · 2022年4月13日
Arxiv
108+阅读 · 2020年2月5日
小贴士
相关VIP内容
多语言语音识别声学模型建模方法最新进展
专知会员服务
31+阅读 · 2022年2月7日
专知会员服务
55+阅读 · 2021年10月12日
专知会员服务
79+阅读 · 2021年8月20日
专知会员服务
54+阅读 · 2020年12月20日
专知会员服务
27+阅读 · 2020年10月9日
专知会员服务
29+阅读 · 2020年9月13日
【ACL2020】基于图神经网络的文本分类新方法
专知会员服务
68+阅读 · 2020年7月12日
【课程】浙大陈华钧教授《知识图谱导论》课程系列PPT
专知会员服务
163+阅读 · 2019年10月29日
相关资讯
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员