项目名称: 脱机手写藏文字符识别研究

项目编号: No.61462072

项目类型: 地区科学基金项目

立项/批准年度: 2015

项目学科: 计算机科学学科

项目作者: 黄鹤鸣

作者单位: 青海师范大学

项目金额: 47万元

中文摘要: 脱机手写字符识别输入是机器自动识别输入的一种重要方式,能克服人工键盘输入的固有缺陷,将成为计算机输入的主流,但通过专业机构的检索发现:几乎无人从事脱机手写藏文字符识别的研究工作,因此,项目组拟对这一课题展开研究。首先,进一步完善已有的脱机手写藏文字符样本数据库;其次,在预处理阶段,提出符合藏文字符特点的字符倾斜角度归一方法和尺寸归一方法;第三,提出基于稀疏表示和核主成分分析的藏文字符特征提取方法,提高系统对藏文字符的分类性能;第四,利用级联了K-NN和稀疏表示的两阶段分类器对藏文字符进行分类,解决藏文字符类别数过多和每类样本规模过大的问题;最后,根据藏文音节中各个字符间的语法制约关系建立语言模型进行识别后处理,从而进一步提高字符识别率。本项目的研究成功将对丰富文字识别理论、推动藏语言文字信息化、促进藏族地区科技发展、培养藏文信息处理领域科研骨干具有重要意义。

中文关键词: 脱机;手写;藏文;字符;识别

英文摘要: It is a trend to put handwritten text into computer system automatically, and offline handwritten character recogniton is an important way to realize it. But, up to the present, there is little researches about off-line handwritten Tibetan character recognition both at home and abroad. Therefore, this project team devote itself to this challaging project. Firstly, the project team will further complete the sample database of off-line handwritten Tibetan characters. Secondly, in pre-processing stage, based on the characteristics of Tibetan character, the project team proposes a slant correction method and a size normalization method. Thirdly, the team proposes to extract the features of Tibetan character with such methods as sparse representation, kernel transform, and Zernike moments. Fourthly, in classification stage, the cascaded multiple classifier is used to deal with the problem of large class number of Tibetan characters. And finally, the project team use the restrains between letters of a Tibetan syllable to further improve the recognition rate of the proposed off-line handwritten Tibetan character recognition system. The study of this project will benefit the theory development of character recognition, the researchers training of this field, the informatization of Tibetan script, and the development of the science and technology of Tibetan area.

英文关键词: off-line;handwritten;Tibetan;character;recognition

成为VIP会员查看完整内容
0

相关内容

《人脸识别数据安全标准化研究报告(2021版)》发布
专知会员服务
32+阅读 · 2022年1月2日
[ICCV 2021] 联合视觉语义推理:文本识别的多级解码器
专知会员服务
18+阅读 · 2021年11月28日
专知会员服务
26+阅读 · 2021年9月4日
【中科院自动化所刘成林研究员】跨模态零样本文字识别
专知会员服务
45+阅读 · 2021年3月19日
一文读懂文本处理中的对抗训练
PaperWeekly
22+阅读 · 2019年6月5日
基于Lattice LSTM的命名实体识别
微信AI
47+阅读 · 2018年10月19日
白翔:复杂开放场景中的文本理解
深度学习大讲堂
12+阅读 · 2018年6月5日
100+中文词向量,总有一款适合你
专知
12+阅读 · 2018年5月13日
文本识别 OCR 浅析:特征篇
开源中国
16+阅读 · 2018年1月6日
OCR技术浅析
机器学习研究会
40+阅读 · 2017年12月8日
手把手教你搭建caffe及手写数字识别
七月在线实验室
12+阅读 · 2017年11月22日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
小贴士
相关主题
相关资讯
一文读懂文本处理中的对抗训练
PaperWeekly
22+阅读 · 2019年6月5日
基于Lattice LSTM的命名实体识别
微信AI
47+阅读 · 2018年10月19日
白翔:复杂开放场景中的文本理解
深度学习大讲堂
12+阅读 · 2018年6月5日
100+中文词向量,总有一款适合你
专知
12+阅读 · 2018年5月13日
文本识别 OCR 浅析:特征篇
开源中国
16+阅读 · 2018年1月6日
OCR技术浅析
机器学习研究会
40+阅读 · 2017年12月8日
手把手教你搭建caffe及手写数字识别
七月在线实验室
12+阅读 · 2017年11月22日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员