项目名称: 基于信息融合的维吾尔文联机手写单词识别技术研究

项目编号: No.61263038

项目类型: 地区科学基金项目

立项/批准年度: 2013

项目学科: 自动化技术、计算机技术

项目作者: 地里木拉提·吐尔逊

作者单位: 新疆大学

项目金额: 45万元

中文摘要: 维吾尔文手写单词识别中的主要难点是字母在被识别之前不能被精确地切分,仍存在着不能被直接识别的连体段。本项目结合维吾尔文单词的独特手写风格,研究有效的基于分割与识别相集成的方法:利用基于识别的切分方法将单词切分为连体段后,再将其切分成基本单元序列。将连续的基元合并成候选字符并构成切分候选网格;将几何上下文信息、字母识别信息和语言上下文信息一起加入到路径评价准则,得到最优的切分结果及对应的最优识别结果。其中,集束搜索算法和动态规划算法用于单词识别过程中的最优路径搜索。几何信息包括字母一元几何信息和字母间的二元几何信息,是根据当前单词自身的特点统计获得;识别信息由字母分类器给出,包括候选识别结果及其相应的置信度;语义信息用基于字母的语言模型进行描述。维吾尔文字作为一种在新疆少数民族地区和中亚部分地区流行的语言文字,研究其手写文字识别方法对促进少数民族地区的信息化步伐,增进国际交流都是非常有益的。

中文关键词: 联机手写字母;字母切分;文字识别;切分与识别融合策略;维吾尔文

英文摘要: The main difficulty in Uyghur handwritten word recognition is that the basic characters are not precisely segmented, and there are still lots of conjoined sections which can not be directly recognized. This project research an effective approach for online handwritten Uyghur word recognition based on the analysis of the unique shapes and writing styles of Uyghur words. Use of the integration of recognition-segmentation method, the words segment into conjoined sections, and over-segmentation is applied to further segment the conjoined sections into the basic unit of sequences, and merging them to obtain a segmentation candidate grid; the optimal segmentation and recognition result is achieved by fusion of geometric analysis, isolated character classifier and semantic information all-together. The beam search algorithms and dynamic programming algorithm is used for optimal path search in the word recognition process. The geometric information is estimated on current words to adapt to various writing styles of words, it includes unitary and binary geometric information; Recognition information is given by the character classifier with candidate results and their confidence; Semantic information is described by a character based model. The Uyghur language is widely used among the ethnic minorities in Xinjiang and t

英文关键词: Online Handwritten Characters;Characters Segmentation;Recognition;information fusion;Uyghur Scripts

成为VIP会员查看完整内容
0

相关内容

基于深度学习的图像目标检测算法综述
专知会员服务
92+阅读 · 2022年4月15日
多语言语音识别声学模型建模方法最新进展
专知会员服务
31+阅读 · 2022年2月7日
专知会员服务
57+阅读 · 2020年12月6日
基于多来源文本的中文医学知识图谱的构建
专知会员服务
52+阅读 · 2020年8月21日
基于改进卷积神经网络的短文本分类模型
专知会员服务
25+阅读 · 2020年7月22日
【ACL2020】基于图神经网络的文本分类新方法
专知会员服务
68+阅读 · 2020年7月12日
基于视觉的三维重建关键技术研究综述
专知会员服务
154+阅读 · 2020年5月1日
【天津大学】风格线条画生成技术综述
专知会员服务
31+阅读 · 2020年4月26日
一文带你了解语音信号处理技术
PaperWeekly
9+阅读 · 2022年1月26日
TrOCR:基于Transformer的新一代光学字符识别
微软研究院AI头条
0+阅读 · 2021年10月12日
技术动态 | 跨句多元关系抽取
开放知识图谱
49+阅读 · 2019年10月24日
几种句子表示方法的比较
AINLP
15+阅读 · 2019年9月21日
综述 | SLAM回环检测方法
计算机视觉life
14+阅读 · 2019年8月19日
一文读懂依存句法分析
AINLP
16+阅读 · 2019年4月28日
一种关键字提取新方法
1号机器人网
21+阅读 · 2018年11月15日
文本情感分析的预处理
Datartisan数据工匠
17+阅读 · 2018年3月8日
深度学习 | 利用词嵌入对文本进行情感分析
沈浩老师
11+阅读 · 2017年10月19日
现代情感分析方法
Python开发者
13+阅读 · 2017年7月9日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年5月1日
小贴士
相关VIP内容
基于深度学习的图像目标检测算法综述
专知会员服务
92+阅读 · 2022年4月15日
多语言语音识别声学模型建模方法最新进展
专知会员服务
31+阅读 · 2022年2月7日
专知会员服务
57+阅读 · 2020年12月6日
基于多来源文本的中文医学知识图谱的构建
专知会员服务
52+阅读 · 2020年8月21日
基于改进卷积神经网络的短文本分类模型
专知会员服务
25+阅读 · 2020年7月22日
【ACL2020】基于图神经网络的文本分类新方法
专知会员服务
68+阅读 · 2020年7月12日
基于视觉的三维重建关键技术研究综述
专知会员服务
154+阅读 · 2020年5月1日
【天津大学】风格线条画生成技术综述
专知会员服务
31+阅读 · 2020年4月26日
相关资讯
一文带你了解语音信号处理技术
PaperWeekly
9+阅读 · 2022年1月26日
TrOCR:基于Transformer的新一代光学字符识别
微软研究院AI头条
0+阅读 · 2021年10月12日
技术动态 | 跨句多元关系抽取
开放知识图谱
49+阅读 · 2019年10月24日
几种句子表示方法的比较
AINLP
15+阅读 · 2019年9月21日
综述 | SLAM回环检测方法
计算机视觉life
14+阅读 · 2019年8月19日
一文读懂依存句法分析
AINLP
16+阅读 · 2019年4月28日
一种关键字提取新方法
1号机器人网
21+阅读 · 2018年11月15日
文本情感分析的预处理
Datartisan数据工匠
17+阅读 · 2018年3月8日
深度学习 | 利用词嵌入对文本进行情感分析
沈浩老师
11+阅读 · 2017年10月19日
现代情感分析方法
Python开发者
13+阅读 · 2017年7月9日
相关基金
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员