项目名称: 木刻藏文经书识别系统中特征提取算法的研究
项目编号: No.60863013
项目类型: 地区科学基金项目
立项/批准年度: 2009
项目学科: 金属学与金属工艺
项目作者: 欧珠
作者单位: 西藏大学
项目金额: 27万元
中文摘要: 藏文字是不同于中日韩东方方块文字的非方块文字,其结构特殊,在外形和结构上的变化也都十分巨大,加上相似字很多,因此藏文文字的识别带来相当的困难。藏文字符不等高、不等宽、相似形字符多的难题特殊性,藏文识别研究和OCR系统开发,只能部分借鉴汉文和英文识别中一些成熟的适合于藏文识别的方法和技术,更多的是要根据藏文字、藏文句子、藏文版面自身的特殊性进行全面深入的研究。 藏文资料中,特别是经书,涉及到的文字数量繁多,每个文字间的高度宽度都不相同,且文字间相互粘连,加之大量书籍的印版都由人工木刻,导致资料显示的文字全部为手写体的藏文和梵音转写藏文(简称梵文),给计算机自动识别带来极大的难度。这样就需要一套符合手写体藏文和梵文的特征提取方法,来量化并提取手写体文字图像中的各种特定信息,为模式识别提供重要的数据支持,推动手写体藏文识别系统的开发。
中文关键词: 藏文;木刻;OCR;切分;特征提取
英文摘要:
英文关键词: