项目名称: 基于国际编码标准的藏文词语排序算法研究
项目编号: No.61163013
项目类型: 地区科学基金项目
立项/批准年度: 2012
项目学科: 自动化技术、计算机技术
项目作者: 边巴旺堆
作者单位: 西藏大学
项目金额: 30万元
中文摘要: 基于ISO/IEC10646藏文编码字符集,还是基于国家编码标准扩充集A、B,其排序规则不同于英文和汉文,它不仅在横向具有线性结构,而且在纵向具有叠加结构,它的排序规则不是简单的从构词的第一个元素开始的,而是根据基字开始,并且其它构词元素的优先级也不尽相同,因此藏文的排序规则相当复杂。本项目主要通过研究现代藏文、梵音转写藏文词语的字典序规则,设计出适合藏文字典序的排序算法。首先,判断该词语是由国家编码构成,还是国际编码构成,若国家编码,则将其转换成国际编码标准。其次,判断现代藏文和梵音转写藏文,针对不同的对象,研究不同的排序规则。再次,从单音节中找到基字、前加字、上加字、下加字、元音、后加字及再后加字等藏文特有的构词构件元素。最后,通过藏文结构优先级、构件优先级和字符优先级三种优先级算法对藏文词语的排序规则进行算法设计,且将这些算法集成后形成藏文字典序的整体算法。
中文关键词: 藏文排序;构件元素;优先级;规则函数;基字
英文摘要:
英文关键词: Tibetan sorting;Building elements;Priority levels;Rule function;the basic word