项目名称: 藏文字符排序研究

项目编号: No.60963016

项目类型: 地区科学基金项目

立项/批准年度: 2010

项目学科: 金属学与金属工艺

项目作者: 黄鹤鸣

作者单位: 青海师范大学

项目金额: 22万元

中文摘要: 藏文字符排序是藏文语料库建设、信息检索、机器翻译以及拼写检查等领域的基础,虽然已有一些科研机构做了一些前期研究,但问题远没有彻底解决。导致藏文排序比较困难的原因有:1.排序码的国际标准DUCET中,部分藏文字母的排序码不符合排序要求;2.不同类型的藏文字符串有不同的排序规则,因此,排序前需要判断待排序字符串的类型;3.现代藏文音节、梵音藏文组合字符是藏文字母的二维组合,排序时需要将它们展成一维的字符串,而复杂多变的二维结构使得这种"降维"过程很繁琐。本项目致力于彻底解决藏文字符的字典排序问题。为此,首先修订DUCET中部分藏文字符的排序码,使得所有藏文字符的排序码符合排序要求;其次,在此基础上设计藏文字符排序算法,该算法主要包括以下几个步骤:1.判定藏文字符串的类型;2.不同类型的字符串按照各自的规则展成一维字母串;3.通过比较一维字母串间的顺序,得到待排序字符串间的顺序。

中文关键词: 藏文;字符;排序;Unicode;ISO 10646

英文摘要:

英文关键词: Tibetan;character;collation;Unicode;ISO 10646

成为VIP会员查看完整内容
0

相关内容

排序是计算机内经常进行的一种操作,其目的是将一组“无序”的记录序列调整为“有序”的记录序列。分内部排序和外部排序。若整个排序过程不需要访问外存便能完成,则称此类排序问题为内部排序。反之,若参加排序的记录数量很大,整个序列的排序过程不可能在内存中完成,则称此类排序问题为外部排序。内部排序的过程是一个逐步扩大记录的有序序列长度的过程。
专知会员服务
13+阅读 · 2021年8月28日
专知会员服务
69+阅读 · 2021年5月21日
专知会员服务
90+阅读 · 2021年4月18日
专知会员服务
57+阅读 · 2020年12月6日
专知会员服务
37+阅读 · 2020年11月24日
【CIKM2020】利用自注意力网络使搜索结果多样化
专知会员服务
12+阅读 · 2020年11月6日
最新【图神经网络计算】2020综述论文,23页PDF
专知会员服务
192+阅读 · 2020年10月3日
专知会员服务
132+阅读 · 2020年8月24日
最新《图神经网络知识图谱补全》综述论文
专知会员服务
153+阅读 · 2020年7月29日
基于知识图谱的行业问答系统搭建分几步?
PaperWeekly
2+阅读 · 2021年11月11日
CIKM 2021 | 基于池化结构搜索的图分类
PaperWeekly
0+阅读 · 2021年11月8日
基于机器阅读理解(MRC)的信息抽取方法
DataFunTalk
13+阅读 · 2019年11月1日
【论文笔记】基于强化学习的句子摘要排序
赛尔笔记 | 一文读懂图神经网络
哈工大SCIR
81+阅读 · 2019年7月12日
论文浅尝 | 基于属性嵌入的知识图谱间实体对齐方法
开放知识图谱
30+阅读 · 2019年3月26日
论文浅尝 | 知识图谱相关实体搜索
开放知识图谱
14+阅读 · 2018年12月18日
深度文本匹配在智能客服中的应用
AI100
18+阅读 · 2018年10月24日
论文动态 | 基于知识图谱的问答系统关键技术研究 #02
开放知识图谱
10+阅读 · 2017年8月6日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
Finite Entailment of UCRPQs over ALC Ontologies
Arxiv
0+阅读 · 2022年4月29日
Arxiv
15+阅读 · 2021年12月22日
Arxiv
56+阅读 · 2021年5月3日
A Survey on Deep Learning for Named Entity Recognition
Arxiv
25+阅读 · 2020年3月13日
Arxiv
99+阅读 · 2020年3月4日
小贴士
相关主题
相关VIP内容
专知会员服务
13+阅读 · 2021年8月28日
专知会员服务
69+阅读 · 2021年5月21日
专知会员服务
90+阅读 · 2021年4月18日
专知会员服务
57+阅读 · 2020年12月6日
专知会员服务
37+阅读 · 2020年11月24日
【CIKM2020】利用自注意力网络使搜索结果多样化
专知会员服务
12+阅读 · 2020年11月6日
最新【图神经网络计算】2020综述论文,23页PDF
专知会员服务
192+阅读 · 2020年10月3日
专知会员服务
132+阅读 · 2020年8月24日
最新《图神经网络知识图谱补全》综述论文
专知会员服务
153+阅读 · 2020年7月29日
相关资讯
基于知识图谱的行业问答系统搭建分几步?
PaperWeekly
2+阅读 · 2021年11月11日
CIKM 2021 | 基于池化结构搜索的图分类
PaperWeekly
0+阅读 · 2021年11月8日
基于机器阅读理解(MRC)的信息抽取方法
DataFunTalk
13+阅读 · 2019年11月1日
【论文笔记】基于强化学习的句子摘要排序
赛尔笔记 | 一文读懂图神经网络
哈工大SCIR
81+阅读 · 2019年7月12日
论文浅尝 | 基于属性嵌入的知识图谱间实体对齐方法
开放知识图谱
30+阅读 · 2019年3月26日
论文浅尝 | 知识图谱相关实体搜索
开放知识图谱
14+阅读 · 2018年12月18日
深度文本匹配在智能客服中的应用
AI100
18+阅读 · 2018年10月24日
论文动态 | 基于知识图谱的问答系统关键技术研究 #02
开放知识图谱
10+阅读 · 2017年8月6日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
相关论文
Finite Entailment of UCRPQs over ALC Ontologies
Arxiv
0+阅读 · 2022年4月29日
Arxiv
15+阅读 · 2021年12月22日
Arxiv
56+阅读 · 2021年5月3日
A Survey on Deep Learning for Named Entity Recognition
Arxiv
25+阅读 · 2020年3月13日
Arxiv
99+阅读 · 2020年3月4日
微信扫码咨询专知VIP会员