项目名称: 现代藏文自动校对研究

项目编号: No.61202189

项目类型: 青年科学基金项目

立项/批准年度: 2013

项目学科: 计算机科学学科

项目作者: 关白

作者单位: 西藏大学

项目金额: 25万元

中文摘要: 现代藏文自动校对技术研究是藏文信息处理技术中一项具有广阔前景和极具挑战性的研究课题。随着藏文信息处理技术的发展促使现代藏文出版业电子化,藏文网页、藏文电子书、电子报纸、电子邮件及其办公文件等不断涌现,电子文本呈海量增长。使得在使用这些电子文本时,其中的校对环节的工作量大大增加,人工校对的方式已经无法适应电子文本校对,有了自动校对系统就可以通过快捷、简便、准确的对现代藏文文本进行字、词和句法的自动校对,将改变原始、落后、繁重、劳苦的人力校对方式。本项目在借鉴现有中文和英文文本校对技术的基础上,对现代藏文文本自动校对领域中的音节字、词和格助词进行深入研究和分析。充分利用传统藏语语法的理论成果,研究现代藏文文本中音节字、词和格助词的构成方式和搭配规则,结合文本校对的方法和理论分析音节字、词和格助词的错误类型,针对性的提出用于校对现代藏文文本的侦错与纠错方法及算法。

中文关键词: 现代藏文;音节字;格助词;侦错;纠错

英文摘要: Research of Modern Tibetan automatic proofreading technology is a research topic with broad prospects and challenges in Tibetan information processing technology. The development of the Tibetan information processing technology prompted modern Tibetan publishing industry electronic. Tibetan website, Tibetan e-books, e-newspapers, e-mail and office documents, etc are emerging. Electronic text is growing massively ,which greatly increases proofreading. Manual proofreading has been unable to adapt to the electronic text proofreading. With auto-check system, proofreading to modern Tibetan words, phrases and syntax can be fast, easy and accurate. Based on the present Chinese and English proofreading technology, this project will study on syllable words, phrases, and grid particle in Tibetan text automatic proofreading. This project will make full use of the theoretical findings of the traditional Tibetan grammar and study on the formation and matching rules of syllable words, phrases, and grid particle in modern Tibetan text. Combined with text proofreading methods and the analysis of wrong types of syllable words, phrases, and grid particle, it will propose some debug and error correction methods and algorithm on proofreading modern Tibetan text.

英文关键词: Modern Tibetan;syllable words;grid particle;debugging;error correction

成为VIP会员查看完整内容
0

相关内容

【实用书】Python数据分析手册,437页pdf带你实战数据清洗
专知会员服务
127+阅读 · 2021年6月18日
专知会员服务
124+阅读 · 2021年6月12日
专知会员服务
77+阅读 · 2021年5月30日
专知会员服务
36+阅读 · 2021年2月22日
自动文本摘要研究综述
专知会员服务
67+阅读 · 2021年1月31日
【机器学习术语宝典】机器学习中英文术语表
专知会员服务
60+阅读 · 2020年7月12日
Python导论,476页pdf,现代Python计算
专知会员服务
260+阅读 · 2020年5月17日
论文浅尝 | KnowEdu: 一个自动构建教育知识图谱的系统
开放知识图谱
2+阅读 · 2021年9月3日
一文带你读懂自然语言处理 - 事件提取
AI研习社
10+阅读 · 2019年5月10日
已删除
德先生
53+阅读 · 2019年4月28日
学会原创 | 自然语言的语义表示学习方法与应用
中国人工智能学会
11+阅读 · 2019年3月7日
资源 | 《自然语言处理综论》中文版 PDF 高清版
AI科技评论
104+阅读 · 2019年2月23日
手把手 | 基于TextRank算法的文本摘要(附Python代码)
大数据文摘
11+阅读 · 2018年12月27日
独家 | 基于TextRank算法的文本摘要(附Python代码)
数据派THU
14+阅读 · 2018年12月21日
自动文本摘要
AI研习社
21+阅读 · 2018年10月27日
机器学习自动文本分类
AI前线
23+阅读 · 2018年2月4日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年4月15日
Arxiv
0+阅读 · 2022年4月15日
小贴士
相关VIP内容
【实用书】Python数据分析手册,437页pdf带你实战数据清洗
专知会员服务
127+阅读 · 2021年6月18日
专知会员服务
124+阅读 · 2021年6月12日
专知会员服务
77+阅读 · 2021年5月30日
专知会员服务
36+阅读 · 2021年2月22日
自动文本摘要研究综述
专知会员服务
67+阅读 · 2021年1月31日
【机器学习术语宝典】机器学习中英文术语表
专知会员服务
60+阅读 · 2020年7月12日
Python导论,476页pdf,现代Python计算
专知会员服务
260+阅读 · 2020年5月17日
相关资讯
论文浅尝 | KnowEdu: 一个自动构建教育知识图谱的系统
开放知识图谱
2+阅读 · 2021年9月3日
一文带你读懂自然语言处理 - 事件提取
AI研习社
10+阅读 · 2019年5月10日
已删除
德先生
53+阅读 · 2019年4月28日
学会原创 | 自然语言的语义表示学习方法与应用
中国人工智能学会
11+阅读 · 2019年3月7日
资源 | 《自然语言处理综论》中文版 PDF 高清版
AI科技评论
104+阅读 · 2019年2月23日
手把手 | 基于TextRank算法的文本摘要(附Python代码)
大数据文摘
11+阅读 · 2018年12月27日
独家 | 基于TextRank算法的文本摘要(附Python代码)
数据派THU
14+阅读 · 2018年12月21日
自动文本摘要
AI研习社
21+阅读 · 2018年10月27日
机器学习自动文本分类
AI前线
23+阅读 · 2018年2月4日
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员