项目名称: 纳西-汉语双语语料库构建与翻译方法研究
项目编号: No.61163022
项目类型: 地区科学基金项目
立项/批准年度: 2012
项目学科: 自动化技术、计算机技术
项目作者: 余正涛
作者单位: 昆明理工大学
项目金额: 49万元
中文摘要: 纳西文字是目前世界上"唯一活着的象形文字",但在现代文明的渗透下,正在变异和消亡。纳西-汉语双语语料资源构建及纳西语言分析方法是纳西语言信息处理的基础课题。本课题针对纳西语言特点,首先将研究面向纳西-汉语对齐文本的双语词语抽取方法,构建纳西-汉语双语电子词典,其次将研究纳西树库标记及依存关系识别方法,构建纳西依存树库,实现纳西依存句法分析系统,然后将研究纳西-汉语语料选取、标注规范、双语自动词语对齐方法,构建纳西-汉语双语词语级对齐语料库,最后将研究面向依存句法分析的树到串的纳西-汉语统计翻译方法,实现纳西-汉语双语句子互译原型系统,解决纳西-汉语双语知识资源建设、依存句法分析及机器翻译过程中的难点问题。项目研究成果将为机器理解纳西语言提供语言及语料资源,同时提出的纳西-汉语双语机器翻译方法将推动纳西语与汉语的互译互通,为保护、普及及传承纳西语言奠定基础。
中文关键词: 纳西语-汉语;三语电子词典;纳西依存句法分析;双语语料库;双语统计机器翻译
英文摘要:
英文关键词: Naxi-Chinese;Trilingual Electronic Dictionary;Naxi Dependency Syntax Parser;Bilingual Corpora;Bilingual Statistics Machine Translation