项目名称: 基于本体的多策略民汉机器翻译研究
项目编号: No.61132009
项目类型: 重点项目
立项/批准年度: 2012
项目学科: 无线电电子学、电信技术
项目作者: 黄河燕
作者单位: 北京理工大学
项目金额: 280万元
中文摘要: 机器翻译是国际上激烈竞争的多学科交叉高难研究课题,具重大的理论研究意义和应用前景。而民汉机器翻译研究对于促进我国民族团结以及民族地区的经济社会发展更具有紧迫的现实意义与深远的历史意义。本项目针对民族语言资源相对匮乏,统计为主的方法难以奏效的不足,提出一种以语言模型为主的基于语义本体的有机结合了基于规则的多知识一体化分析、基于统计的最小递归语义组块识别及获取、基于实例模式的泛化匹配、及基于可信度反馈的统计译后校正等多种处理策略的民(维/藏)汉机器翻译方法,深入研究其中所涉及的基于本体的语言特征体系设计及语言知识本体构建、基于语言知识本体的语义计算框架及多知识一体化语言分析算法、基于最小递归语义的语言组块识别及其双语对齐算法、基于语义本体的多策略民汉机器翻译模型研究等关键科学技术问题。该项研究不仅能满足对民汉翻译技术的迫切需求,也能对机器翻译及其它自然语言处理研究提供经验和宝贵的语言资源。
中文关键词: 民汉机器翻译;多策略翻译模型;语义本体;多语组块识别;词义消歧
英文摘要:
英文关键词: MT between Minority Languages and Chinese;Multi-strategy Translation Model;Semantic Ontology;Multilingual Chunk Recognitaion;Word Sense Disambiguation