项目名称: 混合策略的机器翻译方法研究
项目编号: No.61172101
项目类型: 面上项目
立项/批准年度: 2012
项目学科: 无线电电子学、电信技术
项目作者: 宋金平
作者单位: 中国电子信息产业发展研究院
项目金额: 57万元
中文摘要: 2009年国际评测表明,数据驱动和知识驱动机器翻译的译文质量不相上下,仅采用单一的方法很难满足用户的需要,对统计和规则机器翻译的译文错误分析表明,不同机器翻译系统所出现的错误类型是互补的,将不同方法进行混合成了提高机器翻译质量的合理途径。本项目将研究一种将统计与传统基于实例、模板和规则的多引擎方法进行深层结合的混合策略的机器翻译方法,首先利用传统多引擎对输入句子进行剖析并生成句法树,然后采用自顶向下的策略遍历该句法树,对句法树中的单个节点和部分跨句法的连续节点,取其叶节点的原文与统计机器翻译所训练出的短语翻译概率表进行智能匹配,利用短语翻译表的译文来达到提高输出译文流利度和准确度的目的。本项目提出的方法既利用了统计翻译引擎所提供的细粒度知识,又利用了句法树在解决句子的深层和长距离相关性问题方面的优势,因此能显著提高机器翻译的译文质量。本课题的研究成果将有力推动混合引擎机器翻译技术的发展。
中文关键词: 统计机器翻译;混合策略;传统多引擎机器翻译;;
英文摘要:
英文关键词: statistical machine translation;hybrid machine translation;traditional multi-engine machine translation;;