项目名称: 基于中心扩展对齐的汉-英统计机器翻译研究
项目编号: No.60903082
项目类型: 青年科学基金项目
立项/批准年度: 2010
项目学科: 无线电电子学、电信技术
项目作者: 张春祥
作者单位: 哈尔滨理工大学
项目金额: 18万元
中文摘要: 本课题研究统计机器翻译的知识获取与解码技术。提出了中心扩展的短语对齐方法,摆脱了汉、英之间语法异构性的制约。同时考虑源语言满足句法约束和不满足句法约束的短语翻译对,以覆盖更多的语言现象。提高词汇覆盖度,细化语义分类体系,利用语义知识、句法和统计信息来增加译文中心的识别率。深度挖掘汉、英语言学之间的对等关系,使用句法、词性、词形、语义和长度等属性来定义双语评价特征,揭示评价特征与短语翻译对自身特性之间的关系。在输入句子的句法树上,以调序概率和插入概率为基础来构建译文调序模型,使调序过程可以充分地利用句法边界信息。结合双语评价特征,使用最大熵算法来选择译文路径,以综合考虑多种上下文相关信息。力求降低搜索解码空间,提高机器译文输出质量,为基于句法的统计机器翻译提供一个新的解决思路。
中文关键词: 机器翻译;短语对齐;双语评价特征;主动获取;译文调序
英文摘要:
英文关键词: Machine translation;Phrase alignment;Bilingual evaluation features;Active acquisition;Reordering translations