项目名称: 基于句子语义结构的统计机器翻译研究
项目编号: No.61401295
项目类型: 青年科学基金项目
立项/批准年度: 2014
项目学科: 无线电电子学、电信技术
项目作者: 李军辉
作者单位: 苏州大学
项目金额: 25万元
中文摘要: 基于语义的统计机器翻译(SMT)一直是研究者追求的目标。目前,主流SMT模型(例如短语模型、层次短语模型和树模型)在翻译过程中很少利用句子的语义信息。本项目将在前期研究的基础上,重点研究基于句子语义结构的SMT技术亟需解决的两个核心问题:一是分析现在SMT系统在句子的翻译过程中发生了哪些语义信息的缺失;二是研究如何在SMT系统中有效控制这种缺失。主要研究内容包括:1)充分发掘能够提高SMT质量的语义结构信息,设计合理有效的句子级语义控制框架;2)设计合理的句子级语义结构表示,并探索语义结构的映射,即给定源端语言的语义结构,将其转换映射为目标语言的语义结构;3)探索基于语义结构的句子翻译,即给定了句子源端语义结构及其目标端的映射,如何综合这些信息到SMT中,也就是说如何用源端和目标端的语义结构来指导现有的SMT技术。
中文关键词: 统计机器翻译;语义分析;语言生成;神经机器翻译;句法
英文摘要: While it has been claimed since the inception of machine translation, semantic models are the goals for statistical machine translation (SMT) to achieve human-like translation, most popular translation models (e.g., phrase-based, hierarchical phrase-based
英文关键词: statistical machine translation;semantic parsing;language generation;neural machine translation;syntax