项目名称: 跨语言信息检索中的机器翻译研究
项目编号: No.61173100
项目类型: 面上项目
立项/批准年度: 2012
项目学科: 自动化技术、计算机技术
项目作者: 黄德根
作者单位: 大连理工大学
项目金额: 55万元
中文摘要: 互联网信息在全球范围共享的主要障碍是多语言问题,跨语言信息检索(CLIR)是解决该问题的有效方法之一。但是,现有的跨语言信息检索的精确率过低,没有达到实用的水平,提高跨语言信息检索系统性能的关键是提高检索语句的翻译精度。本项目从中英文两种语言的信息检索入手,研究跨语言信息检索中机器翻译的若干关键技术。针对跨语言信息检索及机器翻译的特点,从三个方面提高机器翻译的精确率:一是考虑从单语检索结果中提取出检索语句本身的多种词法信息,为检索语句的翻译提供细粒度词法信息,从而提高检索语句的翻译精度;二是提出一种融合短语结构和句法功能的功能短语,把对翻译要素的考虑提前到句法分析阶段,提高句法结构歧义的消歧率和机器翻译的精确率;三是提出可嵌套模板函数和统计方法等多模型结合的机器翻译方法,提高含复杂结构的句子或短语的翻译精度。其中,后两种方法对一般机器翻译的研究也具有重要意义和应用价值。
中文关键词: 跨语言信息检索;机器翻译;功能短语;双语命名实体;
英文摘要:
英文关键词: Cross Language Information Retrieval;Machine Translation;Function Phrase;Bilingual Named Entity;