项目名称: 跨语言信息检索中的机器翻译研究

项目编号: No.61173100

项目类型: 面上项目

立项/批准年度: 2012

项目学科: 自动化技术、计算机技术

项目作者: 黄德根

作者单位: 大连理工大学

项目金额: 55万元

中文摘要: 互联网信息在全球范围共享的主要障碍是多语言问题,跨语言信息检索(CLIR)是解决该问题的有效方法之一。但是,现有的跨语言信息检索的精确率过低,没有达到实用的水平,提高跨语言信息检索系统性能的关键是提高检索语句的翻译精度。本项目从中英文两种语言的信息检索入手,研究跨语言信息检索中机器翻译的若干关键技术。针对跨语言信息检索及机器翻译的特点,从三个方面提高机器翻译的精确率:一是考虑从单语检索结果中提取出检索语句本身的多种词法信息,为检索语句的翻译提供细粒度词法信息,从而提高检索语句的翻译精度;二是提出一种融合短语结构和句法功能的功能短语,把对翻译要素的考虑提前到句法分析阶段,提高句法结构歧义的消歧率和机器翻译的精确率;三是提出可嵌套模板函数和统计方法等多模型结合的机器翻译方法,提高含复杂结构的句子或短语的翻译精度。其中,后两种方法对一般机器翻译的研究也具有重要意义和应用价值。

中文关键词: 跨语言信息检索;机器翻译;功能短语;双语命名实体;

英文摘要:

英文关键词: Cross Language Information Retrieval;Machine Translation;Function Phrase;Bilingual Named Entity;

成为VIP会员查看完整内容
2

相关内容

机器翻译,又称为自动翻译,是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。它是计算语言学的一个分支,是人工智能的终极目标之一,具有重要的科学研究价值。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
自然语言处理中的文本表示研究
专知会员服务
55+阅读 · 2022年1月10日
EMNLP 2021 | 预训练跨语言模型中的大词表构建及使用
专知会员服务
20+阅读 · 2022年1月5日
EMNLP 2021 | 学习改写非自回归机器翻译的翻译结果
专知会员服务
14+阅读 · 2021年12月25日
专知会员服务
79+阅读 · 2021年10月15日
专知会员服务
16+阅读 · 2021年8月24日
知识增强的文本生成研究进展
专知会员服务
96+阅读 · 2021年3月6日
【IJCAI2020-CMU】结构注意力的神经抽象摘要
专知会员服务
21+阅读 · 2020年4月23日
机器翻译深度学习最新综述
专知会员服务
96+阅读 · 2020年2月20日
赛尔原创@EMNLP 2021 | 多语言和跨语言对话推荐
哈工大SCIR
0+阅读 · 2022年3月11日
跨语言的多模态、多任务检索模型MURAL解读
AI前线
4+阅读 · 2021年12月24日
微软翻译突破百种语言和方言大关
微软研究院AI头条
0+阅读 · 2021年10月15日
哈工大|NLP数据增强方法?我有15种
哈工大SCIR
1+阅读 · 2021年10月13日
基于机器阅读理解(MRC)的信息抽取方法
DataFunTalk
13+阅读 · 2019年11月1日
自然语言处理 (三) 之 word embedding
DeepLearning中文论坛
19+阅读 · 2015年8月3日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
2+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年4月15日
Arxiv
28+阅读 · 2021年10月1日
小贴士
相关VIP内容
自然语言处理中的文本表示研究
专知会员服务
55+阅读 · 2022年1月10日
EMNLP 2021 | 预训练跨语言模型中的大词表构建及使用
专知会员服务
20+阅读 · 2022年1月5日
EMNLP 2021 | 学习改写非自回归机器翻译的翻译结果
专知会员服务
14+阅读 · 2021年12月25日
专知会员服务
79+阅读 · 2021年10月15日
专知会员服务
16+阅读 · 2021年8月24日
知识增强的文本生成研究进展
专知会员服务
96+阅读 · 2021年3月6日
【IJCAI2020-CMU】结构注意力的神经抽象摘要
专知会员服务
21+阅读 · 2020年4月23日
机器翻译深度学习最新综述
专知会员服务
96+阅读 · 2020年2月20日
相关资讯
赛尔原创@EMNLP 2021 | 多语言和跨语言对话推荐
哈工大SCIR
0+阅读 · 2022年3月11日
跨语言的多模态、多任务检索模型MURAL解读
AI前线
4+阅读 · 2021年12月24日
微软翻译突破百种语言和方言大关
微软研究院AI头条
0+阅读 · 2021年10月15日
哈工大|NLP数据增强方法?我有15种
哈工大SCIR
1+阅读 · 2021年10月13日
基于机器阅读理解(MRC)的信息抽取方法
DataFunTalk
13+阅读 · 2019年11月1日
自然语言处理 (三) 之 word embedding
DeepLearning中文论坛
19+阅读 · 2015年8月3日
相关基金
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
2+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员