项目名称: 跨汉斯拉夫蒙古文的信息检索关键技术研究
项目编号: No.61362028
项目类型: 地区科学基金项目
立项/批准年度: 2013
项目学科: 无线电电子学、电信技术
项目作者: 侯宏旭
作者单位: 内蒙古大学
项目金额: 43万元
中文摘要: 跨汉斯拉夫蒙古文的信息检索关键技术研究的主要任务是研究以汉语关键词查询大量斯拉夫蒙古文文档中相关文档的关键技术。本课题的研究对于保障国家信息安全和维护稳定具有重要的意义。主要技术路线为:首先利用基于文本机会发现的方法构建斯拉夫蒙古文关键词集,利用这个集合构建待检索文档集索引;通过机器翻译技术将汉文查询项翻译为斯拉法蒙古文查询项;利用斯拉夫蒙古文查询项检索文档集,形成初始查询结果集;提取结果集中的翻译片段,翻译为汉文;用汉文查询项和翻译结果进行冲排序。本课题的主要研究内容是:基于文本机会发现的关键词自动抽取技术、基于伪相关反馈模型的翻译片段提取技术、斯拉夫蒙古文检索模型和基于机器翻译技术的检索结果Rerank技术。
中文关键词: 跨语言检索;斯拉夫蒙古文;机器翻译;;
英文摘要: The primary task of cross Chinese and Slavic Mongolian information retrieval is to research the techniques of searching relative documents from Slavic Mongolian documents, with Chinese query terms. This project is very important to the security of our cou
英文关键词: Cross-language Information Retrieval;Slavic Mongolian;Manchine Translation;;