项目名称: 基于互联网的汉维科技术语提取技术研究

项目编号: No.61463048

项目类型: 地区科学基金项目

立项/批准年度: 2015

项目学科: 其他

项目作者: 米尔夏提·力提甫

作者单位: 新疆大学

项目金额: 45万元

中文摘要: 术语(terms)集中承载特定领域的核心知识,术语自动抽取能够帮助人们便捷地获得和认识领域知识,而双语术语则充分体现了语言间的映射和对应关系,在自然语言处理中具有重要地位。本项在目前期预研的基础上,构建面向科技领域的汉维可比语料库,研究实用的基于可比语料的汉维双语术语抽取方法、汉维双语语料自动获取方法、维汉语料篇章级自动对齐方法,基于规则的维吾尔语术语识别以及抽取混合方法,研制基于互联网语料的汉维双语术语抽取原型系统,构建面向科技领域的汉语-维吾尔语双语新术语资源库,抽取和编纂科技领域的汉语-维吾尔语双语对齐新术语词典为汉维机器翻译、跨语言信息检索提供支持,促进新疆科技事业的发展和信息化建设进程。

中文关键词: 术语;可比语料库;双语对齐;汉语-维吾尔语

英文摘要: The concentration of terms carries the core knowledge of a particular field. Automatically extraction of terms can help people to access and understand the field of knowledge in a convenient and fast way. More over, bilingual terminology fully reflects the mapping and corresponding relations between the languages, and it plays an important role in the natural language processing. In this project, on the basis of pre-research, we will build science and technology-oriented Chinese-Uyghur comparable corpus to study practical method of comparable corpus based Chinese-Uyghur bilingual term extraction, method of Chinese-Uyghur Automatic corpus extraction, method of Chinese-Uyghur article level automatic alignment and hybrid approach of rule based Uyghur term detection and extraction. Develop Internet based Chinese-Uyghur extraction prototype system, build new term repository, extract and compile science and technology oriented Chinese-Uyghur bilingual new term dictionary to support Chinese-Uyghur machine translation, cross language information retrieval and advance the development of science , technology and information construction of Xinjiang.

英文关键词: Terminology;Comparable Corpus;Bilingual Alignment;Chinese-Uyghur

成为VIP会员查看完整内容
0

相关内容

知识图谱研究现状及军事应用
专知会员服务
191+阅读 · 2022年4月8日
军事知识图谱构建技术
专知会员服务
125+阅读 · 2022年4月8日
《金融大数据术语》行业标准,24页pdf
专知会员服务
53+阅读 · 2022年2月28日
央行发布《金融大数据术语》,25页pdf
专知会员服务
41+阅读 · 2022年1月25日
专知会员服务
111+阅读 · 2021年1月8日
企业风险知识图谱的构建及应用
专知会员服务
97+阅读 · 2020年11月6日
专知会员服务
193+阅读 · 2020年10月14日
专知会员服务
31+阅读 · 2020年9月2日
中文知识图谱构建技术以及应用的综述
专知会员服务
312+阅读 · 2019年10月19日
《金融大数据术语》行业标准,24页pdf
专知
1+阅读 · 2022年2月28日
面向新闻媒体的命名实体识别技术
PaperWeekly
18+阅读 · 2019年4月17日
连载 | 知识图谱发展报告 2018 -- 前言
开放知识图谱
18+阅读 · 2018年10月7日
【知识图谱】 一个有效的知识图谱是如何构建的?
产业智能官
57+阅读 · 2018年4月5日
领域应用 | 中医临床知识图谱的构建与应用
开放知识图谱
33+阅读 · 2017年12月12日
综述 | 知识图谱发展概述
PaperWeekly
75+阅读 · 2017年11月3日
漆桂林 | 知识图谱之语义网络篇
开放知识图谱
19+阅读 · 2017年8月12日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
7+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
0+阅读 · 2022年4月15日
Arxiv
0+阅读 · 2022年4月14日
小贴士
相关VIP内容
知识图谱研究现状及军事应用
专知会员服务
191+阅读 · 2022年4月8日
军事知识图谱构建技术
专知会员服务
125+阅读 · 2022年4月8日
《金融大数据术语》行业标准,24页pdf
专知会员服务
53+阅读 · 2022年2月28日
央行发布《金融大数据术语》,25页pdf
专知会员服务
41+阅读 · 2022年1月25日
专知会员服务
111+阅读 · 2021年1月8日
企业风险知识图谱的构建及应用
专知会员服务
97+阅读 · 2020年11月6日
专知会员服务
193+阅读 · 2020年10月14日
专知会员服务
31+阅读 · 2020年9月2日
中文知识图谱构建技术以及应用的综述
专知会员服务
312+阅读 · 2019年10月19日
相关资讯
《金融大数据术语》行业标准,24页pdf
专知
1+阅读 · 2022年2月28日
面向新闻媒体的命名实体识别技术
PaperWeekly
18+阅读 · 2019年4月17日
连载 | 知识图谱发展报告 2018 -- 前言
开放知识图谱
18+阅读 · 2018年10月7日
【知识图谱】 一个有效的知识图谱是如何构建的?
产业智能官
57+阅读 · 2018年4月5日
领域应用 | 中医临床知识图谱的构建与应用
开放知识图谱
33+阅读 · 2017年12月12日
综述 | 知识图谱发展概述
PaperWeekly
75+阅读 · 2017年11月3日
漆桂林 | 知识图谱之语义网络篇
开放知识图谱
19+阅读 · 2017年8月12日
相关基金
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
7+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员