项目名称: 面向电话语音的蒙古语关键词检测技术的研究

项目编号: No.61263037

项目类型: 地区科学基金项目

立项/批准年度: 2013

项目学科: 自动化技术、计算机技术

项目作者: 高光来

作者单位: 内蒙古大学

项目金额: 43万元

中文摘要: 蒙古语是一个跨多国、多地区的语言,在国际上是有广泛影响的一种语言文字,使用者分布在中国、蒙古国和俄罗斯等国家。中国和蒙古国使用的蒙古语言文字是"语同文不同",因此安全战略地位十分突出。另外,蒙古语语音资源应用越来越普遍,数量急剧增加,已形成了宝贵的民族文化资源,有待于进一步开发利用。本项目以蒙古语电话语音为对象,对语音关键词检测技术所涉及到的蒙古语语音识别系统的解码、网格数据优化及索引建立、关键词的检测模型和置信度计算方法、集外词处理、关键词查询扩展、蒙古文字母到音素的自动转换等一系列关键问题进行研究,并搭建一个基本能达到应用要求的蒙古语关键词检测系统。我们将借鉴其它语言的先进经验,并结合蒙古语的特点,突破一系列难点来提高系统检测的准确度。本项目研究的蒙古语语音关键词检测技术不仅具有重要的学术价值,并对维护国家安全及边疆少数民族地区的稳定,繁荣和发展少数民族文化具有重要意义。

中文关键词: 蒙古语;关键词检测;语音识别;置信度;集外词

英文摘要: Mongolian language is a kind of influential language in the world, which is used in many countries such as China, Republic of Mongolia and Russia. In China, the used Mongolian is called "traditional Mongolian", which is different from "Cyril Mongolian" used in Republic of Mongolia. These two kinds of Mongolian languages have the same speaking, but they are different in writing. Under the circumstance, the Mongolian language possesses an outstanding position in safety and strategy of our country. In addition, more and more voice resources of Mongolian language have been formed with rapidly increasing, which involves in education, culture, film, television and other fields. These are the precious culture resources for the Mongolian people. And these voice resources need to be developed and utilized further. This project will research all key issues in Mongolian speech keyword spotting. And the Mongolian speech is achieved by telephone, which is the study object in this project. The detailed research contents include the decoding of the Mongolian speech recognition system, lattice optimization, indexing, the keyword spotting model, the confidence measure calculation approach, the processing for words out of vocabulary, query expansion, the conversion of grapheme to phoneme. Finally, a Mongolian keyword spotting sys

英文关键词: Mongolian;Keyword spotting;Speech recognition;Confidence measure;Out of vocabulary

成为VIP会员查看完整内容
0

相关内容

【2022开放书】因果推理统计工具,377页pdf
专知会员服务
108+阅读 · 2022年4月20日
多语言语音识别声学模型建模方法最新进展
专知会员服务
31+阅读 · 2022年2月7日
面向语义搜索的自然语言处理
专知会员服务
58+阅读 · 2021年12月18日
专知会员服务
27+阅读 · 2021年8月16日
稀缺资源语言神经网络机器翻译研究综述
专知会员服务
26+阅读 · 2020年12月2日
专知会员服务
189+阅读 · 2020年10月14日
【中科院信工所】视听觉深度伪造检测技术研究综述
专知会员服务
40+阅读 · 2020年4月15日
微软翻译突破百种语言和方言大关
微软研究院AI头条
0+阅读 · 2021年10月15日
微信AI的语音合成技术,让“读”书更尽兴
微信AI
0+阅读 · 2020年10月22日
语音关键词检测方法综述【附PPT与视频资料】
人工智能前沿讲习班
10+阅读 · 2019年2月2日
腾讯数平精准推荐 | OCR技术之检测篇
机器学习研究会
13+阅读 · 2018年3月17日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年5月2日
Arxiv
0+阅读 · 2022年4月30日
Arxiv
27+阅读 · 2020年6月19日
Arxiv
12+阅读 · 2019年2月28日
小贴士
相关VIP内容
【2022开放书】因果推理统计工具,377页pdf
专知会员服务
108+阅读 · 2022年4月20日
多语言语音识别声学模型建模方法最新进展
专知会员服务
31+阅读 · 2022年2月7日
面向语义搜索的自然语言处理
专知会员服务
58+阅读 · 2021年12月18日
专知会员服务
27+阅读 · 2021年8月16日
稀缺资源语言神经网络机器翻译研究综述
专知会员服务
26+阅读 · 2020年12月2日
专知会员服务
189+阅读 · 2020年10月14日
【中科院信工所】视听觉深度伪造检测技术研究综述
专知会员服务
40+阅读 · 2020年4月15日
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
相关论文
微信扫码咨询专知VIP会员