项目名称: 基于语谱图信息的汉语词汇整体识别和语音增强方法研究

项目编号: No.61471111

项目类型: 面上项目

立项/批准年度: 2015

项目学科: 无线电电子学、电信技术

项目作者: 王双维

作者单位: 东北师范大学

项目金额: 75万元

中文摘要: 无论语音识别还是语音增强,常规语音处理技术通常利用语音信号属于非平稳随机过程这一特性,以10-30ms的短时语音帧为基本单位进行处理。但这种分割方法破坏了音节承载信息的整体性,在一定程度上影响了语音处理的效果。本项目拟以语谱图解析为信息平台,系统研究特定人汉语语音词汇整体识别、单字声调识别、不同说话人同语义语谱图转换,及语音增强方法,并形成相应的基本算法体系。该项目成果有利于实现汉语语音字、词、句的整体识别,提高汉语识别效率;对汉语单字发音的声调识别,为汉语情感识别和汉语方言识别提供基础;利用几何变换,对同语义不同说话人语谱图的相互转换,可以达到非特定人语义单模版识别的目的;采用语谱图为信息平台,可以使得音频样本中相同频域区间的信号与噪声,在图像频域中实现信噪频位分离,大大提高语音增强效果。

中文关键词: 声信号处理;语音识别;语音增强;语音信息处理

英文摘要: In general, non-stationary random character is always used in speech processing technologies such as speech recognition and speech enhancement. And short-time speech frame of 10-30ms is always adopted as basic processing unit in these technologies. However, the integrity of Chinese syllable is destroyed by this method and the speech processing performance is affected inevitably. In this project, speaker dependent Chinese words entirety speech recognition, Chinese character tone recognition, same semantics spectrogram geometric transformation of different speaker, speech enhancement method and the basic algorithm system of these which are based on spectrogram image information platform will be studied. The research of the project contributes to the entirety speech recognition of Chinese words, phrase and sentence efficiently. The study on Chinese character tone recognition also can be the foundation of Chinese emotion recognition. Speaker-independent semantics recognition can be realized by same semantics spectrogram geometric transformation of different speaker. And since the spectrogram is chosen as research data platform it is relatively easy to separate the signal and noise on frequency area. That is helpful to improve the performance of speech enhancement.

英文关键词: Acoustic signal processing;speech recognition;speech enhancement;speech information processing

成为VIP会员查看完整内容
0

相关内容

基于文档的对话技术研究
专知会员服务
18+阅读 · 2022年2月20日
多语言语音识别声学模型建模方法最新进展
专知会员服务
31+阅读 · 2022年2月7日
专知会员服务
12+阅读 · 2021年10月6日
专知会员服务
22+阅读 · 2021年7月15日
专知会员服务
79+阅读 · 2021年7月3日
基于生理信号的情感计算研究综述
专知会员服务
61+阅读 · 2021年2月9日
专知会员服务
55+阅读 · 2020年12月20日
【中科大徐童】多模态语义理解与关联
专知会员服务
81+阅读 · 2019年12月7日
一文带你了解语音信号处理技术
PaperWeekly
9+阅读 · 2022年1月26日
SFFAI分享 | 黄健:语音情感识别【附PPT与视频资料】
人工智能前沿讲习班
30+阅读 · 2019年6月11日
OCR技术浅析
机器学习研究会
40+阅读 · 2017年12月8日
语音识别之--韩语语音识别
微信AI
15+阅读 · 2017年8月2日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Tikhonov Regularization of Circle-Valued Signals
Arxiv
1+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月15日
Arxiv
19+阅读 · 2018年5月17日
Arxiv
10+阅读 · 2018年2月17日
小贴士
相关VIP内容
基于文档的对话技术研究
专知会员服务
18+阅读 · 2022年2月20日
多语言语音识别声学模型建模方法最新进展
专知会员服务
31+阅读 · 2022年2月7日
专知会员服务
12+阅读 · 2021年10月6日
专知会员服务
22+阅读 · 2021年7月15日
专知会员服务
79+阅读 · 2021年7月3日
基于生理信号的情感计算研究综述
专知会员服务
61+阅读 · 2021年2月9日
专知会员服务
55+阅读 · 2020年12月20日
【中科大徐童】多模态语义理解与关联
专知会员服务
81+阅读 · 2019年12月7日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
微信扫码咨询专知VIP会员