项目名称: 基于非线性语音谱分析的单通道语音增强研究

项目编号: No.61302126

项目类型: 青年科学基金项目

立项/批准年度: 2014

项目学科: 无线电电子学、电信技术

项目作者: 王杰

作者单位: 广州大学

项目金额: 23万元

中文摘要: 单通道语音增强面临两个根本性问题:一是谱估计方差既可能产生"音乐噪声",也可能造成语音失真;二是当前的噪声估计算法难以跟踪非平稳态噪声,低估噪声会导致大量的噪声残留。针对这两个根本性问题,我们验证了倒谱后处理能在不增加语音失真的情况下抑制部分非平稳态噪声,本项目将进一步开展基于非线性语音谱分析的单通道语音增强研究。相比于基于线性谱估计的传统方法,采用基于倒谱分析和重分配谱图的非线性语音谱估计具有如下优势:首先,利用倒谱分析可以将噪声从语音信号分离出来;其次,利用重分配谱图可以充分利用语音帧间和频间相关性。本项目拟对语音倒谱进行理论研究,研究其统计特性,该理论研究成果既应用于提高噪声跟踪性能,又应用于后处理抑制残留的非平稳态噪声。同时,进一步对重分配谱图进行理论研究,利用语音帧间和频间相关性抑制非平稳态噪声。该研究的理论成果将解决实际环境中的单通道语音增强问题,为实用化扫清障碍。

中文关键词: 语音增强;谐波重构;倒谱;重分配图谱;非线性谱

英文摘要: There are two basic prolems existed in the state-of-the-art single-channel speech enhancement algorithms. First, the bias and the variance of the spectral estimator may introduce both musical noise and audible speech distortion. Second, the existing noise estimators could not track non-stationary noise in a fast way, which may result in greatly reducing the amount of noise reduction. To solve these two problems, we have proved that some non-stationary noise components could be suppressed without introducing audible speech disortion by using cepstrum-based postprocessing scheme, where this project will further study non-linear speech spectrum analysis-based single-channel speech enhancement. Compared with the conventional single-channel speech enhancement, the proposed method that uses both cepstral analysis and reassigned spectrogram has at least two advantages. First, the noise components can be separated from the speech components by using cepstral analysis. Second, we can fully utilize both the temporal correlation between successive speech frames and the frequency correlation between adjacent bands with the help of reassigned spectrogram. This project will study theoretical propertis of cepstral coefficients of the speech, where the thoeretical results can be used to improve the noise tracking capablity and

英文关键词: speech enhancement;harmonic regeneration;cepstrum;reassigned spectrogram;non-linear spectrum

成为VIP会员查看完整内容
0

相关内容

语音增强是指当语音信号被各种各样的噪声干扰、甚至淹没后,从噪声背景中提取有用的语音信号,抑制、降低噪声干扰的技术。一句话,从含噪语音中提取尽可能纯净的原始语音。
多语言语音识别声学模型建模方法最新进展
专知会员服务
33+阅读 · 2022年2月7日
《过参数化机器学习理论》综述论文
专知会员服务
45+阅读 · 2021年9月19日
最新《注意力机制与深度学习结合》综述论文
专知会员服务
75+阅读 · 2021年6月17日
专知会员服务
71+阅读 · 2021年5月21日
基于生理信号的情感计算研究综述
专知会员服务
61+阅读 · 2021年2月9日
专知会员服务
30+阅读 · 2021年1月9日
综述:图像滤波常用算法实现及原理解析
极市平台
0+阅读 · 2022年1月29日
一文带你了解语音信号处理技术
PaperWeekly
9+阅读 · 2022年1月26日
Interspeech 2019 | 基于多模态对齐的语音情感识别
AI科技评论
23+阅读 · 2019年9月21日
近期声学领域前沿论文(No. 3)
深度学习每日摘要
24+阅读 · 2019年3月31日
【好文解析】ICASSP最佳学生论文:深度对抗声学模型训练框架
中国科学院自动化研究所
13+阅读 · 2018年4月28日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年5月4日
Arxiv
31+阅读 · 2021年6月30日
Disentangled Information Bottleneck
Arxiv
12+阅读 · 2020年12月22日
Arxiv
23+阅读 · 2020年9月16日
小贴士
相关资讯
综述:图像滤波常用算法实现及原理解析
极市平台
0+阅读 · 2022年1月29日
一文带你了解语音信号处理技术
PaperWeekly
9+阅读 · 2022年1月26日
Interspeech 2019 | 基于多模态对齐的语音情感识别
AI科技评论
23+阅读 · 2019年9月21日
近期声学领域前沿论文(No. 3)
深度学习每日摘要
24+阅读 · 2019年3月31日
【好文解析】ICASSP最佳学生论文:深度对抗声学模型训练框架
中国科学院自动化研究所
13+阅读 · 2018年4月28日
相关基金
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员