项目名称: 基于EMD的复杂声学环境下语音检测与增强

项目编号: No.60803087

项目类型: 青年科学基金项目

立项/批准年度: 2009

项目学科: 数理科学和化学

项目作者: 申丽然

作者单位: 哈尔滨工程大学

项目金额: 19万元

中文摘要: 话带信号是以语音信号为主,夹杂各种噪声,非线性、非平稳信号。在话带信号中有效的提取语音并对其进行增强会使语音的编码、传输等更加有效并能减少信道的负载。这些都是目前迅猛发展的通信系统(民、军用)所急切需要解决的问题。以往对话带信号的分析都是建立在富丽叶变换基础之上,因此这些分析方法必然受到富氏变换的局限。经验模态分解(EMD)的出现会给话带语音信号的分析注入新的血液。EMD 是近几年刚刚发展起来的一种全新的非线性、非平稳时间序列分析方法。本项目主要研究内容如下:1)半监督回归支持向量机函数估计的方法进行曲线拟合,从中得到更为准确的信号包络,并且能进行预测估计解决端点效应问题; 2)采用信息变差从理论上理论给出模态分离结束依据。采用自适应尺度搜索的方法进行经验模态分解从一定程度上解决模态混叠问题。3)EMD 和TEO 算子相结合进行语音信号检测;4)EMD 结合子空间理论和人耳听觉特性进行语音增强。

中文关键词: 经验模态分解;非线性非平稳信号处理;语音检测;语音增强

英文摘要: The voice band signal is nonlinear and nonstationary signal, which main component is speech signal and mingles with various noise. Exctracting effectively speech signals from voice band signal and then enhancing them is not only make the code and transmit more efficient but also can reduce the channel load. These all are needed to be solved for communication system (civil, military). Previously all the methods which were used to analysis voice band signal were based on fourier transform. So all the methods must be limited by fourier transform. EMD is a novel method to analysize nonlinear and nonstationary signal. And the method can provide a new way for voice band signal.the main researchs in this project as follows: 1)semi-supervised regression Support Vector Machine will be used to curve fitting. And then get more exactly signal envelope to solve the problem of endpoint.2) Give the rule for the mode separating. Using Adaptive scales searching method to separate the signal.3)Using EMD combining with TEO operator to detection speech signal. 4)Using EMD combining with subspace theory and Human Auditory to enhancing speech signal.

英文关键词: EMD ;nonlinear nonstationary signal processing; speech detection ;speech enhancement

成为VIP会员查看完整内容
1

相关内容

【AI+军事】附PPT 《前瞻性分析:获得决策优势的方法》
专知会员服务
88+阅读 · 2022年4月17日
【Paul Liang】多模态深度学习,Multimodal Deep Learning
专知会员服务
182+阅读 · 2022年4月12日
多语言语音识别声学模型建模方法最新进展
专知会员服务
32+阅读 · 2022年2月7日
专知会员服务
48+阅读 · 2021年8月29日
专知会员服务
97+阅读 · 2021年6月23日
一文带你了解语音信号处理技术
PaperWeekly
9+阅读 · 2022年1月26日
语音合成:模拟最像人类声音的系统
PaperWeekly
2+阅读 · 2021年11月30日
Interspeech 2019 | 基于多模态对齐的语音情感识别
AI科技评论
23+阅读 · 2019年9月21日
语音情绪识别|声源增强|基频可视化
深度学习每日摘要
15+阅读 · 2019年5月5日
近期声学领域前沿论文(No. 3)
深度学习每日摘要
24+阅读 · 2019年3月31日
语音关键词检测方法综述【附PPT与视频资料】
人工智能前沿讲习班
10+阅读 · 2019年2月2日
微信美女研究员:详解CNN在语音识别中的应用
机械鸡
13+阅读 · 2017年7月28日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Max-Margin Contrastive Learning
Arxiv
17+阅读 · 2021年12月21日
Arxiv
14+阅读 · 2021年3月10日
Directional Graph Networks
Arxiv
27+阅读 · 2020年12月10日
小贴士
相关资讯
一文带你了解语音信号处理技术
PaperWeekly
9+阅读 · 2022年1月26日
语音合成:模拟最像人类声音的系统
PaperWeekly
2+阅读 · 2021年11月30日
Interspeech 2019 | 基于多模态对齐的语音情感识别
AI科技评论
23+阅读 · 2019年9月21日
语音情绪识别|声源增强|基频可视化
深度学习每日摘要
15+阅读 · 2019年5月5日
近期声学领域前沿论文(No. 3)
深度学习每日摘要
24+阅读 · 2019年3月31日
语音关键词检测方法综述【附PPT与视频资料】
人工智能前沿讲习班
10+阅读 · 2019年2月2日
微信美女研究员:详解CNN在语音识别中的应用
机械鸡
13+阅读 · 2017年7月28日
相关基金
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员