基于EMD的复杂声学环境下语音检测与增强 - 专知基金

会员服务 ·

1

经验模态分解 · 非线性非平稳信号处理 · 语音检测 · 语音增强 ·

2008 年 12 月 31 日

基于EMD的复杂声学环境下语音检测与增强

国家自然科学基金

国家自然科学基金委员会

项目名称： 基于EMD的复杂声学环境下语音检测与增强

项目编号： No.60803087

项目类型： 青年科学基金项目

立项/批准年度： 2009

项目学科： 数理科学和化学

项目作者： 申丽然

作者单位： 哈尔滨工程大学

项目金额： 19万元

中文摘要： 话带信号是以语音信号为主，夹杂各种噪声，非线性、非平稳信号。在话带信号中有效的提取语音并对其进行增强会使语音的编码、传输等更加有效并能减少信道的负载。这些都是目前迅猛发展的通信系统（民、军用）所急切需要解决的问题。以往对话带信号的分析都是建立在富丽叶变换基础之上，因此这些分析方法必然受到富氏变换的局限。经验模态分解（EMD）的出现会给话带语音信号的分析注入新的血液。EMD 是近几年刚刚发展起来的一种全新的非线性、非平稳时间序列分析方法。本项目主要研究内容如下：1）半监督回归支持向量机函数估计的方法进行曲线拟合，从中得到更为准确的信号包络，并且能进行预测估计解决端点效应问题； 2）采用信息变差从理论上理论给出模态分离结束依据。采用自适应尺度搜索的方法进行经验模态分解从一定程度上解决模态混叠问题。3）EMD 和TEO 算子相结合进行语音信号检测；4）EMD 结合子空间理论和人耳听觉特性进行语音增强。

中文关键词： 经验模态分解;非线性非平稳信号处理;语音检测;语音增强

英文摘要： The voice band signal is nonlinear and nonstationary signal, which main component is speech signal and mingles with various noise. Exctracting effectively speech signals from voice band signal and then enhancing them is not only make the code and transmit more efficient but also can reduce the channel load. These all are needed to be solved for communication system (civil, military). Previously all the methods which were used to analysis voice band signal were based on fourier transform. So all the methods must be limited by fourier transform. EMD is a novel method to analysize nonlinear and nonstationary signal. And the method can provide a new way for voice band signal.the main researchs in this project as follows： 1）semi-supervised regression Support Vector Machine will be used to curve fitting. And then get more exactly signal envelope to solve the problem of endpoint.2) Give the rule for the mode separating. Using Adaptive scales searching method to separate the signal.3)Using EMD combining with TEO operator to detection speech signal. 4)Using EMD combining with subspace theory and Human Auditory to enhancing speech signal.

英文关键词： EMD ;nonlinear nonstationary signal processing; speech detection ;speech enhancement

成为VIP会员查看完整内容

1

相关内容

经验模态分解

经验模态分解

【AI+军事】附PPT 《前瞻性分析：获得决策优势的方法》

【AI+军事】附PPT 《前瞻性分析：获得决策优势的方法》

专知会员服务

97+阅读 · 2022年4月17日

【Paul Liang】多模态深度学习，Multimodal Deep Learning

【Paul Liang】多模态深度学习，Multimodal Deep Learning

专知会员服务

185+阅读 · 2022年4月12日

【AI+军事】《低、慢、小威胁建模和仿真》北约STO技术报告50页

【AI+军事】《低、慢、小威胁建模和仿真》北约STO技术报告50页

专知会员服务

253+阅读 · 2022年3月19日

语音识别:不同深度学习方法的综述，Speech Recognition: a review of the different deep learning approaches

语音识别:不同深度学习方法的综述，Speech Recognition: a review of the different deep learning approaches

专知会员服务

33+阅读 · 2022年3月13日

中国科大凌震华【语音信号处理基础 Fundamentals of Speech Signal Processing】(2021年秋季学期)课程PPT

中国科大凌震华【语音信号处理基础 Fundamentals of Speech Signal Processing】(2021年秋季学期)课程PPT

专知会员服务

19+阅读 · 2022年2月25日

多语言语音识别声学模型建模方法最新进展

多语言语音识别声学模型建模方法最新进展

专知会员服务

36+阅读 · 2022年2月7日

高维统计的信息理论方法，162页pdf

专知会员服务

56+阅读 · 2021年8月29日

基于规则的建模方法的可解释性及其发展

专知会员服务

102+阅读 · 2021年6月23日

【ICML2020-伯克利】稳定非策略强化学习的表示，Representations for Stable Off-Policy Reinforcement Learning

【ICML2020-伯克利】稳定非策略强化学习的表示，Representations for Stable Off-Policy Reinforcement Learning

专知会员服务

17+阅读 · 2020年7月14日

语音处理中的深度表示学习综述论文:挑战、最新进展和未来趋势，25页pdf

语音处理中的深度表示学习综述论文:挑战、最新进展和未来趋势，25页pdf

专知会员服务

32+阅读 · 2020年1月2日

多语言语音识别声学模型建模方法最新进展

多语言语音识别声学模型建模方法最新进展

专知

2+阅读 · 2022年2月7日

一文带你了解语音信号处理技术

一文带你了解语音信号处理技术

PaperWeekly

9+阅读 · 2022年1月26日

语音合成：模拟最像人类声音的系统

语音合成：模拟最像人类声音的系统

PaperWeekly

2+阅读 · 2021年11月30日

让你在嘈杂环境听得更清晰，人工耳蜗搭载语音增强预处理技术

让你在嘈杂环境听得更清晰，人工耳蜗搭载语音增强预处理技术

TensorFlow

1+阅读 · 2021年8月26日

Interspeech 2019 | 基于多模态对齐的语音情感识别

Interspeech 2019 | 基于多模态对齐的语音情感识别

AI科技评论

23+阅读 · 2019年9月21日

语音情绪识别|声源增强|基频可视化

语音情绪识别|声源增强|基频可视化

深度学习每日摘要

15+阅读 · 2019年5月5日

近期声学领域前沿论文(No. 3)

近期声学领域前沿论文(No. 3)

深度学习每日摘要

24+阅读 · 2019年3月31日

语音关键词检测方法综述【附PPT与视频资料】

语音关键词检测方法综述【附PPT与视频资料】

人工智能前沿讲习班

10+阅读 · 2019年2月2日

一文看懂深度学习在语音合成&增强上的应用

一文看懂深度学习在语音合成&增强上的应用

数盟

11+阅读 · 2017年9月13日

微信美女研究员：详解CNN在语音识别中的应用

微信美女研究员：详解CNN在语音识别中的应用

机械鸡

13+阅读 · 2017年7月28日

面向语音表示及分离的结构化深度学习研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于压缩感知的单通道混合语音分离理论及算法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于深度神经网络的噪声鲁棒性语音识别方法研究

国家自然科学基金

4+阅读 · 2013年12月31日

基于稀疏编码的语音特征增强方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于非线性语音谱分析的单通道语音增强研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于声学矢量传感器阵列和稀疏表示的语音声源方位角估计方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

利用参量结构实现复杂信号环境下盲信号分离方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于情感上下文的视觉语音多模态协同情感分析方法研究

国家自然科学基金

4+阅读 · 2012年12月31日

基于EMD的复杂几何模型处理方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

面向自然环境下语音增强的复数域半盲分离方法研究

国家自然科学基金

0+阅读 · 2009年12月31日

A multi-task learning for cavitation detection and cavitation intensity recognition of valve acoustic signals

Arxiv

0+阅读 · 2022年4月20日

CorrGAN: Input Transformation Technique Against Natural Corruptions

Arxiv

0+阅读 · 2022年4月19日

Self-Supervised Equivariant Learning for Oriented Keypoint Detection

Arxiv

0+阅读 · 2022年4月19日

Improving Frame-Online Neural Speech Enhancement with Overlapped-Frame Prediction

Arxiv

0+阅读 · 2022年4月15日

Weakly-supervised Temporal Path Representation Learning with Contrastive Curriculum Learning -- Extended Version

Weakly-supervised Temporal Path Representation Learning with Contrastive Curriculum Learning -- Extended Version

Arxiv

0+阅读 · 2022年4月15日

Max-Margin Contrastive Learning

Max-Margin Contrastive Learning

Arxiv

18+阅读 · 2021年12月21日

Spatially Consistent Representation Learning

Arxiv

14+阅读 · 2021年3月10日

Directional Graph Networks

Directional Graph Networks

Arxiv

27+阅读 · 2020年12月10日

Learning Latent Representations to Influence Multi-Agent Interaction

Arxiv

11+阅读 · 2020年11月12日

Event Extraction with Generative Adversarial Imitation Learning

Arxiv

13+阅读 · 2018年4月21日

阅读: 0 点赞: 0

小贴士

登录享主题订阅及个性化推荐

相关主题

经验模态分解

非线性非平稳信号处理

热门VIP内容

开通专知VIP会员享更多权益服务

《乌克兰无人机产业：志愿者与政策在构建新兴无人机产业中的协同作用》最新报告

《人工智能辅助决策中的数据可视化：系统性综述》

人工智能驱动弹药制造现代化：美国陆军转型之路

《敏捷作战部署中枢纽-辐条基地选址优化研究》80页

相关VIP内容

【AI+军事】附PPT 《前瞻性分析：获得决策优势的方法》

【AI+军事】附PPT 《前瞻性分析：获得决策优势的方法》

专知会员服务

97+阅读 · 2022年4月17日

【Paul Liang】多模态深度学习，Multimodal Deep Learning

【Paul Liang】多模态深度学习，Multimodal Deep Learning

专知会员服务

185+阅读 · 2022年4月12日

【AI+军事】《低、慢、小威胁建模和仿真》北约STO技术报告50页

【AI+军事】《低、慢、小威胁建模和仿真》北约STO技术报告50页

专知会员服务

253+阅读 · 2022年3月19日

语音识别:不同深度学习方法的综述，Speech Recognition: a review of the different deep learning approaches

语音识别:不同深度学习方法的综述，Speech Recognition: a review of the different deep learning approaches

专知会员服务

33+阅读 · 2022年3月13日

中国科大凌震华【语音信号处理基础 Fundamentals of Speech Signal Processing】(2021年秋季学期)课程PPT

中国科大凌震华【语音信号处理基础 Fundamentals of Speech Signal Processing】(2021年秋季学期)课程PPT

专知会员服务

19+阅读 · 2022年2月25日

多语言语音识别声学模型建模方法最新进展

多语言语音识别声学模型建模方法最新进展

专知会员服务

36+阅读 · 2022年2月7日

高维统计的信息理论方法，162页pdf

专知会员服务

56+阅读 · 2021年8月29日

基于规则的建模方法的可解释性及其发展

专知会员服务

102+阅读 · 2021年6月23日

【ICML2020-伯克利】稳定非策略强化学习的表示，Representations for Stable Off-Policy Reinforcement Learning

【ICML2020-伯克利】稳定非策略强化学习的表示，Representations for Stable Off-Policy Reinforcement Learning

专知会员服务

17+阅读 · 2020年7月14日

语音处理中的深度表示学习综述论文:挑战、最新进展和未来趋势，25页pdf

语音处理中的深度表示学习综述论文:挑战、最新进展和未来趋势，25页pdf

专知会员服务

32+阅读 · 2020年1月2日

相关资讯

多语言语音识别声学模型建模方法最新进展

多语言语音识别声学模型建模方法最新进展

专知

2+阅读 · 2022年2月7日

一文带你了解语音信号处理技术

一文带你了解语音信号处理技术

PaperWeekly

9+阅读 · 2022年1月26日

语音合成：模拟最像人类声音的系统

语音合成：模拟最像人类声音的系统

PaperWeekly

2+阅读 · 2021年11月30日

让你在嘈杂环境听得更清晰，人工耳蜗搭载语音增强预处理技术

让你在嘈杂环境听得更清晰，人工耳蜗搭载语音增强预处理技术

TensorFlow

1+阅读 · 2021年8月26日

Interspeech 2019 | 基于多模态对齐的语音情感识别

Interspeech 2019 | 基于多模态对齐的语音情感识别

AI科技评论

23+阅读 · 2019年9月21日

语音情绪识别|声源增强|基频可视化

语音情绪识别|声源增强|基频可视化

深度学习每日摘要

15+阅读 · 2019年5月5日

近期声学领域前沿论文(No. 3)

近期声学领域前沿论文(No. 3)

深度学习每日摘要

24+阅读 · 2019年3月31日

语音关键词检测方法综述【附PPT与视频资料】

语音关键词检测方法综述【附PPT与视频资料】

人工智能前沿讲习班

10+阅读 · 2019年2月2日

一文看懂深度学习在语音合成&增强上的应用

一文看懂深度学习在语音合成&增强上的应用

数盟

11+阅读 · 2017年9月13日

微信美女研究员：详解CNN在语音识别中的应用

微信美女研究员：详解CNN在语音识别中的应用

机械鸡

13+阅读 · 2017年7月28日

相关基金

面向语音表示及分离的结构化深度学习研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于压缩感知的单通道混合语音分离理论及算法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于深度神经网络的噪声鲁棒性语音识别方法研究

国家自然科学基金

4+阅读 · 2013年12月31日

基于稀疏编码的语音特征增强方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于非线性语音谱分析的单通道语音增强研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于声学矢量传感器阵列和稀疏表示的语音声源方位角估计方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

利用参量结构实现复杂信号环境下盲信号分离方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于情感上下文的视觉语音多模态协同情感分析方法研究

国家自然科学基金

4+阅读 · 2012年12月31日

基于EMD的复杂几何模型处理方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

面向自然环境下语音增强的复数域半盲分离方法研究

国家自然科学基金

0+阅读 · 2009年12月31日

相关论文

A multi-task learning for cavitation detection and cavitation intensity recognition of valve acoustic signals

Arxiv

0+阅读 · 2022年4月20日

CorrGAN: Input Transformation Technique Against Natural Corruptions

Arxiv

0+阅读 · 2022年4月19日

Self-Supervised Equivariant Learning for Oriented Keypoint Detection

Arxiv

0+阅读 · 2022年4月19日

Improving Frame-Online Neural Speech Enhancement with Overlapped-Frame Prediction

Arxiv

0+阅读 · 2022年4月15日

Weakly-supervised Temporal Path Representation Learning with Contrastive Curriculum Learning -- Extended Version

Weakly-supervised Temporal Path Representation Learning with Contrastive Curriculum Learning -- Extended Version

Arxiv

0+阅读 · 2022年4月15日

Max-Margin Contrastive Learning

Max-Margin Contrastive Learning

Arxiv

18+阅读 · 2021年12月21日

Spatially Consistent Representation Learning

Arxiv

14+阅读 · 2021年3月10日

Directional Graph Networks

Directional Graph Networks

Arxiv

27+阅读 · 2020年12月10日

Learning Latent Representations to Influence Multi-Agent Interaction

Arxiv

11+阅读 · 2020年11月12日

Event Extraction with Generative Adversarial Imitation Learning

Arxiv

13+阅读 · 2018年4月21日

微信扫码咨询专知VIP会员