基于压缩感知的单通道混合语音分离理论及算法研究 - 专知基金

会员服务 ·

0

语音分离 · 压缩感知 · 稀疏分解 · 字典学习 ·

2013 年 12 月 31 日

基于压缩感知的单通道混合语音分离理论及算法研究

国家自然科学基金

国家自然科学基金委员会

项目名称： 基于压缩感知的单通道混合语音分离理论及算法研究

项目编号： No.61302152

项目类型： 青年科学基金项目

立项/批准年度： 2014

项目学科： 无线电电子学、电信技术

项目作者： 郭海燕

作者单位： 东南大学

项目金额： 24万元

中文摘要： 一直以来，单通道混合语音分离都是语音信号处理的重要研究方向。近几年来出现的研究热点—压缩感知，为单通道混合语音分离的研究提供了新的思路。本项目先基于压缩感知，研究单通道混合语音准确分离的理论条件，包括：新的基于压缩感知的单通道混合语音分离建模方法，准确分离和准确重构的等价条件分析和准确重构条件的理论分析。在此理论基础上，本项目还研究设计实用的基于压缩感知的单通道混合语音分离算法，包括：适用于小规模训练数据的语音信号自适应稀疏基的构造算法，基于改进阶梯正交匹配追踪的快速分离算法，和针对含清音混合语音帧的双重分离方案。本项目的研究成果可广泛用于语音增强、鲁棒语音识别、鲁棒说话人识别、电话会议、助听器设计等领域。

中文关键词： 语音分离；压缩感知；稀疏分解；字典学习；

英文摘要： Compressed sensing (CS), emerged in recent years, can provide a new way to solve the problem of single-channel Speech Separation(SCSS), which is a vital issue of speech signal processing. Therefore, we put our research focuses on CS-based SCSS techniques. The research includes two parts. One is to discuss the conditions of exact CS-based separation, including new CS-based SCSS modelling, the analysis of conditions in which the exact separation problem is equivant to the exact recovery problem and the analysis of exact recovery conditions.The other is to design practical CS-based separation methods, including an adaptive basis construction algorithm suitable for small-scale training data,a fast CS-SCSS algorithm based on improved stagewise orthogonal matching pursuit and a double separation scheme for unvoied/voiced speech mixture. Our achievements in this program can be widely applied to speech enhancement, robust speech recognition, robust speaker recognition, teleconference, hearing aid design and so on.

英文关键词： speech separation；compressed sensing；sparse decomposition；dictionary learning；

成为VIP会员查看完整内容

0

相关内容

语音分离

不可错过！斯坦福《语音语言处理》技术课程

不可错过！斯坦福《语音语言处理》技术课程

专知会员服务

41+阅读 · 2022年5月2日

多语言语音识别声学模型建模方法最新进展

多语言语音识别声学模型建模方法最新进展

专知会员服务

36+阅读 · 2022年2月7日

监控视频的异常检测与建模综述

监控视频的异常检测与建模综述

专知会员服务

49+阅读 · 2021年12月27日

NeurIPS 2021 | 华为诺亚Oral论文：基于频域的二值神经网络训练方法

NeurIPS 2021 | 华为诺亚Oral论文：基于频域的二值神经网络训练方法

专知会员服务

16+阅读 · 2021年12月16日

面向任务型的对话系统研究进展

面向任务型的对话系统研究进展

专知会员服务

59+阅读 · 2021年11月17日

【ICML2021】随机傅立叶特征的量化算法

专知会员服务

25+阅读 · 2021年7月31日

三维点云配准方法研究进展

专知会员服务

34+阅读 · 2021年7月25日

【NAACL2021】长序列自然语言处理, 250页ppt

【NAACL2021】长序列自然语言处理, 250页ppt

专知会员服务

62+阅读 · 2021年6月7日

基于深度学习的信源信道联合编码方法综述

专知会员服务

31+阅读 · 2021年1月9日

基于深度神经网络的少样本学习综述

基于深度神经网络的少样本学习综述

专知会员服务

173+阅读 · 2020年4月22日

不可错过！斯坦福《语音语言处理》技术课程

不可错过！斯坦福《语音语言处理》技术课程

专知

1+阅读 · 2022年5月2日

多语言语音识别声学模型建模方法最新进展

多语言语音识别声学模型建模方法最新进展

专知

2+阅读 · 2022年2月7日

综述：图像滤波常用算法实现及原理解析

综述：图像滤波常用算法实现及原理解析

极市平台

0+阅读 · 2022年1月29日

一文带你了解语音信号处理技术

一文带你了解语音信号处理技术

PaperWeekly

9+阅读 · 2022年1月26日

NeurIPS 2021 | 华为诺亚Oral论文：基于频域的二值神经网络训练方法

NeurIPS 2021 | 华为诺亚Oral论文：基于频域的二值神经网络训练方法

PaperWeekly

1+阅读 · 2021年12月17日

Interspeech 2019 | 基于多模态对齐的语音情感识别

Interspeech 2019 | 基于多模态对齐的语音情感识别

AI科技评论

23+阅读 · 2019年9月21日

语音关键词检测方法综述【附PPT与视频资料】

语音关键词检测方法综述【附PPT与视频资料】

人工智能前沿讲习班

10+阅读 · 2019年2月2日

腾讯AI Lab 8篇论文入选，从0到1解读语音交互能力 | InterSpeech 2018

腾讯AI Lab 8篇论文入选，从0到1解读语音交互能力 | InterSpeech 2018

AI科技评论

12+阅读 · 2018年9月7日

ICASSP最佳学生论文：深度对抗声学模型训练框架

ICASSP最佳学生论文：深度对抗声学模型训练框架

专知

14+阅读 · 2018年4月28日

一文看懂深度学习在语音合成&增强上的应用

一文看懂深度学习在语音合成&增强上的应用

数盟

11+阅读 · 2017年9月13日

基于压缩感知的通信信号处理理论研究

国家自然科学基金

4+阅读 · 2015年12月31日

冗余字典下的压缩感知理论及应用研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于非线性语音谱分析的单通道语音增强研究

国家自然科学基金

0+阅读 · 2013年12月31日

低秩矩阵恢复理论与算法研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于压缩感知的鲁棒性语音情感识别研究

国家自然科学基金

3+阅读 · 2012年12月31日

应用于语音增强的低秩和稀疏矩阵分解模型及算法设计

国家自然科学基金

0+阅读 · 2012年12月31日

基于压缩感知联合稀疏重构的宽带阵列信号处理技术

国家自然科学基金

1+阅读 · 2012年12月31日

基于视听觉信息融合的欠定卷积语音混合信号盲分离及其在机器人听觉系统中应用的研究

国家自然科学基金

1+阅读 · 2011年12月31日

基于智能学习的宽频段无线电测向方法研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于Lp优化的语音压缩感知理论和编码技术的研究

国家自然科学基金

0+阅读 · 2009年12月31日

Learning to Cooperate with Completely Unknown Teammates

Learning to Cooperate with Completely Unknown Teammates

Arxiv

0+阅读 · 2022年5月6日

Online Approval Committee Elections

Arxiv

0+阅读 · 2022年5月6日

Newton-MR: Inexact Newton Method With Minimum Residual Sub-problem Solver

Arxiv

0+阅读 · 2022年5月6日

Faster Meta Update Strategy for Noise-Robust Deep Learning

Arxiv

11+阅读 · 2021年4月30日

Contrastive Triple Extraction with Generative Transformer

Arxiv

13+阅读 · 2021年2月4日

Disentangled Information Bottleneck

Disentangled Information Bottleneck

Arxiv

12+阅读 · 2020年12月22日

Tensor Decompositions for temporal knowledge base completion

Arxiv

10+阅读 · 2020年4月10日

Predictive Engagement: An Efficient Metric For Automatic Evaluation of Open-Domain Dialogue Systems

Predictive Engagement: An Efficient Metric For Automatic Evaluation of Open-Domain Dialogue Systems

Arxiv

11+阅读 · 2019年11月4日

Meta Learning for End-to-End Low-Resource Speech Recognition

Meta Learning for End-to-End Low-Resource Speech Recognition

Arxiv

20+阅读 · 2019年10月26日

Few-shot Learning with Meta Metric Learners

Arxiv

13+阅读 · 2019年1月26日

阅读: 0 点赞: 0

小贴士

登录享主题订阅及个性化推荐

相关主题

热门VIP内容

开通专知VIP会员享更多权益服务

《乌克兰无人机产业：志愿者与政策在构建新兴无人机产业中的协同作用》最新报告

《人工智能辅助决策中的数据可视化：系统性综述》

人工智能驱动弹药制造现代化：美国陆军转型之路

《敏捷作战部署中枢纽-辐条基地选址优化研究》80页

相关VIP内容

不可错过！斯坦福《语音语言处理》技术课程

不可错过！斯坦福《语音语言处理》技术课程

专知会员服务

41+阅读 · 2022年5月2日

多语言语音识别声学模型建模方法最新进展

多语言语音识别声学模型建模方法最新进展

专知会员服务

36+阅读 · 2022年2月7日

监控视频的异常检测与建模综述

监控视频的异常检测与建模综述

专知会员服务

49+阅读 · 2021年12月27日

NeurIPS 2021 | 华为诺亚Oral论文：基于频域的二值神经网络训练方法

NeurIPS 2021 | 华为诺亚Oral论文：基于频域的二值神经网络训练方法

专知会员服务

16+阅读 · 2021年12月16日

面向任务型的对话系统研究进展

面向任务型的对话系统研究进展

专知会员服务

59+阅读 · 2021年11月17日

【ICML2021】随机傅立叶特征的量化算法

专知会员服务

25+阅读 · 2021年7月31日

三维点云配准方法研究进展

专知会员服务

34+阅读 · 2021年7月25日

【NAACL2021】长序列自然语言处理, 250页ppt

【NAACL2021】长序列自然语言处理, 250页ppt

专知会员服务

62+阅读 · 2021年6月7日

基于深度学习的信源信道联合编码方法综述

专知会员服务

31+阅读 · 2021年1月9日

基于深度神经网络的少样本学习综述

基于深度神经网络的少样本学习综述

专知会员服务

173+阅读 · 2020年4月22日

相关资讯

不可错过！斯坦福《语音语言处理》技术课程

不可错过！斯坦福《语音语言处理》技术课程

专知

1+阅读 · 2022年5月2日

多语言语音识别声学模型建模方法最新进展

多语言语音识别声学模型建模方法最新进展

专知

2+阅读 · 2022年2月7日

综述：图像滤波常用算法实现及原理解析

综述：图像滤波常用算法实现及原理解析

极市平台

0+阅读 · 2022年1月29日

一文带你了解语音信号处理技术

一文带你了解语音信号处理技术

PaperWeekly

9+阅读 · 2022年1月26日

NeurIPS 2021 | 华为诺亚Oral论文：基于频域的二值神经网络训练方法

NeurIPS 2021 | 华为诺亚Oral论文：基于频域的二值神经网络训练方法

PaperWeekly

1+阅读 · 2021年12月17日

Interspeech 2019 | 基于多模态对齐的语音情感识别

Interspeech 2019 | 基于多模态对齐的语音情感识别

AI科技评论

23+阅读 · 2019年9月21日

语音关键词检测方法综述【附PPT与视频资料】

语音关键词检测方法综述【附PPT与视频资料】

人工智能前沿讲习班

10+阅读 · 2019年2月2日

腾讯AI Lab 8篇论文入选，从0到1解读语音交互能力 | InterSpeech 2018

腾讯AI Lab 8篇论文入选，从0到1解读语音交互能力 | InterSpeech 2018

AI科技评论

12+阅读 · 2018年9月7日

ICASSP最佳学生论文：深度对抗声学模型训练框架

ICASSP最佳学生论文：深度对抗声学模型训练框架

专知

14+阅读 · 2018年4月28日

一文看懂深度学习在语音合成&增强上的应用

一文看懂深度学习在语音合成&增强上的应用

数盟

11+阅读 · 2017年9月13日

相关基金

基于压缩感知的通信信号处理理论研究

国家自然科学基金

4+阅读 · 2015年12月31日

冗余字典下的压缩感知理论及应用研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于非线性语音谱分析的单通道语音增强研究

国家自然科学基金

0+阅读 · 2013年12月31日

低秩矩阵恢复理论与算法研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于压缩感知的鲁棒性语音情感识别研究

国家自然科学基金

3+阅读 · 2012年12月31日

应用于语音增强的低秩和稀疏矩阵分解模型及算法设计

国家自然科学基金

0+阅读 · 2012年12月31日

基于压缩感知联合稀疏重构的宽带阵列信号处理技术

国家自然科学基金

1+阅读 · 2012年12月31日

基于视听觉信息融合的欠定卷积语音混合信号盲分离及其在机器人听觉系统中应用的研究

国家自然科学基金

1+阅读 · 2011年12月31日

基于智能学习的宽频段无线电测向方法研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于Lp优化的语音压缩感知理论和编码技术的研究

国家自然科学基金

0+阅读 · 2009年12月31日

相关论文

Learning to Cooperate with Completely Unknown Teammates

Learning to Cooperate with Completely Unknown Teammates

Arxiv

0+阅读 · 2022年5月6日

Online Approval Committee Elections

Arxiv

0+阅读 · 2022年5月6日

Newton-MR: Inexact Newton Method With Minimum Residual Sub-problem Solver

Arxiv

0+阅读 · 2022年5月6日

Faster Meta Update Strategy for Noise-Robust Deep Learning

Arxiv

11+阅读 · 2021年4月30日

Contrastive Triple Extraction with Generative Transformer

Arxiv

13+阅读 · 2021年2月4日

Disentangled Information Bottleneck

Disentangled Information Bottleneck

Arxiv

12+阅读 · 2020年12月22日

Tensor Decompositions for temporal knowledge base completion

Arxiv

10+阅读 · 2020年4月10日

Predictive Engagement: An Efficient Metric For Automatic Evaluation of Open-Domain Dialogue Systems

Predictive Engagement: An Efficient Metric For Automatic Evaluation of Open-Domain Dialogue Systems

Arxiv

11+阅读 · 2019年11月4日

Meta Learning for End-to-End Low-Resource Speech Recognition

Meta Learning for End-to-End Low-Resource Speech Recognition

Arxiv

20+阅读 · 2019年10月26日

Few-shot Learning with Meta Metric Learners

Arxiv

13+阅读 · 2019年1月26日

微信扫码咨询专知VIP会员