项目名称: 音频信号处理中基于模型的语音与音乐信号分离算法
项目编号: No.60901061
项目类型: 青年科学基金项目
立项/批准年度: 2010
项目学科: 金属学与金属工艺
项目作者: 郑能恒
作者单位: 深圳大学
项目金额: 18万元
中文摘要: 基于内容的音频信息检索是网络多媒体信息服务的关键技术之一,具有广泛的应用前景。当前音频信息检索的主要技术瓶颈之一是语音与音乐混叠信号的分离。不同信号的混叠导致语音/音乐识别与归类准确率的下降,从而降低检索结果的可靠性。本项目拟研究一种可靠的信号分离算法,用于从混叠信号中分离出语音与音乐,从而提高语音识别的准确率,最终达到可靠、高效的音频检索的目标。针对本项目所处理的音频文件的特性,我们提出一种基于模型的分离算法。首先通过音频分割算法在一个音频文件中分割出纯语音、纯音乐、以及语音与音乐混叠信号。在此基础上,通过信号分析与建模技术,获得关于纯语音的和纯音乐的可区分、可分离的特征参数及其模型。根据同一段音频流内同类信号之间的相关性,这些模型提供了混叠信号对应成分的先验知识。利用这些先验知识,实现语音与音乐信号的有效分离。
中文关键词: 语音分离;噪声估计;语音识别;非负矩阵分解;隐马尔科夫模型
英文摘要:
英文关键词: speech separation;noise estimation;speech recognition;non-negative matrix factorizat;hidden Markov model