项目名称: 语音识别中的稀疏性深度学习
项目编号: No.61371136
项目类型: 面上项目
立项/批准年度: 2013
项目学科: 无线电电子学、电信技术
项目作者: 王东
作者单位: 清华大学
项目金额: 74万元
中文摘要: 基于深度学习(Deep Learning)的深层贝叶斯网络技术(Deep Bayesian Network, DBN)为语音识别带来极为显著的性能提高,被认为是语音领域的又一次革命。然而,当前的DBN方法只有在大数据集上才能发挥其效能,并容易受到噪声和信道变化的干扰。DBN的这些困难很大程度上可以归因于其全结点连接结构带来的弱先验约束。本项目提出稀疏性深度学习方法,利用稀疏编码(Sparse Coding)理论,通过在DBN的特征或结构中加入稀疏性约束,使学习得到的网络更简洁,更具有对语音信号模式的代表性,因而降低对大规模训练数据的依赖,并增加对噪声和信道变化的鲁棒性。同时,DBN的深层结构可以使我们得以系统研究稀疏性层次化语音模式。
中文关键词: 语音识别;深度学习;;;
英文摘要: The deep Bayesian network (DBN) approach has demonstrated significant performance improvement for speech recognition, and has been regarded as a new tehcnical revolution in speech research. Nevertheless, the present DBN approach heavily relies on large am
英文关键词: speech recognition;deep learning;;;