项目名称: 基于分段条件随机场的连续语音识别技术
项目编号: No.61175017
项目类型: 面上项目
立项/批准年度: 2012
项目学科: 自动化技术、计算机技术
项目作者: 屈丹
作者单位: 中国人民解放军信息工程大学
项目金额: 58万元
中文摘要: 连续语音识别技术对国家信息安全有重要的意义。当前主流的基于连续密度隐马尔可夫模型(CDHMM)的大词汇量连续语音识别方法没有考虑人的思维认知过程,忽略了很多高层知识,因此可以提高的性能有限。因此,需要研究多元、多颗粒度信息整合的连续语音识别框架、模型和技术。分段条件随机场(SCRF)在多层次信息有效整合方面具有独特优势,因此,本项目主要研究基于分段条件随机场的连续语音识别模型及关键技术。首先在语音信息表示机理方面,研究多元、多颗粒度信息特征表示方法,包括新型模板匹配识别、点过程模型、说话人自适应等信息的表示;其次研究分段条件随机场的信息整合机制,减少对整合信息的条件限制;最后将多种信息最大限度地整合到分段条件随机场,实现更符合人类思维认知的连续语音识别。本项目研究将有望解决HMM模型连续语音识别面临的瓶颈问题,丰富语音识别的理论算法,为从深层次、多角度认知与语音提供有效手段。
中文关键词: 分段条件随机场;语音属性检测;点过程模型;说话人自适应;深度神经网络
英文摘要:
英文关键词: Segmental conditional random fields(SCRF);Speech attribute detection;Point process model(PPM);Speaker adaptation;Deep neural network