项目名称: 混合口音语音识别中自适应分层发音变异模型研究
项目编号: No.60975018
项目类型: 面上项目
立项/批准年度: 2010
项目学科: 自动化技术、计算机技术
项目作者: 刘轶
作者单位: 清华大学
项目金额: 27万元
中文摘要: 本课题提出并研究自适应分层发音变异模型在混合口音语音识别上的应用。根据混合口音发音变异的单方向性和非对称性特点,建立二维发音变异平面,采用置信度准则和非对称距离在多状态多高斯分布的模型上度量方法对变异程度的高低进行描述,构造四类发音变异模型子空间,实现发音变异模型的分层描述方法。同时,采用数据驱动和规则相结合及语音学和语言学知识相结合的方法,对基本发音单元构造自适应辅助决策树,实现发音变异模型对具有不同发音变异复杂度的自适应描述。由于发音变异不仅仅存在于口音中,也存在于各种自发式语音中,包括对话语音,讲座语音,访谈语音等。因此本课题的研究既针对语音识别技术的应用需求,也为口音及其他自发式语音识别研究提供新思路和新方法。
中文关键词: 混合口音语音识别;自适应分层发音变异模型;;;
英文摘要:
英文关键词: Mixed accented speech recognit;adaptive layered pronunciation;;;