项目名称: 声纹识别中合成语音的鲁棒性研究
项目编号: No.60970161
项目类型: 面上项目
立项/批准年度: 2010
项目学科: 金属学与金属工艺
项目作者: 郭武
作者单位: 中国科学技术大学
项目金额: 30万元
中文摘要: 相对自然语音,合成语音的缺陷主要在于表现力较弱。受音库限制,合成语音的底层参数变化模式较少,整体情感和风格较平淡,口语特性和个性特征也不强。基于以上存在的问题,本项目拟从底层参数变异性、情感、风格和个性的差异来区分合成语音和自然语音。首先,通过对语义规整,以声学、基频参数的高阶统计量来计算底层参数变异性;其次,通过对韵律特征建模来展示语音中情感和风格的多样性;再次,通过语义信息和非语义信息并行的方式来识别发音习惯,以发音习惯来体现个性差异。在这些算法的基础上,通过多层面的信息融合最终实现区分合成语音和自然语音的原型系统。 在采用语音合成技术进行信息隐藏和信息欺骗已经成为现实的情况下,有效地区分合成语音和自然语音,对自动声纹识别的应用有非常重要的工程价值;同时本项目的研究对于推动声纹识别技术的进一步发展也具有一定的理论意义。
中文关键词: 说话人识别;基于隐马尔可夫语音合成;韵律;发音差异性;
英文摘要:
英文关键词: Speaker verification;HMM-based speech synthesis;prosodic;pronunciation variability;