项目名称: 结合发音动作参数的统计建模语音合成方法研究
项目编号: No.60905010
项目类型: 青年科学基金项目
立项/批准年度: 2010
项目学科: 金属学与金属工艺
项目作者: 凌震华
作者单位: 中国科学技术大学
项目金额: 19万元
中文摘要: 对语音合成系统音色特征的灵活控制是语音合成技术发展的一个重要方向。传统的大语料库拼接合成方法和基于声学统计模型的参数语音合成方法已经能够较好的解决语音合成的自然度与可懂度问题;但在语音合成的灵活性上,这两种方法会受到对训练数据的依赖性强、难以融合语音学知识等问题的制约。发音动作参数作为声学参数之外的一种语音表征方式,描述的是说话人发音过程中舌、唇等发音器官的位置与运动情况,它相比声学参数具有更加明确的生理意义,可以通过语音学发音规则直接控制,这为实现灵活可控的语音合成提供了一条新的思路。本项目旨在将发音动作参数引入基于隐马尔科夫模型的参数语音合成方面进行探索性的研究,希望通过对声学参数与发音动作参数的联合建模,将语音生成机理融入合成系统中,实现由语音学知识驱动的可控制语音合成方法,这在丰富语音信号的建模方法、促进语音学研究与言语工程的结合方面也具有重要意义。
中文关键词: 语音合成;隐马尔科夫模型;声学参数;发音动作参数;
英文摘要:
英文关键词: speech synthesis;hidden Markov model;acoustic feature;articulatory feature;