项目名称: 藏语语音合成关键技术研究
项目编号: No.61165010
项目类型: 地区科学基金项目
立项/批准年度: 2012
项目学科: 自动化学科
项目作者: 赵栋材
作者单位: 西藏大学
项目金额: 43万元
中文摘要: 语音合成是实现文本信息到语音转换的技术,是实现智能人机交互的核心技术之一,其应用已深入到语音教育、语音交互软件与终端等人们日常生活和工作的方方面面。藏语语音合成研究起步较晚,制约其发展的关键技术尚未解决。本项目以基于隐马尔可夫模型(HMM)的统计声学建模藏语语音合成技术为研究目标,分别从前端藏文文本分析和后端藏语语音合成两个阶段开展研究,前端研究藏文文本在语言层、语法层、语义层的处理,即藏文文本转换成层次化的语音学表征,后端研究基于输入的层次化语音表征来合成藏语语音。重点解决面向拉萨语合成的韵律标注规则、藏语音素上下文属性及用于决策树聚类的问题集设计、结合藏语发音特点的谱参数和HMM状态数目优化、STRAIGHT声码器等关键技术,最终形成完善的藏语语音合成技术解决方案,从而加快藏语语音合成工程化的步伐,率先占领该领域的至高点,以此驳斥西方敌对势力和达赖分裂集团散布的"藏民族文化毁灭论"。
中文关键词: 藏语合成;合成系统;发音规律;韵律文本;问题集
英文摘要:
英文关键词: Tibetan synthesis;synthetic system;Pronunciation rule;Prosodic text;Problem sets