项目名称: 结合发音动作参数的统计建模语音合成方法研究

项目编号: No.60905010

项目类型: 青年科学基金项目

立项/批准年度: 2010

项目学科: 金属学与金属工艺

项目作者: 凌震华

作者单位: 中国科学技术大学

项目金额: 19万元

中文摘要: 对语音合成系统音色特征的灵活控制是语音合成技术发展的一个重要方向。传统的大语料库拼接合成方法和基于声学统计模型的参数语音合成方法已经能够较好的解决语音合成的自然度与可懂度问题;但在语音合成的灵活性上,这两种方法会受到对训练数据的依赖性强、难以融合语音学知识等问题的制约。发音动作参数作为声学参数之外的一种语音表征方式,描述的是说话人发音过程中舌、唇等发音器官的位置与运动情况,它相比声学参数具有更加明确的生理意义,可以通过语音学发音规则直接控制,这为实现灵活可控的语音合成提供了一条新的思路。本项目旨在将发音动作参数引入基于隐马尔科夫模型的参数语音合成方面进行探索性的研究,希望通过对声学参数与发音动作参数的联合建模,将语音生成机理融入合成系统中,实现由语音学知识驱动的可控制语音合成方法,这在丰富语音信号的建模方法、促进语音学研究与言语工程的结合方面也具有重要意义。

中文关键词: 语音合成;隐马尔科夫模型;声学参数;发音动作参数;

英文摘要:

英文关键词: speech synthesis;hidden Markov model;acoustic feature;articulatory feature;

成为VIP会员查看完整内容
0

相关内容

语音合成(Speech Synthesis),也称为文语转换(Text-to-Speech, TTS,它是将任意的输入文本转换成自然流畅的语音输出。语音合成涉及到人工智能、心理学、声学、语言学、数字信号处理、计算机科学等多个学科技术,是信息处理领域中的一项前沿技术。 随着计算机技术的不断提高,语音合成技术从早期的共振峰合成,逐步发展为波形拼接合成和统计参数语音合成,再发展到混合语音合成;合成语音的质量、自然度已经得到明显提高,基本能满足一些特定场合的应用需求。目前,语音合成技术在银行、医院等的信息播报系统、汽车导航系统、自动应答呼叫中心等都有广泛应用,取得了巨大的经济效益。 另外,随着智能手机、MP3、PDA 等与我们生活密切相关的媒介的大量涌现,语音合成的应用也在逐渐向娱乐、语音教学、康复治疗等领域深入。可以说语音合成正在影响着人们生活的方方面面。
多语言语音识别声学模型建模方法最新进展
专知会员服务
32+阅读 · 2022年2月7日
专知会员服务
29+阅读 · 2021年8月16日
专知会员服务
97+阅读 · 2021年6月23日
专知会员服务
24+阅读 · 2021年6月22日
专知会员服务
35+阅读 · 2021年5月10日
专知会员服务
57+阅读 · 2021年5月4日
基于生理信号的情感计算研究综述
专知会员服务
61+阅读 · 2021年2月9日
【文本分类大综述:从浅层到深度学习,35页pdf】
专知会员服务
187+阅读 · 2020年8月6日
【经典书】精通机器学习特征工程,中文版,178页pdf
专知会员服务
354+阅读 · 2020年2月15日
语音合成:模拟最像人类声音的系统
PaperWeekly
2+阅读 · 2021年11月30日
SFFAI分享 | 连政:端到端语音合成【附PPT与视频资料】
人工智能前沿讲习班
14+阅读 · 2019年6月16日
SFFAI分享 | 黄健:语音情感识别【附PPT与视频资料】
人工智能前沿讲习班
30+阅读 · 2019年6月11日
SFFAI 31 报名通知 | 情感语音识别与合成
人工智能前沿讲习班
17+阅读 · 2019年5月30日
语音识别之--韩语语音识别
微信AI
15+阅读 · 2017年8月2日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
Simple and Effective Unsupervised Speech Synthesis
Arxiv
2+阅读 · 2022年4月20日
Arxiv
15+阅读 · 2021年12月22日
Arxiv
14+阅读 · 2021年6月30日
Self-Driving Cars: A Survey
Arxiv
41+阅读 · 2019年1月14日
Arxiv
25+阅读 · 2018年1月24日
小贴士
相关VIP内容
多语言语音识别声学模型建模方法最新进展
专知会员服务
32+阅读 · 2022年2月7日
专知会员服务
29+阅读 · 2021年8月16日
专知会员服务
97+阅读 · 2021年6月23日
专知会员服务
24+阅读 · 2021年6月22日
专知会员服务
35+阅读 · 2021年5月10日
专知会员服务
57+阅读 · 2021年5月4日
基于生理信号的情感计算研究综述
专知会员服务
61+阅读 · 2021年2月9日
【文本分类大综述:从浅层到深度学习,35页pdf】
专知会员服务
187+阅读 · 2020年8月6日
【经典书】精通机器学习特征工程,中文版,178页pdf
专知会员服务
354+阅读 · 2020年2月15日
相关资讯
语音合成:模拟最像人类声音的系统
PaperWeekly
2+阅读 · 2021年11月30日
SFFAI分享 | 连政:端到端语音合成【附PPT与视频资料】
人工智能前沿讲习班
14+阅读 · 2019年6月16日
SFFAI分享 | 黄健:语音情感识别【附PPT与视频资料】
人工智能前沿讲习班
30+阅读 · 2019年6月11日
SFFAI 31 报名通知 | 情感语音识别与合成
人工智能前沿讲习班
17+阅读 · 2019年5月30日
语音识别之--韩语语音识别
微信AI
15+阅读 · 2017年8月2日
相关基金
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
相关论文
微信扫码咨询专知VIP会员