文本到语音(Text to speech, TTS)是人工智能领域的一个研究热点,已成为业界的一项重要产品服务。近年来,随着深度学习和人工智能的发展,基于神经网络的TTS技术大大提高了合成语音的质量。在本教程中,我们将介绍神经文本到语音,它由四个部分组成。在第一部分,我们将简要概述TTS技术的历史。在第二部分,我们将介绍神经TTS的关键组成部分,包括文本分析,声学模型和声码器。在第三部分中,我们将回顾推动TTS研究前沿和涵盖实用TTS产品的工作,包括端到端TTS、非自回归和轻量级TTS、鲁棒/表达/可控TTS、低资源TTS和自定义语音自适应。在本教程的最后,我们将描述TTS的几个挑战,并讨论未来的研究方向。

成为VIP会员查看完整内容
27

相关内容

ICASSP(International Conference on Acoustics, Speech and Signal Processing)即国际声学、语音与信号处理会议,是全世界最大的,也是最全面的信号处理及其应用方面的顶级会议。
【IEEE ICASSP 2022教程】非负矩阵分解的最新进展,266页ppt
专知会员服务
74+阅读 · 2022年5月28日
《机器学习的最优传输》教程,63页PPT
专知会员服务
61+阅读 · 2022年4月30日
如何提取关键词?ECIR2022最新《关键词提取》教程,
专知会员服务
29+阅读 · 2022年4月11日
微软《神经语音合成》综述论文,63页pdf530篇文献
专知会员服务
29+阅读 · 2021年7月3日
【NAACL2021】Graph4NLP:图深度学习自然语言处理,附239页ppt
专知会员服务
105+阅读 · 2021年6月12日
ICASSP 2022 | 腾讯AI Lab解读14篇入选论文
腾讯AI实验室
1+阅读 · 2022年5月7日
【微软亚研130PPT教程】强化学习简介
专知
36+阅读 · 2018年10月26日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
16+阅读 · 2021年7月18日
Arxiv
14+阅读 · 2021年6月30日
Arxiv
22+阅读 · 2018年8月30日
Arxiv
10+阅读 · 2018年3月22日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员