【2023新书】神经文本到语音合成，214页pdf - 专知VIP

会员服务 ·

23

语音合成 · 神经网络 · 书籍 ·

2023 年 6 月 9 日

【2023新书】神经文本到语音合成，214页pdf

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

语音合成（TTS）旨在根据给定的文本合成可理解和自然的语音。这是语言，语音和机器学习研究的热门话题，并在工业中有广泛的应用。本书介绍了深度学习时代的基于神经网络的TTS，旨在提供对神经TTS，当前的研究和应用以及未来研究趋势的良好理解。

本书首先介绍了TTS技术的历史和神经TTS的概览，并提供了关于语言和语音处理，神经网络和深度学习以及深度生成模型的初步知识。然后从关键组件（文本分析，声学模型，声码器和端到端模型）和高级话题（富有表现力和可控，稳健，模型高效，和数据高效的TTS）的角度介绍了神经TTS。它还指出了一些未来的研究方向，并收集了一些与TTS相关的资源。

本书是第一本全面且易于理解地介绍神经TTS的书籍，既可服务于从事TTS工作的学术研究者，也可服务于行业从业者。

成为VIP会员查看完整内容

39

相关内容

语音合成

语音合成（Speech Synthesis），也称为文语转换（Text-to-Speech, TTS,它是将任意的输入文本转换成自然流畅的语音输出。语音合成涉及到人工智能、心理学、声学、语言学、数字信号处理、计算机科学等多个学科技术，是信息处理领域中的一项前沿技术。随着计算机技术的不断提高，语音合成技术从早期的共振峰合成,逐步发展为波形拼接合成和统计参数语音合成，再发展到混合语音合成；合成语音的质量、自然度已经得到明显提高，基本能满足一些特定场合的应用需求。目前，语音合成技术在银行、医院等的信息播报系统、汽车导航系统、自动应答呼叫中心等都有广泛应用，取得了巨大的经济效益。另外，随着智能手机、MP3、PDA 等与我们生活密切相关的媒介的大量涌现，语音合成的应用也在逐渐向娱乐、语音教学、康复治疗等领域深入。可以说语音合成正在影响着人们生活的方方面面。

85页pdf最新版！《大语言模型综述》

85页pdf最新版！《大语言模型综述》

专知会员服务

174+阅读 · 2023年7月7日

控制大型语言模型: 从我们不完全理解的模型中生成(有用)文本，114页pdf

控制大型语言模型: 从我们不完全理解的模型中生成(有用)文本，114页pdf

专知会员服务

64+阅读 · 2023年6月5日

【2023新书】现实世界中的自然语言处理：文本处理、分析和分类，393页pdf

【2023新书】现实世界中的自然语言处理：文本处理、分析和分类，393页pdf

专知会员服务

112+阅读 · 2023年5月25日

【2023新书】深度学习中的可解释性，486页pdf

【2023新书】深度学习中的可解释性，486页pdf

专知会员服务

155+阅读 · 2023年5月12日

【2022新书】文本与知识库问答系统，208页pdf

【2022新书】文本与知识库问答系统，208页pdf

专知会员服务

81+阅读 · 2022年11月14日

【Manning新书】自然语言处理入门，458页pdf

【Manning新书】自然语言处理入门，458页pdf

专知会员服务

116+阅读 · 2022年9月22日

【微软亚研ICASSP 2022 教程】神经文本语音合成，107页ppt

【微软亚研ICASSP 2022 教程】神经文本语音合成，107页ppt

专知会员服务

28+阅读 · 2022年5月25日

自然语言处理现代方法，176页pdf

自然语言处理现代方法，176页pdf

专知会员服务

269+阅读 · 2021年2月22日

【新书】自然语言处理表示学习技术，349页pdf，清华大学

【新书】自然语言处理表示学习技术，349页pdf，清华大学

专知会员服务

174+阅读 · 2020年7月11日

【干货书】深度学习生命科学：基因组学、药物发现，238页pdf

【干货书】深度学习生命科学：基因组学、药物发现，238页pdf

专知会员服务

200+阅读 · 2020年3月18日

【2022新书】文本与知识库问答系统，208页pdf

【2022新书】文本与知识库问答系统，208页pdf

专知

4+阅读 · 2022年11月14日

【Manning2022新书】深度学习自然语言处理，296页pdf

【Manning2022新书】深度学习自然语言处理，296页pdf

专知

9+阅读 · 2022年10月25日

【Manning新书】自然语言处理入门，458页pdf

【Manning新书】自然语言处理入门，458页pdf

专知

27+阅读 · 2022年9月22日

【2022新书】Python数据分析第三版，579页pdf

【2022新书】Python数据分析第三版，579页pdf

专知

19+阅读 · 2022年8月31日

【2022新书】深度学习生物医学应用：从医疗影像到药物发现，333页pdf

【2022新书】深度学习生物医学应用：从医疗影像到药物发现，333页pdf

专知

4+阅读 · 2022年8月30日

滑铁卢大学2020新书《预训练Transformer模型文本排序》，155页pdf

滑铁卢大学2020新书《预训练Transformer模型文本排序》，155页pdf

专知

10+阅读 · 2020年10月19日

【实用书】Python文本分析第二版，688页pdf带你入门自然语言处理

【实用书】Python文本分析第二版，688页pdf带你入门自然语言处理

专知

25+阅读 · 2020年5月15日

【新书】深度学习搜索，Deep Learning for Search，327页pdf

【新书】深度学习搜索，Deep Learning for Search，327页pdf

专知

85+阅读 · 2020年1月19日

【教程】语音识别中的End-to-End模型教程（附178页PDF全文下载）

【教程】语音识别中的End-to-End模型教程（附178页PDF全文下载）

专知

24+阅读 · 2018年11月21日

一文看懂深度学习在语音合成&增强上的应用

一文看懂深度学习在语音合成&增强上的应用

数盟

11+阅读 · 2017年9月13日

面向汉语文本理解的语义计算方法

国家自然科学基金

8+阅读 · 2014年12月31日

文本情绪分析中的关键问题研究

国家自然科学基金

3+阅读 · 2012年12月31日

汉藏双语个性化多语种语音合成中的语言建模的研究

国家自然科学基金

0+阅读 · 2012年12月31日

融合语音产生机理与统计声学建模的层次化语音合成方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

傣语文本分析与语音合成研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于动作概念的本体知识库及在文本处理上的应用

国家自然科学基金

7+阅读 · 2012年12月31日

基于数据驱动的中文自然语言生成关键技术研究

国家自然科学基金

7+阅读 · 2012年12月31日

大型语义辞典的自动生成及在文本分析中的应用

国家自然科学基金

1+阅读 · 2012年12月31日

结合发音动作参数的统计建模语音合成方法研究

国家自然科学基金

0+阅读 · 2009年12月31日

汉语文语转换中语义与表现力联合建模

国家自然科学基金

0+阅读 · 2008年12月31日

Identifiability of causal graphs under nonadditive conditionally parametric causal models

Arxiv

0+阅读 · 2023年7月29日

Generative AI for Medical Imaging: extending the MONAI Framework

Arxiv

1+阅读 · 2023年7月27日

Is Prompt All You Need? No. A Comprehensive and Broader View of Instruction Learning

Is Prompt All You Need? No. A Comprehensive and Broader View of Instruction Learning

Arxiv

20+阅读 · 2023年3月21日

A Survey of Explainable Graph Neural Networks: Taxonomy and Evaluation Metrics

Arxiv

14+阅读 · 2022年7月26日

Fine-Grained Neural Network Explanation by Identifying Input Features with Predictive Information

Arxiv

10+阅读 · 2021年10月4日

Temporal Graph Networks for Deep Learning on Dynamic Graphs

Arxiv

37+阅读 · 2020年10月9日

Hierarchical Graph Pooling with Structure Learning

Arxiv

13+阅读 · 2019年11月14日

AdaGCN: Adaboosting Graph Convolutional Networks into Deep Models

Arxiv

11+阅读 · 2019年8月14日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

An Interpretable Reasoning Network for Multi-Relation Question Answering

Arxiv

17+阅读 · 2018年1月15日

VIP会员

相关主题

相关VIP内容

85页pdf最新版！《大语言模型综述》

85页pdf最新版！《大语言模型综述》

专知会员服务

174+阅读 · 2023年7月7日

控制大型语言模型: 从我们不完全理解的模型中生成(有用)文本，114页pdf

控制大型语言模型: 从我们不完全理解的模型中生成(有用)文本，114页pdf

专知会员服务

64+阅读 · 2023年6月5日

【2023新书】现实世界中的自然语言处理：文本处理、分析和分类，393页pdf

【2023新书】现实世界中的自然语言处理：文本处理、分析和分类，393页pdf

专知会员服务

112+阅读 · 2023年5月25日

【2023新书】深度学习中的可解释性，486页pdf

【2023新书】深度学习中的可解释性，486页pdf

专知会员服务

155+阅读 · 2023年5月12日

【2022新书】文本与知识库问答系统，208页pdf

【2022新书】文本与知识库问答系统，208页pdf

专知会员服务

81+阅读 · 2022年11月14日

【Manning新书】自然语言处理入门，458页pdf

【Manning新书】自然语言处理入门，458页pdf

专知会员服务

116+阅读 · 2022年9月22日

【微软亚研ICASSP 2022 教程】神经文本语音合成，107页ppt

【微软亚研ICASSP 2022 教程】神经文本语音合成，107页ppt

专知会员服务

28+阅读 · 2022年5月25日

自然语言处理现代方法，176页pdf

自然语言处理现代方法，176页pdf

专知会员服务

269+阅读 · 2021年2月22日

【新书】自然语言处理表示学习技术，349页pdf，清华大学

【新书】自然语言处理表示学习技术，349页pdf，清华大学

专知会员服务

174+阅读 · 2020年7月11日

【干货书】深度学习生命科学：基因组学、药物发现，238页pdf

【干货书】深度学习生命科学：基因组学、药物发现，238页pdf

专知会员服务

200+阅读 · 2020年3月18日

热门VIP内容

开通专知VIP会员享更多权益服务

Deep Research（深度研究）：系统性综述

《革新战术战场空间能力：反无人机系统》报告

【普林斯顿博士论文】用于语音的生成式通用模型

螺旋式开发作为战略资产：美军启示

相关资讯

【2022新书】文本与知识库问答系统，208页pdf

【2022新书】文本与知识库问答系统，208页pdf

专知

4+阅读 · 2022年11月14日

【Manning2022新书】深度学习自然语言处理，296页pdf

【Manning2022新书】深度学习自然语言处理，296页pdf

专知

9+阅读 · 2022年10月25日

【Manning新书】自然语言处理入门，458页pdf

【Manning新书】自然语言处理入门，458页pdf

专知

27+阅读 · 2022年9月22日

【2022新书】Python数据分析第三版，579页pdf

【2022新书】Python数据分析第三版，579页pdf

专知

19+阅读 · 2022年8月31日

【2022新书】深度学习生物医学应用：从医疗影像到药物发现，333页pdf

【2022新书】深度学习生物医学应用：从医疗影像到药物发现，333页pdf

专知

4+阅读 · 2022年8月30日

滑铁卢大学2020新书《预训练Transformer模型文本排序》，155页pdf

滑铁卢大学2020新书《预训练Transformer模型文本排序》，155页pdf

专知

10+阅读 · 2020年10月19日

【实用书】Python文本分析第二版，688页pdf带你入门自然语言处理

【实用书】Python文本分析第二版，688页pdf带你入门自然语言处理

专知

25+阅读 · 2020年5月15日

【新书】深度学习搜索，Deep Learning for Search，327页pdf

【新书】深度学习搜索，Deep Learning for Search，327页pdf

专知

85+阅读 · 2020年1月19日

【教程】语音识别中的End-to-End模型教程（附178页PDF全文下载）

【教程】语音识别中的End-to-End模型教程（附178页PDF全文下载）

专知

24+阅读 · 2018年11月21日

一文看懂深度学习在语音合成&增强上的应用

一文看懂深度学习在语音合成&增强上的应用

数盟

11+阅读 · 2017年9月13日

相关基金

面向汉语文本理解的语义计算方法

国家自然科学基金

8+阅读 · 2014年12月31日

文本情绪分析中的关键问题研究

国家自然科学基金

3+阅读 · 2012年12月31日

汉藏双语个性化多语种语音合成中的语言建模的研究

国家自然科学基金

0+阅读 · 2012年12月31日

融合语音产生机理与统计声学建模的层次化语音合成方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

傣语文本分析与语音合成研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于动作概念的本体知识库及在文本处理上的应用

国家自然科学基金

7+阅读 · 2012年12月31日

基于数据驱动的中文自然语言生成关键技术研究

国家自然科学基金

7+阅读 · 2012年12月31日

大型语义辞典的自动生成及在文本分析中的应用

国家自然科学基金

1+阅读 · 2012年12月31日

结合发音动作参数的统计建模语音合成方法研究

国家自然科学基金

0+阅读 · 2009年12月31日

汉语文语转换中语义与表现力联合建模

国家自然科学基金

0+阅读 · 2008年12月31日

相关论文

Identifiability of causal graphs under nonadditive conditionally parametric causal models

Arxiv

0+阅读 · 2023年7月29日

Generative AI for Medical Imaging: extending the MONAI Framework

Arxiv

1+阅读 · 2023年7月27日

Is Prompt All You Need? No. A Comprehensive and Broader View of Instruction Learning

Is Prompt All You Need? No. A Comprehensive and Broader View of Instruction Learning

Arxiv

20+阅读 · 2023年3月21日

A Survey of Explainable Graph Neural Networks: Taxonomy and Evaluation Metrics

Arxiv

14+阅读 · 2022年7月26日

Fine-Grained Neural Network Explanation by Identifying Input Features with Predictive Information

Arxiv

10+阅读 · 2021年10月4日

Temporal Graph Networks for Deep Learning on Dynamic Graphs

Arxiv

37+阅读 · 2020年10月9日

Hierarchical Graph Pooling with Structure Learning

Arxiv

13+阅读 · 2019年11月14日

AdaGCN: Adaboosting Graph Convolutional Networks into Deep Models

Arxiv

11+阅读 · 2019年8月14日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

An Interpretable Reasoning Network for Multi-Relation Question Answering

Arxiv

17+阅读 · 2018年1月15日

微信扫码咨询专知VIP会员