百度悄然发布Deep Vioce 3

2017 年 10 月 24 日 量子位 专注报道AI

千平发自凹非寺
量子位出品 | 公众号 QbitAI

Deep Vioce又更新了……

在上一代发布五个月后，百度研发的文字转语音（TTS）AI再次升级。这次的版本是Deep Vioce 3。尽管百度官方还没有宣布此事，但相关论文已经发布在arXiv上。

Deep Vioce 3是一个基于注意力的全卷积神经TTS系统。与目前最先进的Tacotron系统相比，Deep Vioce 3训练速度提高了10倍。

百度在Deep Voice 3上，使用了来自超过2000个声源、长达800多个小时的音频进行训练。此外，百度找到了减少错误的方法。以及如何在一个单GPU服务器上，把推断规模化到每天1000万次查询。

与前两代相比，Deep Voice 3采用了基于注意力的序列到序列模型，这个模型的详细架构如下图所示。

其中的注意力模块结构如下图所示。

另外，百度还在论文中公布了模型使用的超参数。

这篇论文的作者包括百度研究院的Wei Ping、Kainan Peng、Andrew Gibiansky、Sercan O. Arık、Ajay Kannan、Sharan Narang。

以及OpenAI的Jonathan Raiman，加州大学伯克利分校的John Miller。

论文地址在此：

https://arxiv.org/pdf/1710.07654.pdf

登录查看更多

相关内容

百度

关注 27

中国互联网公司之一，占有中国搜索引擎市场五成以上的份额。旗下有贴吧、知道、百科、文库等产品。详细资料：百度本话题适用于百度公司及其产品的讨论。

1750亿参数！GPT-3来了！31位作者，OpenAI发布小样本学习器语言模型

专知会员服务

73+阅读 · 2020年5月30日

【Uber AI新论文】持续元学习，Learning to Continually Learn

专知会员服务

37+阅读 · 2020年2月27日

【牛津大学】深度残差强化学习，Deep Residual Reinforcement Learning

专知会员服务

84+阅读 · 2020年2月18日

【北航】深度学习编译器综述|The Deep Learning Compiler: A Comprehensive Survey

专知会员服务

38+阅读 · 2020年2月11日

【新书】深度学习搜索，Deep Learning for Search，附327页pdf

专知会员服务

213+阅读 · 2020年1月13日

2019年自然语言处理NLP亮点总结，29页pdf，NLP Year in Review — 2019 NLP highlights for the year 2019.

专知会员服务

69+阅读 · 2020年1月2日

【论文推荐中科院自动化所】视频游戏中深度强化学习的研究综述，A Survey of Deep Reinforcement Learning in Video

专知会员服务

48+阅读 · 2019年12月24日

【论文推荐】小样本视频合成，Few-shot Video-to-Video Synthesis

专知会员服务

24+阅读 · 2019年12月15日

【AAAI2020论文】小样本网络压缩，Few Shot Network Compression via Cross Distillation (附pdf）

专知会员服务

26+阅读 · 2019年11月23日

Keras François Chollet 《Deep Learning with Python 》, 386页pdf

专知会员服务

160+阅读 · 2019年10月12日

【新书】深度学习搜索，Deep Learning for Search，327页pdf

专知

85+阅读 · 2020年1月19日

哈工大讯飞联合实验室发布中文XLNet预训练模型

哈工大SCIR

13+阅读 · 2019年8月20日

速度提升17.5倍！百度提出语音合成新模型，一个完全并行的神经TTS系统

量子位

6+阅读 · 2019年5月29日

ICML 2019收录774篇论文：谷歌153篇，清华北大26篇

量子位

5+阅读 · 2019年5月12日

Colab 免费提供 Tesla T4 GPU，是时候薅羊毛了

机器之心

10+阅读 · 2019年4月25日

论文公布啦！腾讯AI Lab开源最大规模多标签图像数据集，刷新行业数据集基准

专知

10+阅读 · 2019年1月8日

学界 | 语音合成领域的首个完全端到端模型，百度提出并行音频波形生成模型ClariNet

机器之心

4+阅读 · 2018年7月24日

百度Visual DL 全球首发，各大深度学习框架通吃

算法与数据结构

3+阅读 · 2018年1月18日

Q新闻丨Android Studio 3.0发布，支持 Kotlin；微软开源深度学习库MMLSpark；敏捷开发？真的假的？

InfoQ

3+阅读 · 2017年10月28日

业界 | Facebook开源TTS神经网络VoiceLoop：基于室外声音的语音合成（附PyTorch实现）

机器之心

4+阅读 · 2017年9月5日

Advances and Open Problems in Federated Learning

Arxiv

18+阅读 · 2019年12月10日

Multi-task learning to improve natural language understanding

Arxiv

4+阅读 · 2018年12月17日

Automatic Face Aging in Videos via Deep Reinforcement Learning

Arxiv

4+阅读 · 2018年11月27日

Reciprocal Attention Fusion for Visual Question Answering

Arxiv

5+阅读 · 2018年7月22日

I Have Seen Enough: A Teacher Student Network for Video Classification Using Fewer Frames

Arxiv

8+阅读 · 2018年5月12日

Learning to Extract Coherent Summary via Deep Reinforcement Learning

Arxiv

6+阅读 · 2018年4月19日

Video Captioning via Hierarchical Reinforcement Learning

Arxiv

20+阅读 · 2018年3月29日

Deep Learning for Video Classification and Captioning

Arxiv

9+阅读 · 2018年2月22日

Long-Term Visual Object Tracking Benchmark

Arxiv

7+阅读 · 2017年12月28日

Deep Semantic Role Labeling with Self-Attention

Arxiv

13+阅读 · 2017年12月5日