视频 | 2分钟读懂DeepMind新WaveNet

2018 年 3 月 10 日 AI科技评论 雷锋字幕组

AI 科技评论按:这里是雷锋字幕组编译的 Two minutes paper 专栏,每周带大家用碎片时间阅览前沿技术,了解 AI 领域的最新研究成果。

原标题:DeepMind's WaveNet, 1000 Times Faster | Two Minute Papers #232

翻译 | 李晶 霍雷刚   字幕 | 凡江    整理 | 吴璇  林尤添  


▷每周一篇 2 分钟论文视频解读

本期 2 分钟论文 Parallel WaveNet: Fast High-Fidelity Speech Synthesis,主要介绍了 2017 年最新版的 WaveNet 技术运用的训练方法 Probability Density Distillation ,由该技术虽然不是实时生成,却比实时生成快了 20 倍,产生的系统能够由 Google 助手在线部署,还能提供英语、日语语音多项服务。

WaveNet 是 2016 年 Google 旗下 DeepMind 实验室推出的一种文本转语音算法。

一直以来,WaveNet 的迭代方向都是生成「更好更逼真的语音音频波形。近期,WaveNet 出了新版本,DeepMind 的研究员们算出了一个速度更快的 WaveNet,比原始的快 1000 倍。

在旧的 WaveNet 算法情况下,程序员必须为每一秒连续声音片段,生成 24000 个样本。而且,这些新样本是一个一个生成的,让一个计算单元完成所有的工作,意味着同一时间内,其它的计算单元什么都不做,并不适合如今所需的大规模计算,也很难在实时生产环境中部署。

DeepMind 的研究员们一直在想办法让这算法并行起来。他们找到的解决方式是——并行生成样本。因为语音不是类似于随机噪音的东西,当新样本高度依赖原有样本时,它是高度相关的,这样的话我们一次只能生成一个新样,那么我们如何并行地使用这些多个计算单元,并且创建新的波形呢?

具体算法还请观看视频解读及论文,论文原址

https://arxiv.org/abs/1711.10433

更多文章,关注 AI 科技评论。添加雷锋字幕组微信号(leiphonefansub)为好友,备注「我要加入」,To be an Volunteer !

—————  AI 科技评论招人了  —————


—————  给爱学习的你的福利  —————

三大模块,五大应用,手把手快速入门NLP

海外博士讲师,丰富项目经验

算法+实践,搭配典型行业应用

随到随学,专业社群,讲师在线答疑

点击阅读原文或扫码了解详情

————————————————————

登录查看更多
2

相关内容

【DeepMind推荐】居家学习的人工智能干货资源大全集
专知会员服务
108+阅读 · 2020年6月27日
【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换
专知会员服务
35+阅读 · 2019年12月15日
【斯坦福&Google】面向机器人的机器学习,63页PPT
专知会员服务
25+阅读 · 2019年11月19日
【深度学习视频分析/多模态学习资源大列表】
专知会员服务
91+阅读 · 2019年10月16日
资源 | 深度学习进阶视频课程+完整PPT
AI研习社
7+阅读 · 2018年9月1日
一文读懂神经网络(附PPT、视频)
数据派THU
17+阅读 · 2018年3月25日
视频 | 介绍卷积神经网络和图像识别(上)
AI科技评论
3+阅读 · 2018年2月27日
Advances in Online Audio-Visual Meeting Transcription
Arxiv
4+阅读 · 2019年12月10日
Exploring Visual Relationship for Image Captioning
Arxiv
15+阅读 · 2018年9月19日
ViZDoom Competitions: Playing Doom from Pixels
Arxiv
5+阅读 · 2018年9月10日
Arxiv
8+阅读 · 2018年7月12日
Arxiv
3+阅读 · 2018年3月21日
Arxiv
3+阅读 · 2017年8月15日
VIP会员
Top
微信扫码咨询专知VIP会员