视频 | 2分钟读懂DeepMind新WaveNet - 专知

会员服务 ·

0

视频 | 2分钟读懂DeepMind新WaveNet

2018 年 3 月 10 日 AI科技评论 雷锋字幕组

AI 科技评论按：这里是雷锋字幕组编译的 Two minutes paper 专栏，每周带大家用碎片时间阅览前沿技术，了解 AI 领域的最新研究成果。

原标题：DeepMind's WaveNet, 1000 Times Faster | Two Minute Papers #232

翻译 | 李晶霍雷刚字幕 | 凡江整理 | 吴璇林尤添

▷每周一篇 2 分钟论文视频解读

本期 2 分钟论文 Parallel WaveNet: Fast High-Fidelity Speech Synthesis，主要介绍了 2017 年最新版的 WaveNet 技术运用的训练方法 Probability Density Distillation ，由该技术虽然不是实时生成，却比实时生成快了 20 倍，产生的系统能够由 Google 助手在线部署，还能提供英语、日语语音多项服务。

WaveNet 是 2016 年 Google 旗下 DeepMind 实验室推出的一种文本转语音算法。

一直以来，WaveNet 的迭代方向都是生成「更好更逼真的语音音频波形」。近期，WaveNet 出了新版本，DeepMind 的研究员们算出了一个速度更快的 WaveNet，比原始的快 1000 倍。

在旧的 WaveNet 算法情况下，程序员必须为每一秒连续声音片段，生成 24000 个样本。而且，这些新样本是一个一个生成的，让一个计算单元完成所有的工作，意味着同一时间内，其它的计算单元什么都不做，并不适合如今所需的大规模计算，也很难在实时生产环境中部署。

DeepMind 的研究员们一直在想办法让这算法并行起来。他们找到的解决方式是——并行生成样本。因为语音不是类似于随机噪音的东西，当新样本高度依赖原有样本时，它是高度相关的，这样的话我们一次只能生成一个新样，那么我们如何并行地使用这些多个计算单元，并且创建新的波形呢？

具体算法还请观看视频解读及论文，论文原址

https://arxiv.org/abs/1711.10433

更多文章，关注 AI 科技评论。添加雷锋字幕组微信号（leiphonefansub）为好友，备注「我要加入」，To be an Volunteer ！

————— AI 科技评论招人了 —————

————— 给爱学习的你的福利 —————

三大模块，五大应用，手把手快速入门NLP

海外博士讲师，丰富项目经验

算法+实践，搭配典型行业应用

随到随学，专业社群，讲师在线答疑

点击阅读原文或扫码了解详情

▼▼▼

————————————————————

登录查看更多

2

相关内容

DeepMind

【DeepMind硬核课】卷积神经网络图像识别前沿进展，附110页ppt与视频

【DeepMind硬核课】卷积神经网络图像识别前沿进展，附110页ppt与视频

专知会员服务

105+阅读 · 2020年6月27日

【DeepMind推荐】居家学习的人工智能干货资源大全集

【DeepMind推荐】居家学习的人工智能干货资源大全集

专知会员服务

110+阅读 · 2020年6月27日

【DeepMind硬核课】深度学习注意力与记忆机制，附70页ppt与视频

【DeepMind硬核课】深度学习注意力与记忆机制，附70页ppt与视频

专知会员服务

172+阅读 · 2020年6月25日

【DeepMind-牛津-CMU-CVPR2020】无监督词映射视觉基准，Visual Grounding in Video

【DeepMind-牛津-CMU-CVPR2020】无监督词映射视觉基准，Visual Grounding in Video

专知会员服务

12+阅读 · 2020年3月13日

【DeepMind-牛津-CMU-CVPR2020】无监督文字翻译视频中的视觉基础，Visual Grounding in Video for Unsupervised Word Translation

【DeepMind-牛津-CMU-CVPR2020】无监督文字翻译视频中的视觉基础，Visual Grounding in Video for Unsupervised Word Translation

专知会员服务

13+阅读 · 2020年3月12日

【DeepMind】人工智能、价值与对齐，Artificial Intelligence, Values, and Alignment

【DeepMind】人工智能、价值与对齐，Artificial Intelligence, Values, and Alignment

专知会员服务

38+阅读 · 2020年1月13日

《DeepMind深度学习与强化学习进阶》850页ppt课件与视频开放（附下载）

《DeepMind深度学习与强化学习进阶》850页ppt课件与视频开放（附下载）

专知会员服务

147+阅读 · 2019年12月25日

【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换

【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换

专知会员服务

36+阅读 · 2019年12月15日

【斯坦福&Google】面向机器人的机器学习，63页PPT

【斯坦福&Google】面向机器人的机器学习，63页PPT

专知会员服务

26+阅读 · 2019年11月19日

【深度学习视频分析/多模态学习资源大列表】

【深度学习视频分析/多模态学习资源大列表】

专知会员服务

92+阅读 · 2019年10月16日

比AI视频换脸还可怕！DeepMind新AI可生成逼真视频

比AI视频换脸还可怕！DeepMind新AI可生成逼真视频

智东西

10+阅读 · 2019年7月23日

资源 | 深度学习进阶视频课程+完整PPT

资源 | 深度学习进阶视频课程+完整PPT

AI研习社

7+阅读 · 2018年9月1日

DeepMind 让 AI 拥有一双人类的眼睛，阴影、遮挡统统难不倒它

DeepMind 让 AI 拥有一双人类的眼睛，阴影、遮挡统统难不倒它

AI研习社

3+阅读 · 2018年7月22日

一文读懂神经网络(附PPT、视频)

一文读懂神经网络(附PPT、视频)

数据派THU

17+阅读 · 2018年3月25日

视频 | 没有博士学位和顶会论文，我如何拿到DeepMind的offer？

视频 | 没有博士学位和顶会论文，我如何拿到DeepMind的offer？

AI科技评论

3+阅读 · 2018年3月19日

视频 | 2分钟论文：用谷歌「AI可解释性」看懂机器学习

视频 | 2分钟论文：用谷歌「AI可解释性」看懂机器学习

AI科技评论

4+阅读 · 2018年3月18日

视频 | 介绍卷积神经网络和图像识别（上）

视频 | 介绍卷积神经网络和图像识别（上）

AI科技评论

3+阅读 · 2018年2月27日

重磅译制 | 视频更新：牛津大学xDeepMind自然语言处理课程第5讲（下）文本分类

重磅译制 | 视频更新：牛津大学xDeepMind自然语言处理课程第5讲（下）文本分类

大数据文摘

5+阅读 · 2017年12月11日

重磅译制 | 视频更新：牛津大学xDeepMind自然语言处理课程第4讲（上）

重磅译制 | 视频更新：牛津大学xDeepMind自然语言处理课程第4讲（上）

大数据文摘

3+阅读 · 2017年11月19日

重磅课程 | 牛津xDeepMind自然语言处理汉化视频更新：第3讲 RNN和语言建模（2）

重磅课程 | 牛津xDeepMind自然语言处理汉化视频更新：第3讲 RNN和语言建模（2）

大数据文摘

4+阅读 · 2017年11月12日

CURL: Contrastive Unsupervised Representations for Reinforcement Learning

Arxiv

17+阅读 · 2020年4月28日

Advances in Online Audio-Visual Meeting Transcription

Advances in Online Audio-Visual Meeting Transcription

Arxiv

4+阅读 · 2019年12月10日

Learning When Not to Answer: A Ternary Reward Structure for Reinforcement Learning based Question Answering

Arxiv

6+阅读 · 2019年4月3日

Exploring Visual Relationship for Image Captioning

Exploring Visual Relationship for Image Captioning

Arxiv

15+阅读 · 2018年9月19日

ViZDoom Competitions: Playing Doom from Pixels

ViZDoom Competitions: Playing Doom from Pixels

Arxiv

5+阅读 · 2018年9月10日

Visual Reinforcement Learning with Imagined Goals

Arxiv

8+阅读 · 2018年7月12日

DAiSEE: Towards User Engagement Recognition in the Wild

Arxiv

5+阅读 · 2018年4月12日

Stacked Cross Attention for Image-Text Matching

Arxiv

3+阅读 · 2018年3月21日

Knowledge Graph Embedding with Multiple Relation Projections

Arxiv

4+阅读 · 2018年1月26日

Fluency-Guided Cross-Lingual Image Captioning

Arxiv

3+阅读 · 2017年8月15日

VIP会员

相关主题

文本转语音

相关VIP内容

【DeepMind硬核课】卷积神经网络图像识别前沿进展，附110页ppt与视频

【DeepMind硬核课】卷积神经网络图像识别前沿进展，附110页ppt与视频

专知会员服务

105+阅读 · 2020年6月27日

【DeepMind推荐】居家学习的人工智能干货资源大全集

【DeepMind推荐】居家学习的人工智能干货资源大全集

专知会员服务

110+阅读 · 2020年6月27日

【DeepMind硬核课】深度学习注意力与记忆机制，附70页ppt与视频

【DeepMind硬核课】深度学习注意力与记忆机制，附70页ppt与视频

专知会员服务

172+阅读 · 2020年6月25日

【DeepMind-牛津-CMU-CVPR2020】无监督词映射视觉基准，Visual Grounding in Video

【DeepMind-牛津-CMU-CVPR2020】无监督词映射视觉基准，Visual Grounding in Video

专知会员服务

12+阅读 · 2020年3月13日

【DeepMind-牛津-CMU-CVPR2020】无监督文字翻译视频中的视觉基础，Visual Grounding in Video for Unsupervised Word Translation

【DeepMind-牛津-CMU-CVPR2020】无监督文字翻译视频中的视觉基础，Visual Grounding in Video for Unsupervised Word Translation

专知会员服务

13+阅读 · 2020年3月12日

【DeepMind】人工智能、价值与对齐，Artificial Intelligence, Values, and Alignment

【DeepMind】人工智能、价值与对齐，Artificial Intelligence, Values, and Alignment

专知会员服务

38+阅读 · 2020年1月13日

《DeepMind深度学习与强化学习进阶》850页ppt课件与视频开放（附下载）

《DeepMind深度学习与强化学习进阶》850页ppt课件与视频开放（附下载）

专知会员服务

147+阅读 · 2019年12月25日

【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换

【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换

专知会员服务

36+阅读 · 2019年12月15日

【斯坦福&Google】面向机器人的机器学习，63页PPT

【斯坦福&Google】面向机器人的机器学习，63页PPT

专知会员服务

26+阅读 · 2019年11月19日

【深度学习视频分析/多模态学习资源大列表】

【深度学习视频分析/多模态学习资源大列表】

专知会员服务

92+阅读 · 2019年10月16日

热门VIP内容

开通专知VIP会员享更多权益服务

GPT-5如何对齐？从硬性拒绝到安全完成：走向以输出为中心的安全训练

【伯克利博士论文】超越人类监督的视觉智能

【ICCV2025】SO(3) 上连续非保守动力系统的预测

2025年中国数据要素行业发展研究报告

相关资讯

比AI视频换脸还可怕！DeepMind新AI可生成逼真视频

比AI视频换脸还可怕！DeepMind新AI可生成逼真视频

智东西

10+阅读 · 2019年7月23日

资源 | 深度学习进阶视频课程+完整PPT

资源 | 深度学习进阶视频课程+完整PPT

AI研习社

7+阅读 · 2018年9月1日

DeepMind 让 AI 拥有一双人类的眼睛，阴影、遮挡统统难不倒它

DeepMind 让 AI 拥有一双人类的眼睛，阴影、遮挡统统难不倒它

AI研习社

3+阅读 · 2018年7月22日

一文读懂神经网络(附PPT、视频)

一文读懂神经网络(附PPT、视频)

数据派THU

17+阅读 · 2018年3月25日

视频 | 没有博士学位和顶会论文，我如何拿到DeepMind的offer？

视频 | 没有博士学位和顶会论文，我如何拿到DeepMind的offer？

AI科技评论

3+阅读 · 2018年3月19日

视频 | 2分钟论文：用谷歌「AI可解释性」看懂机器学习

视频 | 2分钟论文：用谷歌「AI可解释性」看懂机器学习

AI科技评论

4+阅读 · 2018年3月18日

视频 | 介绍卷积神经网络和图像识别（上）

视频 | 介绍卷积神经网络和图像识别（上）

AI科技评论

3+阅读 · 2018年2月27日

重磅译制 | 视频更新：牛津大学xDeepMind自然语言处理课程第5讲（下）文本分类

重磅译制 | 视频更新：牛津大学xDeepMind自然语言处理课程第5讲（下）文本分类

大数据文摘

5+阅读 · 2017年12月11日

重磅译制 | 视频更新：牛津大学xDeepMind自然语言处理课程第4讲（上）

重磅译制 | 视频更新：牛津大学xDeepMind自然语言处理课程第4讲（上）

大数据文摘

3+阅读 · 2017年11月19日

重磅课程 | 牛津xDeepMind自然语言处理汉化视频更新：第3讲 RNN和语言建模（2）

重磅课程 | 牛津xDeepMind自然语言处理汉化视频更新：第3讲 RNN和语言建模（2）

大数据文摘

4+阅读 · 2017年11月12日

相关论文

CURL: Contrastive Unsupervised Representations for Reinforcement Learning

Arxiv

17+阅读 · 2020年4月28日

Advances in Online Audio-Visual Meeting Transcription

Advances in Online Audio-Visual Meeting Transcription

Arxiv

4+阅读 · 2019年12月10日

Learning When Not to Answer: A Ternary Reward Structure for Reinforcement Learning based Question Answering

Arxiv

6+阅读 · 2019年4月3日

Exploring Visual Relationship for Image Captioning

Exploring Visual Relationship for Image Captioning

Arxiv

15+阅读 · 2018年9月19日

ViZDoom Competitions: Playing Doom from Pixels

ViZDoom Competitions: Playing Doom from Pixels

Arxiv

5+阅读 · 2018年9月10日

Visual Reinforcement Learning with Imagined Goals

Arxiv

8+阅读 · 2018年7月12日

DAiSEE: Towards User Engagement Recognition in the Wild

Arxiv

5+阅读 · 2018年4月12日

Stacked Cross Attention for Image-Text Matching

Arxiv

3+阅读 · 2018年3月21日

Knowledge Graph Embedding with Multiple Relation Projections

Arxiv

4+阅读 · 2018年1月26日

Fluency-Guided Cross-Lingual Image Captioning

Arxiv

3+阅读 · 2017年8月15日

大家都在搜

久别重逢话双塔

国防科技创新

再见，TD-SCDMA！

微信扫码咨询专知VIP会员