成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
0
台大李宏毅:生成式对抗网络GAN在语音自然语言处理中的应用|附247页PPT下载
2019 年 9 月 22 日
新智元
新智元推荐
来源:
专知(LiteProgrammer)
【新智元导读
】InterSpeech是语音处理领域的顶级会议,于9月15日-9月20日在奥地利格拉茨召开,国立台湾大学李宏毅老师在会上作了题为“Generative Adversarial Network and its Application to Speech Processing and Natural Learuage Processing”的报告,本文整理了报告的主要内容,并分享了报告PPT。
生成对抗网络(GAN)是训练模型的新思想,生成器和鉴别器相互对抗以提高生成质量。最近,GAN在图像生成方面取得了惊人的成果,并在此基础上迸发了大量新的思想,技术和应用。虽然只有少数成功的案例,但GAN在文本和语音领域具有很大的潜力,以克服传统方法的局限性。
内容简介
本教程分为三个部分。在第一部分中,我们将介绍生成对抗网络(GAN)并提供有关此技术的全面介绍。在第二部分中,我们将重点介绍GAN在语音信号处理中的应用,包括语音增强,语音转换,语音合成,以及域对抗训练在说话人识别和唇读等方面的应用。在第三部分中,我们将描述GAN生成句子的主要挑战,并回顾一系列应对挑战的方法。同时,我们将提出使用GAN实现文本样式转换,机器翻译和抽象摘要的算法,而无需配对数据。
讲者简介
李宏毅教授分别于2010年和2012年在国立台湾大学获得了硕士与博士学位。2012年9月至2013年8月,他是中国科学院信息技术创新研究中心的博士后。2013年9月至2014年7月,他是麻省理工学院计算机科学与人工智能实验室(CSAIL)语言系统组的访问科学家。现任国立台湾大学电气工程系助理教授,并任职于该大学计算机科学与信息工程系。他的研究重点是机器学习(尤其是深度学习),口语理解和语音识别。
曹昱
副研究员分别于1999年和2001年获得台湾大学电子工程学士学位和硕士学位。他于2008年获得佐治亚理工学院电气与计算机工程博士学位. 2009至2011年,曹博士是日本国家信息与通信技术研究所(NICT)的研究员,从事自动语音研究和产品开发,识别多语言语音到语音翻译。目前,他是台湾台北中央研究院信息技术创新研究中心(CITI)的副研究员。他于2017年获得了中央研究院职业发展奖。曹博士的研究兴趣包括语音和说话人识别,声学和语言建模,音频编码和生物信号处理。
目录
GAN的基本思想及一些基础的理论知识
- GAN的三种类别
- GAN的基本理论
- 一些有用的技巧
- 如何评估GAN
- 与强化学习的关系
GAN在语音方面的应用
- 语音信号生成
- 语音信号识别
- 结论
GAN在自然语言处理方面的应用
- GAN序列生成
- 无监督条件序列生成
原文链接:
https://interspeech2019.org/program/tutorials/
附部分PDF预览:
GAN的三个类别
GAN的基本思想
GAN从2014年发展至今,有了很大进步
条件GAN
条件GAN中,可由图片生成图片,声音生成图片,图片生成标签等应用
无监督条件GAN生成有两种方法:
Cycle-GAN
共享一个隐空间
点击原文链接,在专知公众号回复“GANSP” 就可以获取完整版《生成式对抗网络GAN在语音自然语言处理中的应用》的下载链接~
登录查看更多
点赞并收藏
0
暂时没有读者
18
权益说明
本文档仅做收录索引使用,若发现您的权益受到侵害,请立即联系客服(微信: zhuanzhi02,邮箱:bd@zhuanzhi.ai),我们会尽快为您处理
相关内容
李宏毅
关注
18
李宏毅(Hung-yi Lee)目前任台湾大学电机工程学系和电机资讯学院的助理教授,他曾于 2012 年获得台湾大学博士学位,并于 2013 年赴麻省理工学院(MIT)计算机科学和人工智能实验室(CSAIL)做访问学者。他的研究方向主要是机器学习(深度学习)和语音识别。
最新《生成式对抗网络》简介,25页ppt
专知会员服务
174+阅读 · 2020年6月28日
最新《生成式对抗网络》技术综述课程,70页ppt带你学习GAN进展
专知会员服务
213+阅读 · 2020年6月20日
深度学习自然语言处理概述,216页ppt,Jindřich Helcl
专知会员服务
214+阅读 · 2020年4月26日
基于生成对抗网络的模仿学习综述, 苏州大学,计算机学报
专知会员服务
46+阅读 · 2020年2月1日
【GAN】生成式对抗网络GAN在语音自然语言处理中的应用,台大李宏毅老师,附247页ppt下载
专知会员服务
113+阅读 · 2019年11月26日
【元学习 | ICASSP2020提交论文】学习低资源语音识别,国立台湾大学 | 李宏毅
专知会员服务
57+阅读 · 2019年11月21日
【CCL 2019】表示学习--自然语言处理中的图神经网络(Graph Neural Networks in NLP),西湖大学长聘副教授张岳
专知会员服务
64+阅读 · 2019年11月12日
【CCL 2019】ATT-第19期:生成对抗网络 (邱锡鹏)
专知会员服务
50+阅读 · 2019年11月12日
【EMNLP 2019】Discreteness in Neural Natural Language Processing,神经自然语言处理中的离散性,附303页PPT免费下载
专知会员服务
26+阅读 · 2019年11月7日
【文献综述】基于端到端深度神经网络的说话人与语言识别综述, 163页ppt,昆山杜克大学李明博士
专知会员服务
33+阅读 · 2019年9月15日
【前沿】预训练语言模型的研究与应用,华为诺亚方舟实验室语音语义首席科学家刘群,附报告下载
专知
8+阅读 · 2019年11月3日
生成式对抗网络GAN在语音自然语言处理中的应用,台大李宏毅老师
GAN生成式对抗网络
34+阅读 · 2019年9月23日
基于端到端深度神经网络的说话人与语言识别综述, 163页ppt,[InterSpeech2019]昆山杜克大学李明博士
专知
14+阅读 · 2019年9月22日
生成式对抗网络GAN在语音自然语言处理中的应用,台大李宏毅老师,附247页ppt下载
专知
26+阅读 · 2019年9月21日
【ICASSP教程】深度生成模型在信号处理领域的应用(附116页PPT全文下载)
专知
16+阅读 · 2019年5月29日
干货 | 自动化所宗成庆研究员:108页PPT干货读懂NLP的过去与现在
AI科技评论
15+阅读 · 2019年5月14日
自动化所宗成庆研究员:108页PPT干货读懂NLP的过去与现在
专知
48+阅读 · 2019年5月14日
李宏毅-《机器学习/深度学习-2019》视频及资料分享
深度学习与NLP
42+阅读 · 2019年3月20日
2017年深度学习总结:文本和语音应用
专知
3+阅读 · 2018年2月4日
【干货】台大李宏毅两个小时带你纵览自然语言处理和语音内容机器理解,附全程视频PPT下载
专知
19+阅读 · 2017年11月27日
WaveTTS: Tacotron-based TTS with Joint Time-Frequency Domain Loss
Arxiv
3+阅读 · 2020年4月6日
A Review on Generative Adversarial Networks: Algorithms, Theory, and Applications
Arxiv
58+阅读 · 2020年1月20日
Deep Learning for Learning Graph Representations
Arxiv
35+阅读 · 2020年1月2日
ESRGAN: Enhanced Super-Resolution Generative Adversarial Networks
Arxiv
6+阅读 · 2018年9月17日
Deep learning in agriculture: A survey
Arxiv
11+阅读 · 2018年7月31日
SemStyle: Learning to Generate Stylised Image Captions using Unaligned Text
Arxiv
5+阅读 · 2018年5月18日
Controllable Generative Adversarial Network
Arxiv
5+阅读 · 2018年5月1日
Fictitious GAN: Training GANs with Historical Models
Arxiv
4+阅读 · 2018年3月23日
Discrete Autoencoders for Sequence Models
Arxiv
6+阅读 · 2018年1月29日
SeqGAN: Sequence Generative Adversarial Nets with Policy Gradient
Arxiv
5+阅读 · 2017年8月25日
VIP会员
自助开通(推荐)
客服开通
详情
相关主题
李宏毅
GAN
对抗网络
生成式对抗网络
对抗
Processing(编程语言)
相关VIP内容
最新《生成式对抗网络》简介,25页ppt
专知会员服务
174+阅读 · 2020年6月28日
最新《生成式对抗网络》技术综述课程,70页ppt带你学习GAN进展
专知会员服务
213+阅读 · 2020年6月20日
深度学习自然语言处理概述,216页ppt,Jindřich Helcl
专知会员服务
214+阅读 · 2020年4月26日
基于生成对抗网络的模仿学习综述, 苏州大学,计算机学报
专知会员服务
46+阅读 · 2020年2月1日
【GAN】生成式对抗网络GAN在语音自然语言处理中的应用,台大李宏毅老师,附247页ppt下载
专知会员服务
113+阅读 · 2019年11月26日
【元学习 | ICASSP2020提交论文】学习低资源语音识别,国立台湾大学 | 李宏毅
专知会员服务
57+阅读 · 2019年11月21日
【CCL 2019】表示学习--自然语言处理中的图神经网络(Graph Neural Networks in NLP),西湖大学长聘副教授张岳
专知会员服务
64+阅读 · 2019年11月12日
【CCL 2019】ATT-第19期:生成对抗网络 (邱锡鹏)
专知会员服务
50+阅读 · 2019年11月12日
【EMNLP 2019】Discreteness in Neural Natural Language Processing,神经自然语言处理中的离散性,附303页PPT免费下载
专知会员服务
26+阅读 · 2019年11月7日
【文献综述】基于端到端深度神经网络的说话人与语言识别综述, 163页ppt,昆山杜克大学李明博士
专知会员服务
33+阅读 · 2019年9月15日
热门VIP内容
开通专知VIP会员 享更多权益服务
《大型语言模型增强电子战》最新21页slides
军事系统互操作性《国防应用程序接口 (API) 技术指南》美国防部76页
机器人战争:未来冲突
《用于边缘云异常检测的机器学习》博士论文
相关资讯
【前沿】预训练语言模型的研究与应用,华为诺亚方舟实验室语音语义首席科学家刘群,附报告下载
专知
8+阅读 · 2019年11月3日
生成式对抗网络GAN在语音自然语言处理中的应用,台大李宏毅老师
GAN生成式对抗网络
34+阅读 · 2019年9月23日
基于端到端深度神经网络的说话人与语言识别综述, 163页ppt,[InterSpeech2019]昆山杜克大学李明博士
专知
14+阅读 · 2019年9月22日
生成式对抗网络GAN在语音自然语言处理中的应用,台大李宏毅老师,附247页ppt下载
专知
26+阅读 · 2019年9月21日
【ICASSP教程】深度生成模型在信号处理领域的应用(附116页PPT全文下载)
专知
16+阅读 · 2019年5月29日
干货 | 自动化所宗成庆研究员:108页PPT干货读懂NLP的过去与现在
AI科技评论
15+阅读 · 2019年5月14日
自动化所宗成庆研究员:108页PPT干货读懂NLP的过去与现在
专知
48+阅读 · 2019年5月14日
李宏毅-《机器学习/深度学习-2019》视频及资料分享
深度学习与NLP
42+阅读 · 2019年3月20日
2017年深度学习总结:文本和语音应用
专知
3+阅读 · 2018年2月4日
【干货】台大李宏毅两个小时带你纵览自然语言处理和语音内容机器理解,附全程视频PPT下载
专知
19+阅读 · 2017年11月27日
相关论文
WaveTTS: Tacotron-based TTS with Joint Time-Frequency Domain Loss
Arxiv
3+阅读 · 2020年4月6日
A Review on Generative Adversarial Networks: Algorithms, Theory, and Applications
Arxiv
58+阅读 · 2020年1月20日
Deep Learning for Learning Graph Representations
Arxiv
35+阅读 · 2020年1月2日
ESRGAN: Enhanced Super-Resolution Generative Adversarial Networks
Arxiv
6+阅读 · 2018年9月17日
Deep learning in agriculture: A survey
Arxiv
11+阅读 · 2018年7月31日
SemStyle: Learning to Generate Stylised Image Captions using Unaligned Text
Arxiv
5+阅读 · 2018年5月18日
Controllable Generative Adversarial Network
Arxiv
5+阅读 · 2018年5月1日
Fictitious GAN: Training GANs with Historical Models
Arxiv
4+阅读 · 2018年3月23日
Discrete Autoencoders for Sequence Models
Arxiv
6+阅读 · 2018年1月29日
SeqGAN: Sequence Generative Adversarial Nets with Policy Gradient
Arxiv
5+阅读 · 2017年8月25日
大家都在搜
自主可控
洛克菲勒
大规模语言模型
研究报告
基础模型
科研工具
语义地图
palantir
spacy
社区分享 | 用 PoseNet + TensorFlow.js 在浏览器实现体感游戏
Top
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top