【教程】语音识别中的End-to-End模型教程(附178页PDF全文下载)

2018 年 11 月 21 日 专知

【导读】Interspeech是由国际语音通信协会ISCA(International Speech Communication Association)组织的语音研究领域的顶级会议之一,是全球最大的综合性语音信号处理领域的科技盛会,该会议每年举办一次,每次都会吸引全球语音信号领域以及人工智能领域知名学者、企业以及研发人员参加。本期内容为大家整理了google研究人员Rohit Prabhavalkar在大会上的端到端语音识别模型教程,希望对大家有所帮助。


介绍:


传统的语音识别系统是由一组独立的构件组成,即声学模型(AM)、语音模型(PM)、语言模型(LM)。其中AM输入以声学特征为主(通常是上下文相关的音素),以预测subword单元的分布;PM一般情况是人工设计的词典集合,它将声学模型产生的subword单元序列映射到单词上;最终,通过LM构件对各种词的概率进行计算,得到文本序列。


在传统的自动语音识别系统中,这些构件是在不同数据集上独立训练的,并且有一些独立的假设以方便处理。而在过去的几年里,人们对开发端到端的语音识别系统越来越感兴趣,这些系统试图在单个系统中完成多个构件的工作。例如基于attention的模型、循环神经传感器、循环神经校准器、目标词时序分类等。这些模型的共同特点在于,它们组成在一个单一的神经网络上,当接收一段语音信息后,直接输出一组图形或文字的概率分布。随着研究的逐渐深入,这种端到端的模型可以超过传统自动语音识别系统的性能。


在本教程中,我们将详细介绍自动语音识别中的端到端建模方案,从这些系统的历史发展开始,同时分析这些方法的共性和区别;进而,我们将讨论一些最近的创新工作,这些创新极大地改进了端到端模型的性能,使它们能够超过传统的自动语音识别系统的性能;然后,本教程将描述这项研究的一些令人兴奋的应用,以及一些可能的研究方向;最终,我们将讨论端到端模型现在存在的问题,以及将来所面临的挑战。


请关注专知公众号(扫一扫最下面专知二维码,或者点击上方蓝色专知)

  • 后台回复“EESR” 就可以获取全文报告 PDF下载链接~ 




附PDF全文:



-END-

专 · 知


人工智能领域26个主题知识资料全集获取与加入专知人工智能服务群: 欢迎微信扫一扫加入专知人工智能知识星球群,获取专业知识教程视频资料和与专家交流咨询!


请PC登录www.zhuanzhi.ai或者点击阅读原文,注册登录专知,获取更多AI知识资料!


请加专知小助手微信(扫一扫如下二维码添加),加入专知主题群(请备注主题类型:AI、NLP、CV、 KG等)交流~

 AI 项目技术 & 商务合作:bd@zhuanzhi.ai, 或扫描上面二维码联系!

请关注专知公众号,获取人工智能的专业知识!

点击“阅读原文”,使用专知


登录查看更多
23

相关内容

语音识别是计算机科学和计算语言学的一个跨学科子领域,它发展了一些方法和技术,使计算机可以将口语识别和翻译成文本。 它也被称为自动语音识别(ASR),计算机语音识别或语音转文本(STT)。它整合了计算机科学,语言学和计算机工程领域的知识和研究。
【经典书】机器学习高斯过程,266页pdf
专知会员服务
195+阅读 · 2020年5月2日
【干货书】机器学习Python实战教程,366页pdf
专知会员服务
340+阅读 · 2020年3月17日
机器学习速查手册,135页pdf
专知会员服务
340+阅读 · 2020年3月15日
WSDM 2020教程《深度贝叶斯数据挖掘》,附257页PPT下载
专知会员服务
156+阅读 · 2020年2月7日
智能交通大数据最新论文综述-附PDF下载
专知会员服务
104+阅读 · 2019年12月25日
【EMNLP2019教程】端到端学习对话人工智能,附237页PPT下载
专知会员服务
69+阅读 · 2019年11月25日
【综述】视频摘要最新综述文章,附45页综述全文下载
专知会员服务
33+阅读 · 2019年9月20日
语音关键词检测方法综述【附PPT与视频资料】
人工智能前沿讲习班
10+阅读 · 2019年2月2日
自动驾驶最新综述论文(31页PDF下载)
专知
118+阅读 · 2019年1月15日
180页机器学习Python简介教程【免费下载】
机器学习算法与Python学习
6+阅读 · 2018年8月18日
Arxiv
7+阅读 · 2019年5月31日
A Comprehensive Survey on Graph Neural Networks
Arxiv
13+阅读 · 2019年3月10日
Arxiv
6+阅读 · 2018年11月1日
Arxiv
22+阅读 · 2018年8月30日
Arxiv
3+阅读 · 2018年6月19日
VIP会员
相关VIP内容
【经典书】机器学习高斯过程,266页pdf
专知会员服务
195+阅读 · 2020年5月2日
【干货书】机器学习Python实战教程,366页pdf
专知会员服务
340+阅读 · 2020年3月17日
机器学习速查手册,135页pdf
专知会员服务
340+阅读 · 2020年3月15日
WSDM 2020教程《深度贝叶斯数据挖掘》,附257页PPT下载
专知会员服务
156+阅读 · 2020年2月7日
智能交通大数据最新论文综述-附PDF下载
专知会员服务
104+阅读 · 2019年12月25日
【EMNLP2019教程】端到端学习对话人工智能,附237页PPT下载
专知会员服务
69+阅读 · 2019年11月25日
【综述】视频摘要最新综述文章,附45页综述全文下载
专知会员服务
33+阅读 · 2019年9月20日
Top
微信扫码咨询专知VIP会员