SFFAI 18 报名通知 | 语音识别前沿技术

2019 年 1 月 14 日 人工智能前沿讲习班

关注文章公众号

回复"语音识别"获取本主题精选论文



论坛主题

语音识别


近年来智能语音进入了快速增长期,语音识别作为语音领域的重要分支获得了广泛的关注,如何提高声学建模能力和如何进行端到端的联合优化是语音识别领域中的重要课题。


论坛讲者


白烨,中国科学院自动化研究所博士生,本科毕业于中国农业大学。研究兴趣为语音识别、语言模型、语音关键词检测。


题目:语音关键词检测方法综述

摘要:随着智能音箱、语音助手等应用的出现,普通人也可以像科幻场景一样使用语音与机器进行交流。语音关键词检测是实现人机语音交互的重要技术,被广泛地应用于各类智能设备、语音检索系统当中。语音关键词检测可以分成两种,一种是用于设备唤醒、设备控制keyword spotting;一种是应用于语音文档检索的spoken term detection,二者虽然名字类似,但从功能侧重和技术路线上都有所区别。本次分享介绍语音关键词检测的主要方法与最新进展。

Spotlight:

1、语音关键词检测介绍;

2、基于隐马尔可夫模型的语音关键词检测;

3、基于样例查询的语音关键词检测;

4、基于大词汇量语音识别系统的语音关键词检测;

5、总结。



田正坤,中国科学院自动化研究所智能交互团队,直博二年级,目前主要研究兴趣集中在端到端语音识别以及低资源语音识别。


题目:使用RNN-Transducer进行声学建模 

摘要:基于联结时序分类(CTC)的声学模型不再需要对训练的音频序列和文本序列进行强制对齐,实际上已经初步具备了端到端的声学模型建模能力。但是CTC模型进行声学建模存在着两个严重的瓶颈,一是缺乏语言模型建模能力,不能整合语言模型进行联合优化,二是不能建模模型输出之间的依赖关系。RNN-Transducer针对CTC的不足,进行了改进,使得模型具有了端到端联合优化、具有语言建模能力、便于实现Online语音识别等突出的优点, 更加适合语音任务,值得引起大家的重视。

Spotlight:

1、CTC模型与不足;

2、RNN-Transducer模型;

3、RNN-Transducer模型的改进。





近年来智能语音进入了快速增长期,语音识别作为语音领域的重要分支获得了广泛的关注,如何提高声学建模能力和如何进行端到端的联合优化是语音识别领域中的重要课题。


由SFFAI18分享嘉宾白烨同学为大家精选出来的关于语音关键词检索方面的论文以及田正坤同学为大家精选出来的关于利用RNN-Transducer进行端到端声学建模的论文,将带你了解语音识别基本方向。你可以先仔细阅读,并带着问题来现场交流哦。


1


🌟🌟🌟🌟🌟

推荐理由:此篇文章是第一篇使用深度神经网络,直接将音频序列编码为固定长度向量进行QbE KWS的文章。在这之前的KWS基本上都是基于DTW计算序列之间的距离,而这篇文章首次使用了LSTM对序列进行编码,最后直接计算距离即可,速度快,效果好。基于这种范式,还诞生了关键词检测的应用SnowBoy(内部具体模型可能不一样)。

推荐理由来自:白烨


2

🌟🌟🌟🌟🌟

推荐理由:语音检索(Keyword Search, or Spoken Term Detection)中,如何将语音识别的结果建立倒排索引,快速定位到关键词发生的位置,是语音检索中重要问题。基于加权有限状态转换器的时间因子自动机方法,因为其计算高效(检索时线性复杂度),准确,框架优雅,已经成为了语音检索中的标准方法。在流行的开源语音工具包Kaldi中也已经集成了这一方法。

推荐理由来自:白烨


3

🌟🌟🌟🌟🌟

推荐理由:这是百度硅谷实验室的一篇文章,比较了CTC、RNN-Transducer以及Attention模型在原理以及实验性能上的差异,对于想利用端到端模型进行语音识别建模的同学,具有很好的指导意义。 文章显示没有额外语言模型的注意力模型以及RNN-Transducer模型性能都超过了基线CTC模型。同时文章还研究了怎么样选取编码器结构。

推荐理由来自:田正坤


4


🌟🌟🌟🌟

推荐理由:这是Google2018年的一个工作,文章讲述了丰富的细节来帮助我们如何训练好一个RNN-Transducer网络。文章探索了多种模型结构以及如何利用外部数据。文中使用多级CTC来辅助模型训练,获得了很好的效果。

推荐理由来自:田正坤





时间

2019年1月20日(周日)

14:00 -- 17:00



地点:

中国科学院自动化研究所


报名方式

点击下方原文链接 或 扫描二维码报名



活动名额

1、为确保小范围深入交流,本次活动名额有限(不收取任何费用);

2、活动采取审核制报名,我们将根据用户研究方向与当期主题的契合度进行筛选,通过审核的用户将收到确认邮件;

3、 如您无法按时到场参与活动,请于活动开始前 24 小时在AIDL微信公众号后台留言告知,留言格式为放弃报名 + 报名电话。无故缺席者,将不再享有后续活动的报名资格。


SFFAI招募

现代科学技术高度社会化,在科学理论与技术方法上更加趋向综合与统一,为了满足人工智能不同领域研究者相互交流、彼此启发的需求,我们发起了SFFAI这个公益活动。SFFAI每周举行一期线下活动,邀请一线科研人员分享、讨论人工智能各个领域的前沿思想和最新成果,使专注于各个细分领域的研究者开拓视野、触类旁通。

SFFAI目前主要关注机器学习、计算机视觉、自然语言处理等各个人工智能垂直领域及交叉领域的前沿进展,将对线下讨论的内容进行线上传播,使后来者少踩坑,也为讲者塑造个人影响力。

SFFAI还将构建人工智能领域的知识树(AI Knowledge Tree),通过汇总各位参与者贡献的领域知识,沉淀线下分享的前沿精华,使AI Knowledge Tree枝繁叶茂,为人工智能社区做出贡献。

这项意义非凡的社区工作正在稳步向前,衷心期待和感谢您的支持与奉献!

报名通道已开启,请点击下方
阅读原文
报名
↓↓
登录查看更多
2

相关内容

语音识别是计算机科学和计算语言学的一个跨学科子领域,它发展了一些方法和技术,使计算机可以将口语识别和翻译成文本。 它也被称为自动语音识别(ASR),计算机语音识别或语音转文本(STT)。它整合了计算机科学,语言学和计算机工程领域的知识和研究。
人机对抗智能技术
专知会员服务
201+阅读 · 2020年5月3日
注意力图神经网络的多标签文本分类
专知会员服务
111+阅读 · 2020年3月28日
【MIT深度学习课程】深度序列建模,Deep Sequence Modeling
专知会员服务
77+阅读 · 2020年2月3日
[综述]基于深度学习的开放领域对话系统研究综述
专知会员服务
78+阅读 · 2019年10月12日
复旦大学邱锡鹏老师《神经网络与深度学习》书册最新版
SFFAI 37 报名通知 | 机器翻译专场之同步双向与多语言机器翻译
人工智能前沿讲习班
3+阅读 · 2019年6月25日
SFFAI分享 | 连政:端到端语音合成【附PPT与视频资料】
人工智能前沿讲习班
14+阅读 · 2019年6月16日
SFFAI 33 报名通知 | 图深度学习专题
人工智能前沿讲习班
6+阅读 · 2019年6月12日
SFFAI 31 报名通知 | 情感语音识别与合成
人工智能前沿讲习班
17+阅读 · 2019年5月30日
语音关键词检测方法综述【附PPT与视频资料】
人工智能前沿讲习班
10+阅读 · 2019年2月2日
使用RNN-Transducer进行语音识别建模【附PPT与视频资料】
人工智能前沿讲习班
74+阅读 · 2019年1月29日
语音识别的前沿论文,看我们推荐的这4篇
人工智能前沿讲习班
26+阅读 · 2019年1月14日
SFFAI15报名通知 | 目标检测专题
人工智能前沿讲习班
4+阅读 · 2018年12月18日
SFFAI11 报名通知 | 图像分割专题
人工智能前沿讲习班
9+阅读 · 2018年11月26日
SFFAI10 报名通知 | 优化算法论坛
人工智能前沿讲习班
4+阅读 · 2018年11月19日
Neural Image Captioning
Arxiv
5+阅读 · 2019年7月2日
Arxiv
6+阅读 · 2019年4月4日
Neural Speech Synthesis with Transformer Network
Arxiv
5+阅读 · 2019年1月30日
Arxiv
5+阅读 · 2018年5月1日
Arxiv
5+阅读 · 2018年3月30日
VIP会员
相关资讯
SFFAI 37 报名通知 | 机器翻译专场之同步双向与多语言机器翻译
人工智能前沿讲习班
3+阅读 · 2019年6月25日
SFFAI分享 | 连政:端到端语音合成【附PPT与视频资料】
人工智能前沿讲习班
14+阅读 · 2019年6月16日
SFFAI 33 报名通知 | 图深度学习专题
人工智能前沿讲习班
6+阅读 · 2019年6月12日
SFFAI 31 报名通知 | 情感语音识别与合成
人工智能前沿讲习班
17+阅读 · 2019年5月30日
语音关键词检测方法综述【附PPT与视频资料】
人工智能前沿讲习班
10+阅读 · 2019年2月2日
使用RNN-Transducer进行语音识别建模【附PPT与视频资料】
人工智能前沿讲习班
74+阅读 · 2019年1月29日
语音识别的前沿论文,看我们推荐的这4篇
人工智能前沿讲习班
26+阅读 · 2019年1月14日
SFFAI15报名通知 | 目标检测专题
人工智能前沿讲习班
4+阅读 · 2018年12月18日
SFFAI11 报名通知 | 图像分割专题
人工智能前沿讲习班
9+阅读 · 2018年11月26日
SFFAI10 报名通知 | 优化算法论坛
人工智能前沿讲习班
4+阅读 · 2018年11月19日
Top
微信扫码咨询专知VIP会员