直播 | 搜狗研究员：基于LSTM-RNN的语音声学建模技术 | 学术青年分享会 - 专知

会员服务 ·

0

直播 | 搜狗研究员：基于LSTM-RNN的语音声学建模技术 | 学术青年分享会

2017 年 10 月 10 日 AI科技评论 不灵叔

分享主题

▼

Acoustic Modeling Based on LSTM-RNN in ASR

基于LSTM-RNN的语音声学建模技术

分享内容

▼

LSTM-RNN可以对长时序列信息进行建模，广泛应用于语音识别声学模型建模中。此次主要介绍近期LSTM的一些研究进展包括LC-BLSTM，2D-LSTM等。其中LC-BLSTM采用了双向LSTM结构，并在训练和解码时加入了数帧的未来信息来控制延时，解决了普通双向LSTM无法用于实时语音识别的问题；而2D-LSTM在时间和频域两个维度上进行循环，同时保存时间轴与频域轴的序列信息，Google和微软都在大规模语音识别任务上验证了这类2D-LSTM结构的有效性。

以下相关论文可在观看分享会前先预读：

《Improving Latency-Controlled BLSTM Acoustic Models for Online Speech Recognition》

论文地址：http://t.cn/R0015sz

《Modeling Time-Frequency Patterns with LSTM vs. Convolutional Architectures for LVCSR Tasks》

论文地址：http://t.cn/R0011cU

《LSTM Time and Frequency Recurrence for Automatic Speech Recognition》

论文地址：http://t.cn/R0O5cJn

《Exploring Multidimensional LSTMS for Large Vocabulary ASR》

论文地址：http://t.cn/R00BxQI

《Reducing the Computational Complexity of Two-Dimensional LSTMs》

论文地址：http://t.cn/R00d0xt

分享人简介

▼

张弼弘，2017年4月毕业于西北工业大学并获得硕士学位。研究方向是语音识别声学建模，深度学习，机器学习。目前就职于搜狗。

分享时间

▼

北京时间10月11日 20:00

参与方式

▼

扫描海报二维码添加社长微信，备注「搜狗」

————— AI 科技评论招人啦！ —————

我们诚招学术编辑 1 名（全职，坐标北京）

你即将从事的工作内容：

报道海内外人工智能相关学术会议，形成具有影响力的报道内容；
采访高校学术青年领袖，输出人工智能领域的深度观点；
跟进国内外学术热点，深入剖析学术动态；

我们希望你是这样的小伙伴：

英语好，有阅读英文科技网站的习惯；
兴趣广，对人工智能有关注及了解；
态度佳，有求知欲，善于学习；

欢迎发送简历到 guoyixin@leiphone.com

————————————————————

登录查看更多

4

相关内容

声学建模

【ICML2020-华为港科大】RNN和LSTM有长期记忆吗？

【ICML2020-华为港科大】RNN和LSTM有长期记忆吗？

专知会员服务

78+阅读 · 2020年6月25日

CVPR 2020 最佳论文与最佳学生论文！

CVPR 2020 最佳论文与最佳学生论文！

专知会员服务

36+阅读 · 2020年6月17日

【上海交大-ICASSP2020】Transformer端到端的多说话人语音识别

【上海交大-ICASSP2020】Transformer端到端的多说话人语音识别

专知会员服务

51+阅读 · 2020年2月16日

【MIT深度学习课程】深度序列建模，Deep Sequence Modeling

【MIT深度学习课程】深度序列建模，Deep Sequence Modeling

专知会员服务

78+阅读 · 2020年2月3日

【中科院自动化所】序列到序列语音识别的无监督预训练（Unsupervised pre-training for sequence to sequence speech recognition）

【中科院自动化所】序列到序列语音识别的无监督预训练（Unsupervised pre-training for sequence to sequence speech recognition）

专知会员服务

33+阅读 · 2020年1月5日

【CCL 2019】多模态--基于视觉的跨模态文本生成，复旦大学副教授魏忠钰

【CCL 2019】多模态--基于视觉的跨模态文本生成，复旦大学副教授魏忠钰

专知会员服务

74+阅读 · 2019年11月12日

知识图谱更新技术研究及其应用，复旦大学硕士论文

知识图谱更新技术研究及其应用，复旦大学硕士论文

专知会员服务

105+阅读 · 2019年11月4日

网络表示学习，北京大学宋国杰副教授，第八届全国社会媒体处理大会SMP2019

网络表示学习，北京大学宋国杰副教授，第八届全国社会媒体处理大会SMP2019

专知会员服务

41+阅读 · 2019年10月24日

图卷积神经网络在计算金融等交叉学科领域的应用研究，复旦大学魏忠钰副教授，第八届全国社会媒体处理大会SMP2019

图卷积神经网络在计算金融等交叉学科领域的应用研究，复旦大学魏忠钰副教授，第八届全国社会媒体处理大会SMP2019

专知会员服务

41+阅读 · 2019年10月21日

【文献综述】基于端到端深度神经网络的说话人与语言识别综述, 163页ppt,昆山杜克大学李明博士

【文献综述】基于端到端深度神经网络的说话人与语言识别综述, 163页ppt,昆山杜克大学李明博士

专知会员服务

33+阅读 · 2019年9月15日

Interspeech 2019 回顾 | 从顶会看语音技术的发展趋势

Interspeech 2019 回顾 | 从顶会看语音技术的发展趋势

DataFunTalk

11+阅读 · 2020年3月10日

基于端到端深度神经网络的说话人与语言识别综述, 163页ppt,[InterSpeech2019]昆山杜克大学李明博士

基于端到端深度神经网络的说话人与语言识别综述, 163页ppt,[InterSpeech2019]昆山杜克大学李明博士

专知

15+阅读 · 2019年9月22日

Interspeech 2019 | 从顶会看语音技术的发展趋势

Interspeech 2019 | 从顶会看语音技术的发展趋势

AI科技评论

16+阅读 · 2019年9月19日

SFFAI 37 报名通知 | 机器翻译专场之同步双向与多语言机器翻译

SFFAI 37 报名通知 | 机器翻译专场之同步双向与多语言机器翻译

人工智能前沿讲习班

3+阅读 · 2019年6月25日

猿桌会 | 语音识别技术分享

猿桌会 | 语音识别技术分享

AI研习社

5+阅读 · 2018年11月14日

公开课 | 强化学习及其在 NLP 上的应用

公开课 | 强化学习及其在 NLP 上的应用

AI研习社

4+阅读 · 2018年6月14日

专栏 | Bi-LSTM+CRF在文本序列标注中的应用

专栏 | Bi-LSTM+CRF在文本序列标注中的应用

机器之心

14+阅读 · 2018年1月3日

【回顾】基于深度学习的中文唇语识别

【回顾】基于深度学习的中文唇语识别

AI研习社

7+阅读 · 2017年10月20日

电子科大PhD：基于深度学习的中文唇语识别 | 学术青年分享会

电子科大PhD：基于深度学习的中文唇语识别 | 学术青年分享会

AI研习社

8+阅读 · 2017年10月16日

【直播】搜狗研究员：基于LSTM-RNN的语音声学建模技术 | 学术青年分享会

【直播】搜狗研究员：基于LSTM-RNN的语音声学建模技术 | 学术青年分享会

AI研习社

3+阅读 · 2017年10月9日

Exploring RNN-Transducer for Chinese Speech Recognition

Arxiv

4+阅读 · 2019年4月23日

An Attention Enhanced Graph Convolutional LSTM Network for Skeleton-Based Action Recognition

Arxiv

9+阅读 · 2019年3月29日

Context in Neural Machine Translation: A Review of Models and Evaluations

Arxiv

5+阅读 · 2019年1月25日

End-to-end Speech Recognition with Word-based RNN Language Models

End-to-end Speech Recognition with Word-based RNN Language Models

Arxiv

3+阅读 · 2018年8月8日

End-to-End Speech Recognition From the Raw Waveform

Arxiv

3+阅读 · 2018年6月19日

Learning to Guide Decoding for Image Captioning

Arxiv

6+阅读 · 2018年4月3日

Deep Predictive Coding Network for Object Recognition

Arxiv

6+阅读 · 2018年2月13日

State-of-the-art Speech Recognition With Sequence-to-Sequence Models

Arxiv

7+阅读 · 2018年1月18日

DiSAN: Directional Self-Attention Network for RNN/CNN-Free Language Understanding

Arxiv

16+阅读 · 2017年11月20日

Depth-Gated LSTM

Arxiv

4+阅读 · 2015年8月25日

VIP会员

相关主题

长短期记忆网络

相关VIP内容

【ICML2020-华为港科大】RNN和LSTM有长期记忆吗？

【ICML2020-华为港科大】RNN和LSTM有长期记忆吗？

专知会员服务

78+阅读 · 2020年6月25日

CVPR 2020 最佳论文与最佳学生论文！

CVPR 2020 最佳论文与最佳学生论文！

专知会员服务

36+阅读 · 2020年6月17日

【上海交大-ICASSP2020】Transformer端到端的多说话人语音识别

【上海交大-ICASSP2020】Transformer端到端的多说话人语音识别

专知会员服务

51+阅读 · 2020年2月16日

【MIT深度学习课程】深度序列建模，Deep Sequence Modeling

【MIT深度学习课程】深度序列建模，Deep Sequence Modeling

专知会员服务

78+阅读 · 2020年2月3日

【中科院自动化所】序列到序列语音识别的无监督预训练（Unsupervised pre-training for sequence to sequence speech recognition）

【中科院自动化所】序列到序列语音识别的无监督预训练（Unsupervised pre-training for sequence to sequence speech recognition）

专知会员服务

33+阅读 · 2020年1月5日

【CCL 2019】多模态--基于视觉的跨模态文本生成，复旦大学副教授魏忠钰

【CCL 2019】多模态--基于视觉的跨模态文本生成，复旦大学副教授魏忠钰

专知会员服务

74+阅读 · 2019年11月12日

知识图谱更新技术研究及其应用，复旦大学硕士论文

知识图谱更新技术研究及其应用，复旦大学硕士论文

专知会员服务

105+阅读 · 2019年11月4日

网络表示学习，北京大学宋国杰副教授，第八届全国社会媒体处理大会SMP2019

网络表示学习，北京大学宋国杰副教授，第八届全国社会媒体处理大会SMP2019

专知会员服务

41+阅读 · 2019年10月24日

图卷积神经网络在计算金融等交叉学科领域的应用研究，复旦大学魏忠钰副教授，第八届全国社会媒体处理大会SMP2019

图卷积神经网络在计算金融等交叉学科领域的应用研究，复旦大学魏忠钰副教授，第八届全国社会媒体处理大会SMP2019

专知会员服务

41+阅读 · 2019年10月21日

【文献综述】基于端到端深度神经网络的说话人与语言识别综述, 163页ppt,昆山杜克大学李明博士

【文献综述】基于端到端深度神经网络的说话人与语言识别综述, 163页ppt,昆山杜克大学李明博士

专知会员服务

33+阅读 · 2019年9月15日

热门VIP内容

开通专知VIP会员享更多权益服务

《复杂工程系统模型驱动设计决策支持系统：早期设计阶段挑战》最新138页

《日本陆上自卫队2040年作战方式与未来作战研究》最新23页slides

人工智能作为战争武器

《后勤保障》最新23页

相关资讯

Interspeech 2019 回顾 | 从顶会看语音技术的发展趋势

Interspeech 2019 回顾 | 从顶会看语音技术的发展趋势

DataFunTalk

11+阅读 · 2020年3月10日

基于端到端深度神经网络的说话人与语言识别综述, 163页ppt,[InterSpeech2019]昆山杜克大学李明博士

基于端到端深度神经网络的说话人与语言识别综述, 163页ppt,[InterSpeech2019]昆山杜克大学李明博士

专知

15+阅读 · 2019年9月22日

Interspeech 2019 | 从顶会看语音技术的发展趋势

Interspeech 2019 | 从顶会看语音技术的发展趋势

AI科技评论

16+阅读 · 2019年9月19日

SFFAI 37 报名通知 | 机器翻译专场之同步双向与多语言机器翻译

SFFAI 37 报名通知 | 机器翻译专场之同步双向与多语言机器翻译

人工智能前沿讲习班

3+阅读 · 2019年6月25日

猿桌会 | 语音识别技术分享

猿桌会 | 语音识别技术分享

AI研习社

5+阅读 · 2018年11月14日

公开课 | 强化学习及其在 NLP 上的应用

公开课 | 强化学习及其在 NLP 上的应用

AI研习社

4+阅读 · 2018年6月14日

专栏 | Bi-LSTM+CRF在文本序列标注中的应用

专栏 | Bi-LSTM+CRF在文本序列标注中的应用

机器之心

14+阅读 · 2018年1月3日

【回顾】基于深度学习的中文唇语识别

【回顾】基于深度学习的中文唇语识别

AI研习社

7+阅读 · 2017年10月20日

电子科大PhD：基于深度学习的中文唇语识别 | 学术青年分享会

电子科大PhD：基于深度学习的中文唇语识别 | 学术青年分享会

AI研习社

8+阅读 · 2017年10月16日

【直播】搜狗研究员：基于LSTM-RNN的语音声学建模技术 | 学术青年分享会

【直播】搜狗研究员：基于LSTM-RNN的语音声学建模技术 | 学术青年分享会

AI研习社

3+阅读 · 2017年10月9日

相关论文

Exploring RNN-Transducer for Chinese Speech Recognition

Arxiv

4+阅读 · 2019年4月23日

An Attention Enhanced Graph Convolutional LSTM Network for Skeleton-Based Action Recognition

Arxiv

9+阅读 · 2019年3月29日

Context in Neural Machine Translation: A Review of Models and Evaluations

Arxiv

5+阅读 · 2019年1月25日

End-to-end Speech Recognition with Word-based RNN Language Models

End-to-end Speech Recognition with Word-based RNN Language Models

Arxiv

3+阅读 · 2018年8月8日

End-to-End Speech Recognition From the Raw Waveform

Arxiv

3+阅读 · 2018年6月19日

Learning to Guide Decoding for Image Captioning

Arxiv

6+阅读 · 2018年4月3日

Deep Predictive Coding Network for Object Recognition

Arxiv

6+阅读 · 2018年2月13日

State-of-the-art Speech Recognition With Sequence-to-Sequence Models

Arxiv

7+阅读 · 2018年1月18日

DiSAN: Directional Self-Attention Network for RNN/CNN-Free Language Understanding

Arxiv

16+阅读 · 2017年11月20日

Depth-Gated LSTM

Arxiv

4+阅读 · 2015年8月25日

大家都在搜

软件无线电

CMU博士论文

无人机集群

久别重逢话双塔

OpenKG开源系列 | 海洋鱼类百科知识图谱（浙江大学）

微信扫码咨询专知VIP会员