【直播】搜狗研究员：基于LSTM-RNN的语音声学建模技术 | 学术青年分享会 - 专知

会员服务 ·

0

【直播】搜狗研究员：基于LSTM-RNN的语音声学建模技术 | 学术青年分享会

2017 年 10 月 9 日 AI研习社 不灵叔

分享主题

▼

Acoustic Modeling Based on LSTM-RNN in ASR

基于LSTM-RNN的语音声学建模技术

分享内容

▼

LSTM-RNN可以对长时序列信息进行建模，广泛应用于语音识别声学模型建模中。此次主要介绍近期LSTM的一些研究进展包括LC-BLSTM，2D-LSTM等。其中LC-BLSTM采用了双向LSTM结构，并在训练和解码时加入了数帧的未来信息来控制延时，解决了普通双向LSTM无法用于实时语音识别的问题；而2D-LSTM在时间和频域两个维度上进行循环，同时保存时间轴与频域轴的序列信息，Google和微软都在大规模语音识别任务上验证了这类2D-LSTM结构的有效性。

以下相关论文可在观看分享会前先预读：

《Improving Latency-Controlled BLSTM Acoustic Models for Online Speech Recognition》

论文地址：http://t.cn/R0015sz

《Modeling Time-Frequency Patterns with LSTM vs. Convolutional Architectures for LVCSR Tasks》

论文地址：http://t.cn/R0011cU

《LSTM Time and Frequency Recurrence for Automatic Speech Recognition》

论文地址：http://t.cn/R0O5cJn

《Exploring Multidimensional LSTMS for Large Vocabulary ASR》

论文地址：http://t.cn/R00BxQI

《Reducing the Computational Complexity of Two-Dimensional LSTMs》

论文地址：http://t.cn/R00d0xt

分享人简介

▼

张弼弘，2017年4月毕业于西北工业大学并获得硕士学位。研究方向是语音识别声学建模，深度学习，机器学习。目前就职于搜狗。

分享时间

▼

北京时间10月11日 20:00

参与方式

▼

扫描海报二维码添加社长微信，备注「搜狗」

如果你觉得活动不错，欢迎点赞并转发本文~

▼▼▼

登录查看更多

3

相关内容

声学建模

【ICML2020-华为港科大】RNN和LSTM有长期记忆吗？

【ICML2020-华为港科大】RNN和LSTM有长期记忆吗？

专知会员服务

78+阅读 · 2020年6月25日

CVPR 2020 最佳论文与最佳学生论文！

CVPR 2020 最佳论文与最佳学生论文！

专知会员服务

36+阅读 · 2020年6月17日

【上海交大-ICASSP2020】Transformer端到端的多说话人语音识别

【上海交大-ICASSP2020】Transformer端到端的多说话人语音识别

专知会员服务

51+阅读 · 2020年2月16日

【MIT深度学习课程】深度序列建模，Deep Sequence Modeling

【MIT深度学习课程】深度序列建模，Deep Sequence Modeling

专知会员服务

78+阅读 · 2020年2月3日

【中科院自动化所】序列到序列语音识别的无监督预训练（Unsupervised pre-training for sequence to sequence speech recognition）

【中科院自动化所】序列到序列语音识别的无监督预训练（Unsupervised pre-training for sequence to sequence speech recognition）

专知会员服务

33+阅读 · 2020年1月5日

【GAN】生成式对抗网络GAN在语音自然语言处理中的应用，台大李宏毅老师，附247页ppt下载

【GAN】生成式对抗网络GAN在语音自然语言处理中的应用，台大李宏毅老师，附247页ppt下载

专知会员服务

115+阅读 · 2019年11月26日

【CCL 2019】多模态--基于视觉的跨模态文本生成，复旦大学副教授魏忠钰

【CCL 2019】多模态--基于视觉的跨模态文本生成，复旦大学副教授魏忠钰

专知会员服务

74+阅读 · 2019年11月12日

【CCF优秀博士学位论文奖-2019初评】基于深度学习的场景分割技术研究，中科院计算所张蕊

【CCF优秀博士学位论文奖-2019初评】基于深度学习的场景分割技术研究，中科院计算所张蕊

专知会员服务

32+阅读 · 2019年11月8日

知识图谱更新技术研究及其应用，复旦大学硕士论文

知识图谱更新技术研究及其应用，复旦大学硕士论文

专知会员服务

105+阅读 · 2019年11月4日

【文献综述】基于端到端深度神经网络的说话人与语言识别综述, 163页ppt,昆山杜克大学李明博士

【文献综述】基于端到端深度神经网络的说话人与语言识别综述, 163页ppt,昆山杜克大学李明博士

专知会员服务

33+阅读 · 2019年9月15日

Interspeech 2019 回顾 | 从顶会看语音技术的发展趋势

Interspeech 2019 回顾 | 从顶会看语音技术的发展趋势

DataFunTalk

11+阅读 · 2020年3月10日

基于端到端深度神经网络的说话人与语言识别综述, 163页ppt,[InterSpeech2019]昆山杜克大学李明博士

基于端到端深度神经网络的说话人与语言识别综述, 163页ppt,[InterSpeech2019]昆山杜克大学李明博士

专知

15+阅读 · 2019年9月22日

Interspeech 2019 | 从顶会看语音技术的发展趋势

Interspeech 2019 | 从顶会看语音技术的发展趋势

AI科技评论

16+阅读 · 2019年9月19日

SFFAI 31 报名通知 | 情感语音识别与合成

SFFAI 31 报名通知 | 情感语音识别与合成

人工智能前沿讲习班

17+阅读 · 2019年5月30日

猿桌会 | 语音识别技术分享

猿桌会 | 语音识别技术分享

AI研习社

5+阅读 · 2018年11月14日

干货｜从LSTM到Seq2Seq

干货｜从LSTM到Seq2Seq

全球人工智能

15+阅读 · 2018年1月9日

【回顾】基于深度学习的中文唇语识别

【回顾】基于深度学习的中文唇语识别

AI研习社

7+阅读 · 2017年10月20日

电子科大PhD：基于深度学习的中文唇语识别 | 学术青年分享会

电子科大PhD：基于深度学习的中文唇语识别 | 学术青年分享会

AI研习社

8+阅读 · 2017年10月16日

IJCAI 2017提名最佳学生论文作者解读 | 学术青年分享会

IJCAI 2017提名最佳学生论文作者解读 | 学术青年分享会

AI研习社

3+阅读 · 2017年10月11日

直播 | 搜狗研究员：基于LSTM-RNN的语音声学建模技术 | 学术青年分享会

直播 | 搜狗研究员：基于LSTM-RNN的语音声学建模技术 | 学术青年分享会

AI科技评论

4+阅读 · 2017年10月10日

Hierarchy Parsing for Image Captioning

Hierarchy Parsing for Image Captioning

Arxiv

6+阅读 · 2019年9月10日

Exploring RNN-Transducer for Chinese Speech Recognition

Arxiv

4+阅读 · 2019年4月23日

An Attention Enhanced Graph Convolutional LSTM Network for Skeleton-Based Action Recognition

Arxiv

9+阅读 · 2019年3月29日

Context in Neural Machine Translation: A Review of Models and Evaluations

Arxiv

5+阅读 · 2019年1月25日

End-to-end Speech Recognition with Word-based RNN Language Models

End-to-end Speech Recognition with Word-based RNN Language Models

Arxiv

3+阅读 · 2018年8月8日

End-to-End Speech Recognition From the Raw Waveform

Arxiv

3+阅读 · 2018年6月19日

Syllable-Based Sequence-to-Sequence Speech Recognition with the Transformer in Mandarin Chinese

Arxiv

5+阅读 · 2018年6月4日

Deep Predictive Coding Network for Object Recognition

Arxiv

6+阅读 · 2018年2月13日

State-of-the-art Speech Recognition With Sequence-to-Sequence Models

Arxiv

7+阅读 · 2018年1月18日

DiSAN: Directional Self-Attention Network for RNN/CNN-Free Language Understanding

Arxiv

16+阅读 · 2017年11月20日

VIP会员

相关主题

长短期记忆网络

相关VIP内容

【ICML2020-华为港科大】RNN和LSTM有长期记忆吗？

【ICML2020-华为港科大】RNN和LSTM有长期记忆吗？

专知会员服务

78+阅读 · 2020年6月25日

CVPR 2020 最佳论文与最佳学生论文！

CVPR 2020 最佳论文与最佳学生论文！

专知会员服务

36+阅读 · 2020年6月17日

【上海交大-ICASSP2020】Transformer端到端的多说话人语音识别

【上海交大-ICASSP2020】Transformer端到端的多说话人语音识别

专知会员服务

51+阅读 · 2020年2月16日

【MIT深度学习课程】深度序列建模，Deep Sequence Modeling

【MIT深度学习课程】深度序列建模，Deep Sequence Modeling

专知会员服务

78+阅读 · 2020年2月3日

【中科院自动化所】序列到序列语音识别的无监督预训练（Unsupervised pre-training for sequence to sequence speech recognition）

【中科院自动化所】序列到序列语音识别的无监督预训练（Unsupervised pre-training for sequence to sequence speech recognition）

专知会员服务

33+阅读 · 2020年1月5日

【GAN】生成式对抗网络GAN在语音自然语言处理中的应用，台大李宏毅老师，附247页ppt下载

【GAN】生成式对抗网络GAN在语音自然语言处理中的应用，台大李宏毅老师，附247页ppt下载

专知会员服务

115+阅读 · 2019年11月26日

【CCL 2019】多模态--基于视觉的跨模态文本生成，复旦大学副教授魏忠钰

【CCL 2019】多模态--基于视觉的跨模态文本生成，复旦大学副教授魏忠钰

专知会员服务

74+阅读 · 2019年11月12日

【CCF优秀博士学位论文奖-2019初评】基于深度学习的场景分割技术研究，中科院计算所张蕊

【CCF优秀博士学位论文奖-2019初评】基于深度学习的场景分割技术研究，中科院计算所张蕊

专知会员服务

32+阅读 · 2019年11月8日

知识图谱更新技术研究及其应用，复旦大学硕士论文

知识图谱更新技术研究及其应用，复旦大学硕士论文

专知会员服务

105+阅读 · 2019年11月4日

【文献综述】基于端到端深度神经网络的说话人与语言识别综述, 163页ppt,昆山杜克大学李明博士

【文献综述】基于端到端深度神经网络的说话人与语言识别综述, 163页ppt,昆山杜克大学李明博士

专知会员服务

33+阅读 · 2019年9月15日

热门VIP内容

开通专知VIP会员享更多权益服务

《战区安全决策课程体系》最新244页

《"无人机航母"原型平台》

任务规划与地形分析：现代复杂环境作战导航体系

《攻击场景描述形式化模型研究》

相关资讯

Interspeech 2019 回顾 | 从顶会看语音技术的发展趋势

Interspeech 2019 回顾 | 从顶会看语音技术的发展趋势

DataFunTalk

11+阅读 · 2020年3月10日

基于端到端深度神经网络的说话人与语言识别综述, 163页ppt,[InterSpeech2019]昆山杜克大学李明博士

基于端到端深度神经网络的说话人与语言识别综述, 163页ppt,[InterSpeech2019]昆山杜克大学李明博士

专知

15+阅读 · 2019年9月22日

Interspeech 2019 | 从顶会看语音技术的发展趋势

Interspeech 2019 | 从顶会看语音技术的发展趋势

AI科技评论

16+阅读 · 2019年9月19日

SFFAI 31 报名通知 | 情感语音识别与合成

SFFAI 31 报名通知 | 情感语音识别与合成

人工智能前沿讲习班

17+阅读 · 2019年5月30日

猿桌会 | 语音识别技术分享

猿桌会 | 语音识别技术分享

AI研习社

5+阅读 · 2018年11月14日

干货｜从LSTM到Seq2Seq

干货｜从LSTM到Seq2Seq

全球人工智能

15+阅读 · 2018年1月9日

【回顾】基于深度学习的中文唇语识别

【回顾】基于深度学习的中文唇语识别

AI研习社

7+阅读 · 2017年10月20日

电子科大PhD：基于深度学习的中文唇语识别 | 学术青年分享会

电子科大PhD：基于深度学习的中文唇语识别 | 学术青年分享会

AI研习社

8+阅读 · 2017年10月16日

IJCAI 2017提名最佳学生论文作者解读 | 学术青年分享会

IJCAI 2017提名最佳学生论文作者解读 | 学术青年分享会

AI研习社

3+阅读 · 2017年10月11日

直播 | 搜狗研究员：基于LSTM-RNN的语音声学建模技术 | 学术青年分享会

直播 | 搜狗研究员：基于LSTM-RNN的语音声学建模技术 | 学术青年分享会

AI科技评论

4+阅读 · 2017年10月10日

相关论文

Hierarchy Parsing for Image Captioning

Hierarchy Parsing for Image Captioning

Arxiv

6+阅读 · 2019年9月10日

Exploring RNN-Transducer for Chinese Speech Recognition

Arxiv

4+阅读 · 2019年4月23日

An Attention Enhanced Graph Convolutional LSTM Network for Skeleton-Based Action Recognition

Arxiv

9+阅读 · 2019年3月29日

Context in Neural Machine Translation: A Review of Models and Evaluations

Arxiv

5+阅读 · 2019年1月25日

End-to-end Speech Recognition with Word-based RNN Language Models

End-to-end Speech Recognition with Word-based RNN Language Models

Arxiv

3+阅读 · 2018年8月8日

End-to-End Speech Recognition From the Raw Waveform

Arxiv

3+阅读 · 2018年6月19日

Syllable-Based Sequence-to-Sequence Speech Recognition with the Transformer in Mandarin Chinese

Arxiv

5+阅读 · 2018年6月4日

Deep Predictive Coding Network for Object Recognition

Arxiv

6+阅读 · 2018年2月13日

State-of-the-art Speech Recognition With Sequence-to-Sequence Models

Arxiv

7+阅读 · 2018年1月18日

DiSAN: Directional Self-Attention Network for RNN/CNN-Free Language Understanding

Arxiv

16+阅读 · 2017年11月20日

大家都在搜

无人机集群

久别重逢话双塔

软件无线电

国防科技创新

无人机航拍交通事故现场勘查处置系统——行业第一的警用事故处理软件

微信扫码咨询专知VIP会员