分享主题
▼
Acoustic Modeling Based on LSTM-RNN in ASR
基于LSTM-RNN的语音声学建模技术
分享内容
▼
LSTM-RNN可以对长时序列信息进行建模,广泛应用于语音识别声学模型建模中。此次主要介绍近期LSTM的一些研究进展包括LC-BLSTM,2D-LSTM等。其中LC-BLSTM采用了双向LSTM结构,并在训练和解码时加入了数帧的未来信息来控制延时,解决了普通双向LSTM无法用于实时语音识别的问题;而2D-LSTM在时间和频域两个维度上进行循环,同时保存时间轴与频域轴的序列信息,Google和微软都在大规模语音识别任务上验证了这类2D-LSTM结构的有效性。
以下相关论文可在观看分享会前先预读:
《Improving Latency-Controlled BLSTM Acoustic Models for Online Speech Recognition》
论文地址:http://t.cn/R0015sz
《Modeling Time-Frequency Patterns with LSTM vs. Convolutional Architectures for LVCSR Tasks》
论文地址:http://t.cn/R0011cU
《LSTM Time and Frequency Recurrence for Automatic Speech Recognition》
论文地址:http://t.cn/R0O5cJn
《Exploring Multidimensional LSTMS for Large Vocabulary ASR》
论文地址:http://t.cn/R00BxQI
《Reducing the Computational Complexity of Two-Dimensional LSTMs》
论文地址:http://t.cn/R00d0xt
分享人简介
▼
张弼弘,2017年4月毕业于西北工业大学并获得硕士学位。研究方向是语音识别声学建模,深度学习,机器学习。目前就职于搜狗。
分享时间
▼
北京时间10月11日 20:00
参与方式
▼
扫描海报二维码添加社长微信,备注「搜狗」
————— AI 科技评论招人啦! —————
你即将从事的工作内容:
报道海内外人工智能相关学术会议,形成具有影响力的报道内容;
采访高校学术青年领袖,输出人工智能领域的深度观点;
跟进国内外学术热点,深入剖析学术动态;
我们希望你是这样的小伙伴:
英语好,有阅读英文科技网站的习惯;
兴趣广,对人工智能有关注及了解;
态度佳,有求知欲,善于学习;
欢迎发送简历到 guoyixin@leiphone.com
————————————————————