主题: Techniques for Vocabulary Expansion in Hybrid Speech Recognition Systems

摘要: 词汇不足(OOV)的问题对于任何语音识别系统都是典型的,混合系统通常被构造为识别一组固定的单词,并且很少包含系统开发过程中会遇到的所有单词。 覆盖OOV的一种流行方法是使用子词单位而不是词。 如果可以从当前子词单元构建该词,则这样的系统可以潜在地识别任何以前看不见的词,但是也可以识别不存在的词。 另一种流行的方法是修改系统的HMM部分,以便可以使用我们要添加到系统中的自定义单词集轻松有效地扩展它。 在本文中,我们在图形构造和搜索方法级别上探索了该解决方案的不同现有方法。 我们还提出了一种新颖的词汇扩展技术,该技术解决了有关识别图处理的一些常见内部子例程问题。

成为VIP会员查看完整内容
17

相关内容

A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
改进语音识别性能的数据增强技巧
深度学习每日摘要
8+阅读 · 2018年4月22日
一文读懂语音识别史
机械鸡
9+阅读 · 2017年10月16日
端对端的深度卷积神经网络在语音识别中的应用
深度学习每日摘要
6+阅读 · 2017年7月18日
A Survey of Deep Learning for Scientific Discovery
Arxiv
29+阅读 · 2020年3月26日
Advances in Online Audio-Visual Meeting Transcription
Arxiv
4+阅读 · 2019年12月10日
Arxiv
15+阅读 · 2019年6月25日
A Survey on Deep Learning for Named Entity Recognition
Arxiv
73+阅读 · 2018年12月22日
Arxiv
3+阅读 · 2018年6月19日
VIP会员
相关VIP内容
微信扫码咨询专知VIP会员