主题: Techniques for Vocabulary Expansion in Hybrid Speech Recognition Systems
摘要: 词汇不足(OOV)的问题对于任何语音识别系统都是典型的,混合系统通常被构造为识别一组固定的单词,并且很少包含系统开发过程中会遇到的所有单词。 覆盖OOV的一种流行方法是使用子词单位而不是词。 如果可以从当前子词单元构建该词,则这样的系统可以潜在地识别任何以前看不见的词,但是也可以识别不存在的词。 另一种流行的方法是修改系统的HMM部分,以便可以使用我们要添加到系统中的自定义单词集轻松有效地扩展它。 在本文中,我们在图形构造和搜索方法级别上探索了该解决方案的不同现有方法。 我们还提出了一种新颖的词汇扩展技术,该技术解决了有关识别图处理的一些常见内部子例程问题。