Mandarin-English code-switching (CS) is frequently used among East and Southeast Asian people. However, the intra-sentence language switching of the two very different languages makes recognizing CS speech challenging. Meanwhile, the recent successful non-autoregressive (NAR) ASR models remove the need for left-to-right beam decoding in autoregressive (AR) models and achieved outstanding performance and fast inference speed. Therefore, in this paper, we took advantage of the Mask-CTC NAR ASR framework to tackle the CS speech recognition issue. We propose changing the Mandarin output target of the encoder to Pinyin for faster encoder training, and introduce Pinyin-to-Mandarin decoder to learn contextualized information. Moreover, we propose word embedding label smoothing to regularize the decoder with contextualized information and projection matrix regularization to bridge that gap between the encoder and decoder. We evaluate the proposed methods on the SEAME corpus and achieved exciting results.


翻译:东亚和东南亚人民经常使用普通话-英语代码转换(CS),但是,两种非常不同的语言在句内语言转换使得承认CS语言具有挑战性。与此同时,最近成功的非自动递增(NAR) ASR模型取消了在自动递增模式中左对右波波束解码的必要性,并取得了杰出的性能和快速引文速度。因此,在本文件中,我们利用Mask-CT NAR ASR框架解决CS语音识别问题。我们提议将编码器的普通话输出目标改为Pinyin,以进行更快的编码器培训,并引入Pininin-Mandarin解码器学习背景化信息。此外,我们提议用“内嵌”字来平稳地将解码器与背景化信息进行规范,并预测矩阵规范以弥合编码器与解码器之间的差距。我们评估了SEAMEprography的拟议方法并取得了令人振奋的成果。

0
下载
关闭预览

相关内容

最新《时序分类:深度序列模型》教程,172页ppt
专知会员服务
42+阅读 · 2020年11月11日
自动结构变分推理,Automatic structured variational inference
专知会员服务
38+阅读 · 2020年2月10日
Transformer文本分类代码
专知会员服务
116+阅读 · 2020年2月3日
Keras François Chollet 《Deep Learning with Python 》, 386页pdf
专知会员服务
151+阅读 · 2019年10月12日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
赛尔推荐 | 第3期
哈工大SCIR
7+阅读 · 2018年3月28日
开源自动语音识别系统wav2letter (附实现教程)
七月在线实验室
9+阅读 · 2018年1月8日
用Python实现BP神经网络(附代码)
七月在线实验室
4+阅读 · 2017年12月4日
自然语言处理 (三) 之 word embedding
DeepLearning中文论坛
19+阅读 · 2015年8月3日
自然语言处理(二)机器翻译 篇 (NLP: machine translation)
DeepLearning中文论坛
10+阅读 · 2015年7月1日
Arxiv
11+阅读 · 2019年6月19日
VIP会员
相关VIP内容
相关资讯
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
赛尔推荐 | 第3期
哈工大SCIR
7+阅读 · 2018年3月28日
开源自动语音识别系统wav2letter (附实现教程)
七月在线实验室
9+阅读 · 2018年1月8日
用Python实现BP神经网络(附代码)
七月在线实验室
4+阅读 · 2017年12月4日
自然语言处理 (三) 之 word embedding
DeepLearning中文论坛
19+阅读 · 2015年8月3日
自然语言处理(二)机器翻译 篇 (NLP: machine translation)
DeepLearning中文论坛
10+阅读 · 2015年7月1日
Top
微信扫码咨询专知VIP会员