Conversational bilingual speech encompasses three types of utterances: two purely monolingual types and one intra-sententially code-switched type. In this work, we propose a general framework to jointly model the likelihoods of the monolingual and code-switch sub-tasks that comprise bilingual speech recognition. By defining the monolingual sub-tasks with label-to-frame synchronization, our joint modeling framework can be conditionally factorized such that the final bilingual output, which may or may not be code-switched, is obtained given only monolingual information. We show that this conditionally factorized joint framework can be modeled by an end-to-end differentiable neural network. We demonstrate the efficacy of our proposed model on bilingual Mandarin-English speech recognition across both monolingual and code-switched corpora.


翻译:连通双语语言包括三种发音:两种纯单一语言类型和一种流用密码转换类型。在这项工作中,我们提出了一个总体框架,以共同模拟单语和代码转换子任务的可能性,其中包括双语语言识别。通过用标签同步和框架同步来界定单语子任务,我们的联合建模框架可以有条件地设定要素,这样最后的双语产出,无论是否被代码转换,只能获得单语信息。我们表明,这一有条件的因子化联合框架可以通过端到端差异神经网络来建模。我们展示了我们提议的单语和代码转换的子公司双语汉语英语识别模式的有效性。

0
下载
关闭预览

相关内容

AAAI 2022:三角分解一致性约束的端到端语音翻译
专知会员服务
8+阅读 · 2022年1月17日
专知会员服务
46+阅读 · 2021年10月10日
专知会员服务
85+阅读 · 2021年6月30日
专知会员服务
31+阅读 · 2021年6月12日
机器学习入门的经验与建议
专知会员服务
92+阅读 · 2019年10月10日
最新BERT相关论文清单,BERT-related Papers
专知会员服务
52+阅读 · 2019年9月29日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
27+阅读 · 2019年5月18日
vae 相关论文 表示学习 1
CreateAMind
12+阅读 · 2018年9月6日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
VIP会员
Top
微信扫码咨询专知VIP会员