This paper describes the NTNU ASR system participating in the Interspeech 2020 Non-Native Children's Speech ASR Challenge supported by the SIG-CHILD group of ISCA. This ASR shared task is made much more challenging due to the coexisting diversity of non-native and children speaking characteristics. In the setting of closed-track evaluation, all participants were restricted to develop their systems merely based on the speech and text corpora provided by the organizer. To work around this under-resourced issue, we built our ASR system on top of CNN-TDNNF-based acoustic models, meanwhile harnessing the synergistic power of various data augmentation strategies, including both utterance- and word-level speed perturbation and spectrogram augmentation, alongside a simple yet effective data-cleansing approach. All variants of our ASR system employed an RNN-based language model to rescore the first-pass recognition hypotheses, which was trained solely on the text dataset released by the organizer. Our system with the best configuration came out in second place, resulting in a word error rate (WER) of 17.59 %, while those of the top-performing, second runner-up and official baseline systems are 15.67%, 18.71%, 35.09%, respectively.


翻译:本文介绍了参与2020年无母语儿童演讲的跨语音2020年非母语儿童演讲ASR挑战的NTNU ASR系统。由于非本地和儿童说话特点的多样性并存,这项共同任务变得更具有挑战性。在设定闭路评估时,所有参与者都局限于仅仅根据组织者提供的讲话和文本组合来开发自己的系统。为了围绕这一资源不足的问题开展工作,我们在CNN-TDNNF基于CNN-TDNNF的音响模型之上建立了我们的ASR系统,同时利用各种数据增强战略的协同能力,包括发音和字级速度渗透和光谱增强,以及简单而有效的数据清理方法。我们的ASR系统的所有变体都使用了基于RNNE的语文模型来重新定位第一流识别假设,仅用组织者发布的文本数据集来培训。我们采用最佳配置的系统排在第二位,导致17.59 %的字差率(WER),分别为15.09 % 和18.09 % 的官方系统最高运行率为15.9%,最高运行率为18.9%。

0
下载
关闭预览

相关内容

NTNU是一所国际化的大学,总部设在Trondheim 和Ålesund and Gjøvik校园里。NTNU在科学技术方面有着重要的地位,各种专业学习课程,以及广泛的学术范围,其中还包括人文、社会科学、经济学、医学、健康科学、教育科学、建筑、企业家精神、艺术学科和艺术活动。
Stabilizing Transformers for Reinforcement Learning
专知会员服务
60+阅读 · 2019年10月17日
Keras François Chollet 《Deep Learning with Python 》, 386页pdf
专知会员服务
154+阅读 · 2019年10月12日
强化学习最新教程,17页pdf
专知会员服务
177+阅读 · 2019年10月11日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
Call for Participation: Shared Tasks in NLPCC 2019
中国计算机学会
5+阅读 · 2019年3月22日
人工智能 | SCI期刊专刊信息3条
Call4Papers
5+阅读 · 2019年1月10日
大数据 | 顶级SCI期刊专刊/国际会议信息7条
Call4Papers
10+阅读 · 2018年12月29日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
人工智能 | 国际会议信息10条
Call4Papers
5+阅读 · 2018年12月18日
推荐|深度强化学习聊天机器人(附论文)!
全球人工智能
4+阅读 · 2018年1月30日
Arxiv
6+阅读 · 2020年4月14日
Arxiv
8+阅读 · 2018年11月27日
VIP会员
Top
微信扫码咨询专知VIP会员