We present the Tongue and Lips corpus (TaL), a multi-speaker corpus of audio, ultrasound tongue imaging, and lip videos. TaL consists of two parts: TaL1 is a set of six recording sessions of one professional voice talent, a male native speaker of English; TaL80 is a set of recording sessions of 81 native speakers of English without voice talent experience. Overall, the corpus contains 24 hours of parallel ultrasound, video, and audio data, of which approximately 13.5 hours are speech. This paper describes the corpus and presents benchmark results for the tasks of speech recognition, speech synthesis (articulatory-to-acoustic mapping), and automatic synchronisation of ultrasound to audio. The TaL corpus is publicly available under the CC BY-NC 4.0 license.


翻译:我们展示了“舌声和嘴唇声声”(TAL),这是一个多语种的音频、超声波舌成像和唇语视频库。TAL由两部分组成:TAL1是一套由一位专业语音人才(英语男性母语)组成的六次录音会议;TAL80是一套81个英语本地人(没有声音才经验)的录音会议。总体而言,TAL包含24小时的平行超声波、视频和音频数据,其中约13.5小时为演讲时间。本文描述了声音识别、语音合成(人工合成)和超声波自动同步工作的基本结果,根据CC BY-NC 4.0的许可证,可公开查阅TAL声波。

0
下载
关闭预览

相关内容

专知会员服务
53+阅读 · 2020年10月11日
迁移学习简明教程,11页ppt
专知会员服务
107+阅读 · 2020年8月4日
100+篇《自监督学习(Self-Supervised Learning)》论文最新合集
专知会员服务
161+阅读 · 2020年3月18日
《DeepGCNs: Making GCNs Go as Deep as CNNs》
专知会员服务
30+阅读 · 2019年10月17日
机器学习入门的经验与建议
专知会员服务
91+阅读 · 2019年10月10日
BERT/Transformer/迁移学习NLP资源大列表
专知
19+阅读 · 2019年6月9日
Transferring Knowledge across Learning Processes
CreateAMind
26+阅读 · 2019年5月18日
Unsupervised Learning via Meta-Learning
CreateAMind
41+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
资源 | 一份非常全面的开源数据集
黑龙江大学自然语言处理实验室
10+阅读 · 2018年9月7日
五个精彩实用的自然语言处理资源
机器学习研究会
6+阅读 · 2018年2月23日
深度学习、机器学习图像/人脸/字幕/自动驾驶数据集(Dataset)汇总
数据挖掘入门与实战
3+阅读 · 2018年1月16日
Arxiv
0+阅读 · 2021年1月14日
Arxiv
8+阅读 · 2018年11月27日
Arxiv
3+阅读 · 2018年4月5日
VIP会员
相关资讯
BERT/Transformer/迁移学习NLP资源大列表
专知
19+阅读 · 2019年6月9日
Transferring Knowledge across Learning Processes
CreateAMind
26+阅读 · 2019年5月18日
Unsupervised Learning via Meta-Learning
CreateAMind
41+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
资源 | 一份非常全面的开源数据集
黑龙江大学自然语言处理实验室
10+阅读 · 2018年9月7日
五个精彩实用的自然语言处理资源
机器学习研究会
6+阅读 · 2018年2月23日
深度学习、机器学习图像/人脸/字幕/自动驾驶数据集(Dataset)汇总
数据挖掘入门与实战
3+阅读 · 2018年1月16日
Top
微信扫码咨询专知VIP会员