【导读】CMU近日发布大规模语音数据集,提供音频、对齐文本和单词发音的700多种不同语言的数据集。平均而言,每种语言提供大约20个小时的句长的转录。
数据爬取自:http://www.bible.is/
List of Languages with relative scores of accuracy of alignment
http://festvox.org/cmu_wilderness/
Map of Languages geopositioned
http://festvox.org/cmu_wilderness/map.html
Github链接地址:
https://github.com/festvox/datasets-CMU_Wilderness
-END-
专 · 知
人工智能领域26个主题知识资料全集获取与加入专知人工智能服务群: 欢迎微信扫一扫加入专知人工智能知识星球群,获取专业知识教程视频资料和与专家交流咨询!
请PC登录www.zhuanzhi.ai或者点击阅读原文,注册登录专知,获取更多AI知识资料!
请加专知小助手微信(扫一扫如下二维码添加),加入专知主题群(请备注主题类型:AI、NLP、CV、 KG等)交流~
请关注专知公众号,获取人工智能的专业知识!
点击“阅读原文”,使用专知