快讯 | Facebook开源语音识别工具包wav2letter

2018 年 1 月 2 日 大数据文摘 文摘菌


今日凌晨,Facebook AI研究中心宣布开源语音识别工具包wav2letter!这是一款简单高效的端到端自动语音识别(ASR)系统,wav2letter 实现的是论文 Wav2Letter: an End-to-End ConvNet-based Speech Recognition System 和 Letter-Based Speech Recognition with Gated ConvNets 中提出的架构。


16年11月,Facebook的三位研究者Ronan Collobert, Christian Puhrsch, Gabriel Synnaeve在arXiv.org上发布文章,正式提出了wav2letter。


文章中研究者介绍,这是一个简单的端到端语音识别模型,结合了基于卷积网络的声学模型和图解码。其被训练输出文字,转录语音,而无需强制对齐音素。wav2letter还引入了一个自动的序列标注训练分割准则,而不需要与CTC一致的对齐方式,这种方式更简单。


项目代码已经发布至GitHub,如果你想直接开始进行语音转录,你可以使用同时被开源的预训练好的一些模型,前提是完成必要的安装。当然,目前能识别的只有英文语音哦!


开源代码GitHub链接:

https://github.com/facebookresearch/wav2letter


论文arXiv链接:

https://arxiv.org/abs/1609.03193


Facebook也发布了公开信介绍这一开源项目,包括该项目主要负责人Ronan Collobert、Facebook AI研究中心负责人Yann Lecan等在内的研究者都在推特上介绍了这一发布。



文摘菌摘录了部分公开信内容如下:


我们刚刚开源我们的语音识别工具:wav2letter


代码地址:

https://github.com/facebookresearch/wav2letter


我们将其与在LibriSpeech语料库中预先训练的一些模型一起发布,支持我们的最新论文Letter-Based Speech Recognition with Gated ConvNets。


wav2letter是在Torch上编写的一个简单的工具包,简化了对端到端语音识别系统的训练,并提供了一个允许快速解码的独立解码器。


它使我们能够复现我们最近的3篇论文(详见参考资料)。


敬请期待我们的更多研究。


Gabriel Synnaeve,Vitaliy Liptchinsky,Neil Zeghidour和Christian Puhrsch。


更多参考资料:


语料库 LibriSpeech。

http://www.openslr.org/12


论文 Letter-Based Speech Recognition with Gated ConvNets。

https://arxiv.org/abs/1712.09444


论文 Wav2Letter: an End-to-End ConvNet-based Speech Recognition System。

https://arxiv.org/abs/1609.03193


论文 Learning Filterbanks from Raw Speech for Phone Recognition。

https://arxiv.org/abs/1711.01161


往期精彩文章

点击图片阅读

GPS脚环计步、AI“鸡”脸识别,如何确保自己吃到了一只幸福健康的鸡

登录查看更多
6

相关内容

语音识别是计算机科学和计算语言学的一个跨学科子领域,它发展了一些方法和技术,使计算机可以将口语识别和翻译成文本。 它也被称为自动语音识别(ASR),计算机语音识别或语音转文本(STT)。它整合了计算机科学,语言学和计算机工程领域的知识和研究。
【Google】平滑对抗训练,Smooth Adversarial Training
专知会员服务
48+阅读 · 2020年7月4日
【Facebook AI】低资源机器翻译,74页ppt
专知会员服务
29+阅读 · 2020年4月8日
【Google论文】ALBERT:自我监督学习语言表达的精简BERT
专知会员服务
23+阅读 · 2019年11月4日
机器学习开源项目Top10
AI100
4+阅读 · 2019年1月20日
盘点2018 年含金量最强的 6 款开源机器学习项目
七月在线实验室
7+阅读 · 2019年1月8日
年度大盘点:机器学习开源项目及框架
云栖社区
3+阅读 · 2018年12月17日
开源自动语音识别系统wav2letter (附实现教程)
七月在线实验室
9+阅读 · 2018年1月8日
一文读懂语音识别史
机械鸡
9+阅读 · 2017年10月16日
Arxiv
3+阅读 · 2018年6月19日
Arxiv
11+阅读 · 2018年3月23日
Arxiv
6+阅读 · 2018年2月26日
Arxiv
8+阅读 · 2018年1月12日
Arxiv
4+阅读 · 2015年8月25日
VIP会员
相关VIP内容
相关资讯
机器学习开源项目Top10
AI100
4+阅读 · 2019年1月20日
盘点2018 年含金量最强的 6 款开源机器学习项目
七月在线实验室
7+阅读 · 2019年1月8日
年度大盘点:机器学习开源项目及框架
云栖社区
3+阅读 · 2018年12月17日
开源自动语音识别系统wav2letter (附实现教程)
七月在线实验室
9+阅读 · 2018年1月8日
一文读懂语音识别史
机械鸡
9+阅读 · 2017年10月16日
Top
微信扫码咨询专知VIP会员