导读
要说生活里最常见的AI应用场景,语音合成与识别当属大家最为耳熟能详的场景之一了。
项目介绍
话不多说,先来看项目中给出的效果展示。
语音识别
输入音频 1
识别结果 1
I knocked at the door on the ancient side of the building.
输入音频 2
识别结果 2
我认为跑步最重要的就是给我带来了身体健康。
语音翻译(英译中)
输入音频
识别结果
我 在 这栋 建筑 的 古老 门上 敲门。
语音合成
输入文本 1
Life was like a box of chocolates, you never know what you're gonna get.
合成音频 1
输入文本 2
早上好,今天是2020/10/29,最低温度是-3°C。
合成音频 2
https://github.com/PaddlePaddle/PaddleSpeech
安装测试效果
生成的效果大家可以听一下~
然后,带着好奇心,我们再把合成的结果送到语音识别试一下,看看效果:
除了出色的效果,易用的体验,我们再看看这个项目中还有什么宝藏可以挖掘,果然我们发现项目中还包含丰富的预训练模型,并且语音识别和语音合成均支持自定义训练。
丰富的预训练模型
完善的文档教程
并且开源以来,收到开发者的广泛关注,已经有大量开发者投入到项目的建设中并且贡献内容。
别的不需要多说了,请大家访问GitHub亲自体验吧:
https://github.com/PaddlePaddle/PaddleSpeech
直播课程,大牛带学
为了帮助大家了解更多语音技术前沿进展,玩转开源项目,12月21日-24日每晚20:15-21:30,由百度研究院深度学习实验室(美研)主任黄亮老师领衔,多位语音领域资深工程师为大家带来一套精品技术直播课,详解语音方向的核心技术。
PaddleSpeech项目地址:
GitHub: https://github.com/PaddlePaddle/PaddleSpeech
Gitee: https://gitee.com/paddlepaddle/PaddleSpeech