介绍口语技术,重点介绍对话和会话系统。深度学习等方法用于自动语音识别、语音合成、影响检测、对话管理,以及数字助理和语音理解系统的应用。
本课程围绕讲座、作业和课程项目设计,为学生提供建立口语系统的实际经验。我们将使用现代软件工具和算法方法。没有考试。我们的目标是让每个学生都能做出自己引以为豪的东西。
有四份作业。作业题目:
介绍音频分析和口语工具
使用Amazon Alexa Skills Kit构建一个完整的对话系统
利用PyTorch实现端到端深度神经网络语音识别方法
使用高级深度学习工具包进行语音识别(speech brain)和语音克隆
讲者:
目录内容:
第一周: 介绍和声学语音学
第二周: 对话入门
第三周: 对话中的机器学习
第四周: 课程项目和自动语音识别(ASR)介绍
第五周: 自动语音识别
第六周: 高级ASR
第七周: 带有现代工具包的口语产品
第八周: 语音合成/从文本到语音(TTS)
第九周: 实用TTS和意义提取
第十周: 海报展示和总结
专知便捷查看
便捷下载,请关注专知公众号(点击上方蓝色专知关注)
后台回复“CS224S” 就可以获取《不可错过!斯坦福《语音语言处理》技术课程》专知下载链接