介绍口语技术,重点介绍对话和会话系统。深度学习等方法用于自动语音识别、语音合成、影响检测、对话管理,以及数字助理和语音理解系统的应用。
本课程围绕讲座、作业和课程项目设计,为学生提供建立口语系统的实际经验。我们将使用现代软件工具和算法方法。没有考试。我们的目标是让每个学生都能做出自己引以为豪的东西。
有四份作业。作业题目: 介绍音频分析和口语工具 使用Amazon Alexa Skills Kit构建一个完整的对话系统 利用PyTorch实现端到端深度神经网络语音识别方法 使用高级深度学习工具包进行语音识别(speech brain)和语音克隆
讲者:
目录内容:
第一周: 介绍和声学语音学 第二周: 对话入门 第三周: 对话中的机器学习 第四周: 课程项目和自动语音识别(ASR)介绍 第五周: 自动语音识别 第六周: 高级ASR 第七周: 带有现代工具包的口语产品 第八周: 语音合成/从文本到语音(TTS) 第九周: 实用TTS和意义提取 第十周: 海报展示和总结