自动语音识别(ASR)涉及将录制的语音自动转录为文本的模型、算法和系统。这是一个困难的问题,因为记录的语音可能是高度可变的——我们不一定知道说话者是谁,语音在哪里被记录,或者信号中是否有其他声源(如噪声或竞争的说话者)。

解决语音识别问题需要对机器学习、信号处理和声学语音学有一定的了解。在本课程中,我们将介绍所需的理论背景,以及如何将理论转化为有用的语音识别系统。实验课程和课程将使用开源的OpenFst工具包以及Python和后来的Kaldi来构建和运行语音识别系统。

成为VIP会员查看完整内容
22

相关内容

博弈论视角下的多智能体强化学习综述,129页pdf与76页Slides
专知会员服务
135+阅读 · 2022年11月26日
《美国防部对抗性机器学习》34页slides,卡内基梅隆大学
专知会员服务
64+阅读 · 2022年11月12日
不可错过!斯坦福《语音语言处理》技术课程
专知会员服务
38+阅读 · 2022年5月2日
多语言语音识别声学模型建模方法最新进展
专知会员服务
32+阅读 · 2022年2月7日
未来十年,AI 语音识别将朝着这五个方向发展
THU数据派
1+阅读 · 2022年9月2日
Seq2seq强化学习实战 (Pytorch, Tensorflow, Theano)
专知
15+阅读 · 2018年1月16日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2023年2月17日
Arxiv
0+阅读 · 2023年2月16日
Arxiv
20+阅读 · 2021年9月21日
Arxiv
15+阅读 · 2019年6月25日
VIP会员
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员