自动语音识别:简介、当前趋势和有待解决的问题，97页slides

自动语音识别(ASR)涉及将录制的语音自动转录为文本的模型、算法和系统。这是一个困难的问题，因为记录的语音可能是高度可变的——我们不一定知道说话者是谁，语音在哪里被记录，或者信号中是否有其他声源(如噪声或竞争的说话者)。

解决语音识别问题需要对机器学习、信号处理和声学语音学有一定的了解。在本课程中，我们将介绍所需的理论背景，以及如何将理论转化为有用的语音识别系统。实验课程和课程将使用开源的OpenFst工具包以及Python和后来的Kaldi来构建和运行语音识别系统。

成为VIP会员查看完整内容

相关内容

博弈论视角下的多智能体强化学习综述,129页pdf与76页Slides

专知会员服务

140+阅读 · 2022年11月26日

《美国防部对抗性机器学习》34页slides，卡内基梅隆大学

专知会员服务

65+阅读 · 2022年11月12日

不可错过！斯坦福《语音语言处理》技术课程

专知会员服务

41+阅读 · 2022年5月2日

多语言语音识别声学模型建模方法最新进展

专知会员服务

36+阅读 · 2022年2月7日

如何预测序列？看这份IJCAI2021亚马逊《大时间序列预测》教程，附301页Slides

专知会员服务

114+阅读 · 2021年8月20日

语音如何自监督学习？306页ppt！李宏毅等INTERSPEECH2022《自监督表示学习语音处理》教程，附Slides与视频

专知

1+阅读 · 2022年9月19日

未来十年，AI 语音识别将朝着这五个方向发展

THU数据派

1+阅读 · 2022年9月2日

不可错过！斯坦福《语音语言处理》技术课程

专知

1+阅读 · 2022年5月2日

最新综述：跨语言语音合成方法的发展趋势与方向

PaperWeekly

1+阅读 · 2021年10月8日

语音信号处理：从基本算法到前沿的深度学习方法

PaperWeekly

16+阅读 · 2020年3月26日

大数据环境下基于量子计算的非结构化数据关键问题的研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于多身份的加密系统关键问题研究及应用

国家自然科学基金

0+阅读 · 2013年12月31日

基于动态规划算法的多目标检测前跟踪技术研究

国家自然科学基金

1+阅读 · 2013年12月31日

先进储备池神经计算方法及其在时间模式识别中的应用

国家自然科学基金

0+阅读 · 2012年12月31日

基于字符模式统计规律关于宏基因组的统计及计算分析研究

国家自然科学基金

0+阅读 · 2012年12月31日

Cross-domain Compositing with Pretrained Diffusion Models

Arxiv

0+阅读 · 2023年2月20日

Champion Solution for the WSDM2023 Toloka VQA Challenge

Arxiv

0+阅读 · 2023年2月20日

Revisiting Pre-training in Audio-Visual Learning

Arxiv

0+阅读 · 2023年2月17日

Survey: Transformer based Video-Language Pre-training

Arxiv

20+阅读 · 2021年9月21日

Text Classification Algorithms: A Survey

Arxiv

15+阅读 · 2019年6月25日