【李宏毅老师】自监督表示学习语音处理,附89页ppt与视频

2022 年 9 月 10 日 专知


尽管深度学习模型彻底改变了语音和音频处理领域,但它们迫使为个别任务和应用场景构建专家模型。深度神经模型也会在标记数据有限的方言和语言中遇到瓶颈。

自监督表示学习方法有望提供一个单一的通用模型,使一系列任务和领域受益。他们最近在NLP和计算机视觉领域取得了成功,达到了新的性能水平,同时减少了许多下游场景所需的标签。语音表征学习也有类似的进展,主要有三种类型:生成式、对比式和预测式。其他方法依赖于多模态数据进行训练前的预处理,将文本或视觉数据流与语音混合。虽然自我监督语音表示仍是一个新兴的研究领域,但它与声学词嵌入和零词汇资源学习密切相关。本教程将介绍自监督语音表征学习方法及其与相关研究领域的联系。由于目前的许多方法只将自动语音识别作为下游任务,我们将回顾最近对已学习的表示进行基准测试的努力,以扩展这种表示在语音识别之外的应用。本教程的实践部分将提供构建和评估语音表示模型的实际指导。

专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“SL89” 就可以获取【【李宏毅老师】自监督表示学习语音处理,附89页ppt与视频》专知下载链接

                       
专知,专业可信的人工智能知识分发 ,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取100000+AI(AI与军事、医药、公安等)主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取100000+AI主题知识资料
登录查看更多
0

相关内容

【COMPTEXT2022教程】跨语言监督文本分类,41页ppt
专知会员服务
17+阅读 · 2022年6月14日
最新《自监督表示学习》报告,70页ppt
专知会员服务
85+阅读 · 2020年12月22日
WSDM 2020教程《深度贝叶斯数据挖掘》,附257页PPT下载
专知会员服务
156+阅读 · 2020年2月7日
【ICML2022】时序自监督视频transformer
专知
1+阅读 · 2022年7月28日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年11月20日
Arxiv
17+阅读 · 2022年2月23日
Arxiv
20+阅读 · 2021年9月21日
Arxiv
29+阅读 · 2020年3月16日
Arxiv
22+阅读 · 2018年8月30日
VIP会员
相关VIP内容
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员