279页ppt！Interspeech 2022《弱标签学习》教程，CMU Bhiksha Raj讲授 - 专知VIP

会员服务 ·

27

弱标签学习 · INTERSPEECH · 教程 ·

2022 年 9 月 20 日

279页ppt！Interspeech 2022《弱标签学习》教程，CMU Bhiksha Raj讲授

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

训练各种精确音频分类器的关键瓶颈之一是需要“强标记”的训练数据，这些数据提供要识别的音频事件的精确划分实例。然而，这种数据很难获得，特别是大量的数据。另一种更受欢迎的方法是使用“弱”标记数据来训练模型，这种数据包括只标记声音类别存在或不存在的录音，而不添加关于声音出现次数或它们在录音中的位置的额外细节。弱标记的数据比强标记的数据更容易获得;然而，使用这些数据进行培训也面临许多挑战。在本教程中，我们将讨论从弱标签数据中训练音频(和其他)分类器的问题，包括几种最先进的形式，它们的限制和局限性，以及未来的研究领域。 Bhiksha Raj IEEE会员，卡内基梅隆大学教授。Bhiksha Raj是卡内基梅隆大学计算机科学学院的教授。他的研究领域包括语音和音频处理以及声学场景分析。他是从弱标签学习音频分类器领域的先驱之一。Raj之前曾在ICASSP、Interspeech和其他各种会议上主持过几次教程。他是IEEE会士

成为VIP会员查看完整内容

41

相关内容

弱标签学习

弱标签学习

语音如何自监督学习？306页ppt！李宏毅等INTERSPEECH2022《自监督表示学习语音处理》教程，附Slides与视频

语音如何自监督学习？306页ppt！李宏毅等INTERSPEECH2022《自监督表示学习语音处理》教程，附Slides与视频

专知会员服务

63+阅读 · 2022年9月19日

【李宏毅老师】自监督表示学习语音处理，附89页ppt与视频

【李宏毅老师】自监督表示学习语音处理，附89页ppt与视频

专知会员服务

31+阅读 · 2022年9月9日

最新《域自适应视觉应用》ECCV2020教程，43页PPT

最新《域自适应视觉应用》ECCV2020教程，43页PPT

专知会员服务

27+阅读 · 2020年11月5日

迁移学习简明教程，11页ppt

迁移学习简明教程，11页ppt

专知会员服务

109+阅读 · 2020年8月4日

【CMU课程：深度学习导论(Spring 2020)】“11-785 Introduction to Deep Learning | Carnegie Mellon University | Spring 2020” by Bhiksha Raj

【CMU课程：深度学习导论(Spring 2020)】“11-785 Introduction to Deep Learning | Carnegie Mellon University | Spring 2020” by Bhiksha Raj

专知会员服务

29+阅读 · 2020年2月3日

语音如何自监督学习？306页ppt！李宏毅等INTERSPEECH2022《自监督表示学习语音处理》教程，附Slides与视频

语音如何自监督学习？306页ppt！李宏毅等INTERSPEECH2022《自监督表示学习语音处理》教程，附Slides与视频

专知

1+阅读 · 2022年9月19日

【李宏毅老师】自监督表示学习语音处理，附89页ppt与视频

【李宏毅老师】自监督表示学习语音处理，附89页ppt与视频

专知

0+阅读 · 2022年9月10日

【IEEE ICASSP 2022教程】非负矩阵分解的最新进展，266页ppt

【IEEE ICASSP 2022教程】非负矩阵分解的最新进展，266页ppt

专知

1+阅读 · 2022年5月28日

【CIKM2019教程】新加坡国立大学：基于图学习与推理的推荐系统，附133页ppt

【CIKM2019教程】新加坡国立大学：基于图学习与推理的推荐系统，附133页ppt

专知

62+阅读 · 2019年11月4日

【ICASSP教程】深度生成模型在信号处理领域的应用（附116页PPT全文下载）

【ICASSP教程】深度生成模型在信号处理领域的应用（附116页PPT全文下载）

专知

16+阅读 · 2019年5月29日

基于语义分割与理解的室外场景三维重建研究

国家自然科学基金

0+阅读 · 2013年12月31日

非参数贝叶斯框架下的因子混合分析器的理论与应用研究

国家自然科学基金

0+阅读 · 2012年12月31日

结合2D图像和3D点云数据的城市建筑物重建关键技术研究

国家自然科学基金

3+阅读 · 2012年12月31日

基于结构化统计声学模型的非平行语料非联合训练说话人语音转换研究

国家自然科学基金

0+阅读 · 2012年12月31日

跨姿态人脸识别研究

国家自然科学基金

1+阅读 · 2011年12月31日

Distributionally Robust Batch Contextual Bandits

Arxiv

0+阅读 · 2022年10月25日

On the Robustness of Dataset Inference

Arxiv

0+阅读 · 2022年10月24日

Provably Learning Diverse Features in Multi-View Data with Midpoint Mixup

Arxiv

0+阅读 · 2022年10月24日

ESB: A Benchmark For Multi-Domain End-to-End Speech Recognition

Arxiv

0+阅读 · 2022年10月24日

Targeted active learning for probabilistic models

Arxiv

0+阅读 · 2022年10月21日

VIP会员

相关主题

弱标签学习

相关VIP内容

语音如何自监督学习？306页ppt！李宏毅等INTERSPEECH2022《自监督表示学习语音处理》教程，附Slides与视频

语音如何自监督学习？306页ppt！李宏毅等INTERSPEECH2022《自监督表示学习语音处理》教程，附Slides与视频

专知会员服务

63+阅读 · 2022年9月19日

【李宏毅老师】自监督表示学习语音处理，附89页ppt与视频

【李宏毅老师】自监督表示学习语音处理，附89页ppt与视频

专知会员服务

31+阅读 · 2022年9月9日

最新《域自适应视觉应用》ECCV2020教程，43页PPT

最新《域自适应视觉应用》ECCV2020教程，43页PPT

专知会员服务

27+阅读 · 2020年11月5日

迁移学习简明教程，11页ppt

迁移学习简明教程，11页ppt

专知会员服务

109+阅读 · 2020年8月4日

【CMU课程：深度学习导论(Spring 2020)】“11-785 Introduction to Deep Learning | Carnegie Mellon University | Spring 2020” by Bhiksha Raj

【CMU课程：深度学习导论(Spring 2020)】“11-785 Introduction to Deep Learning | Carnegie Mellon University | Spring 2020” by Bhiksha Raj

专知会员服务

29+阅读 · 2020年2月3日

热门VIP内容

开通专知VIP会员享更多权益服务

【博士论文】面向真实世界音视联合语音识别的可扩展框架

《通过仿真与开源数据提升战略决策：机遇与局限》最新报告

【AAAI2026】善始则事半功倍：基于前缀优化的大语言模型推理强化学习

评估大语言模型在科学发现中的作用

相关资讯

语音如何自监督学习？306页ppt！李宏毅等INTERSPEECH2022《自监督表示学习语音处理》教程，附Slides与视频

语音如何自监督学习？306页ppt！李宏毅等INTERSPEECH2022《自监督表示学习语音处理》教程，附Slides与视频

专知

1+阅读 · 2022年9月19日

【李宏毅老师】自监督表示学习语音处理，附89页ppt与视频

【李宏毅老师】自监督表示学习语音处理，附89页ppt与视频

专知

0+阅读 · 2022年9月10日

【IEEE ICASSP 2022教程】非负矩阵分解的最新进展，266页ppt

【IEEE ICASSP 2022教程】非负矩阵分解的最新进展，266页ppt

专知

1+阅读 · 2022年5月28日

【CIKM2019教程】新加坡国立大学：基于图学习与推理的推荐系统，附133页ppt

【CIKM2019教程】新加坡国立大学：基于图学习与推理的推荐系统，附133页ppt

专知

62+阅读 · 2019年11月4日

【ICASSP教程】深度生成模型在信号处理领域的应用（附116页PPT全文下载）

【ICASSP教程】深度生成模型在信号处理领域的应用（附116页PPT全文下载）

专知

16+阅读 · 2019年5月29日

相关基金

基于语义分割与理解的室外场景三维重建研究

国家自然科学基金

0+阅读 · 2013年12月31日

非参数贝叶斯框架下的因子混合分析器的理论与应用研究

国家自然科学基金

0+阅读 · 2012年12月31日

结合2D图像和3D点云数据的城市建筑物重建关键技术研究

国家自然科学基金

3+阅读 · 2012年12月31日

基于结构化统计声学模型的非平行语料非联合训练说话人语音转换研究

国家自然科学基金

0+阅读 · 2012年12月31日

跨姿态人脸识别研究

国家自然科学基金

1+阅读 · 2011年12月31日

相关论文

Distributionally Robust Batch Contextual Bandits

Arxiv

0+阅读 · 2022年10月25日

On the Robustness of Dataset Inference

Arxiv

0+阅读 · 2022年10月24日

Provably Learning Diverse Features in Multi-View Data with Midpoint Mixup

Arxiv

0+阅读 · 2022年10月24日

ESB: A Benchmark For Multi-Domain End-to-End Speech Recognition

Arxiv

0+阅读 · 2022年10月24日

Targeted active learning for probabilistic models

Arxiv

0+阅读 · 2022年10月21日

微信扫码咨询专知VIP会员