训练各种精确音频分类器的关键瓶颈之一是需要“强标记”的训练数据,这些数据提供要识别的音频事件的精确划分实例。然而,这种数据很难获得,特别是大量的数据。另一种更受欢迎的方法是使用“弱”标记数据来训练模型,这种数据包括只标记声音类别存在或不存在的录音,而不添加关于声音出现次数或它们在录音中的位置的额外细节。弱标记的数据比强标记的数据更容易获得;然而,使用这些数据进行培训也面临许多挑战。在本教程中,我们将讨论从弱标签数据中训练音频(和其他)分类器的问题,包括几种最先进的形式,它们的限制和局限性,以及未来的研究领域。 Bhiksha Raj IEEE会员,卡内基梅隆大学教授。Bhiksha Raj是卡内基梅隆大学计算机科学学院的教授。他的研究领域包括语音和音频处理以及声学场景分析。他是从弱标签学习音频分类器领域的先驱之一。Raj之前曾在ICASSP、Interspeech和其他各种会议上主持过几次教程。他是IEEE会士

成为VIP会员查看完整内容
40

相关内容

【AAAI2021】知识迁移的机器学习成员隐私保护,57页ppt
专知会员服务
27+阅读 · 2021年2月9日
最新《域自适应视觉应用》ECCV2020教程,43页PPT
专知会员服务
25+阅读 · 2020年11月5日
迁移学习简明教程,11页ppt
专知会员服务
107+阅读 · 2020年8月4日
国家自然科学基金
24+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年10月26日
Arxiv
0+阅读 · 2022年10月25日
Arxiv
0+阅读 · 2022年10月24日
Arxiv
0+阅读 · 2022年10月21日
VIP会员
相关基金
国家自然科学基金
24+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员