Sounds recorded with smartphones or IoT devices often have partially unreliable observations caused by clipping, wind noise, and completely missing parts due to microphone failure and packet loss in data transmission over the network. In this paper, we investigate the impact of the partially missing channels on the performance of acoustic scene classification using multichannel audio recordings, especially for a distributed microphone array. Missing observations cause not only losses of time-frequency and spatial information on sound sources but also a mismatch between a trained model and evaluation data. We thus investigate how a missing channel affects the performance of acoustic scene classification in detail. We also propose simple data augmentation methods for scene classification using multichannel observations with partially missing channels and evaluate the scene classification performance using the data augmentation methods.


翻译:在本文中,我们调查部分缺失的频道对使用多声道录音进行声学现场分类的效果的影响,特别是对分布式麦克风阵列的影响。缺失的观测不仅造成音频和空间信息损失,而且造成经过训练的模型和评估数据之间的不匹配。我们因此调查缺少的频道如何影响声学现场分类的详细性能。我们还提议使用部分缺失的多声道观测进行现场分类的简单数据增强方法,并利用数据扩增方法评估现场分类的性能。

0
下载
关闭预览

相关内容

移动数字广告与互联网反欺诈蓝皮报告
专知会员服务
26+阅读 · 2021年5月13日
最新《联邦学习Federated Learning》报告,Federated Learning
专知会员服务
86+阅读 · 2020年12月2日
【干货书】机器学习速查手册,135页pdf
专知会员服务
125+阅读 · 2020年11月20日
已删除
将门创投
7+阅读 · 2017年7月11日
Arxiv
5+阅读 · 2018年1月17日
VIP会员
相关资讯
已删除
将门创投
7+阅读 · 2017年7月11日
Top
微信扫码咨询专知VIP会员