This report describes our systems submitted to the DCASE2021 challenge task 3: sound event localization and detection (SELD) with directional interference. Our previous system based on activity-coupled Cartesian direction of arrival (ACCDOA) representation enables us to solve a SELD task with a single target. This ACCDOA-based system with efficient network architecture called RD3Net and data augmentation techniques outperformed state-of-the-art SELD systems in terms of localization and location-dependent detection. Using the ACCDOA-based system as a base, we perform model ensembles by averaging outputs of several systems trained with different conditions such as input features, training folds, and model architectures. We also use the event independent network v2 (EINV2)-based system to increase the diversity of the model ensembles. To generalize the models, we further propose impulse response simulation (IRS), which generates simulated multi-channel signals by convolving simulated room impulse responses (RIRs) with source signals extracted from the original dataset. Our systems significantly improved over the baseline system on the development dataset.


翻译:本报告介绍了我们提交DCASE2021挑战任务3的系统:健全的事件定位和检测(SELD),有方向性干扰。我们以前基于活动混合的笛卡尔抵达方向(ACCDOA)代表的系统,使我们能够用单一目标解决SELD任务。这个以ACCDOA为基础的系统,拥有高效的网络结构,称为RD3Net和数据增强技术,在本地化和根据位置进行检测方面优于最先进的SELD系统。我们利用以ACCDOA为基础的系统作为基地,通过平均使用若干系统的产出,这些系统经过不同的条件,例如输入特征、培训折叠和模型结构。我们还利用独立网络 v2 (EINV2) 系统来增加模型组合的多样性。为了推广模型,我们进一步提出脉冲反应模拟(IRS),通过使用从原始数据集中提取的源信号,生成模拟室脉冲反应信号,产生模拟多频道信号。我们的系统在开发数据集的基准系统上大大改进了我们的系统。

0
下载
关闭预览

相关内容

ACM/IEEE第23届模型驱动工程语言和系统国际会议,是模型驱动软件和系统工程的首要会议系列,由ACM-SIGSOFT和IEEE-TCSE支持组织。自1998年以来,模型涵盖了建模的各个方面,从语言和方法到工具和应用程序。模特的参加者来自不同的背景,包括研究人员、学者、工程师和工业专业人士。MODELS 2019是一个论坛,参与者可以围绕建模和模型驱动的软件和系统交流前沿研究成果和创新实践经验。今年的版本将为建模社区提供进一步推进建模基础的机会,并在网络物理系统、嵌入式系统、社会技术系统、云计算、大数据、机器学习、安全、开源等新兴领域提出建模的创新应用以及可持续性。 官网链接:http://www.modelsconference.org/
LibRec 精选:AutoML for Contextual Bandits
LibRec智能推荐
7+阅读 · 2019年9月19日
Call for Participation: Shared Tasks in NLPCC 2019
中国计算机学会
5+阅读 · 2019年3月22日
IEEE | DSC 2019诚邀稿件 (EI检索)
Call4Papers
10+阅读 · 2019年2月25日
无监督元学习表示学习
CreateAMind
25+阅读 · 2019年1月4日
Facebook PyText 在 Github 上开源了
AINLP
7+阅读 · 2018年12月14日
IEEE2018|An Accurate and Real-time 3D Tracking System for Robots
BranchOut: Regularization for Online Ensemble Tracking with CNN
统计学习与视觉计算组
9+阅读 · 2017年10月7日
【今日新增】IEEE Trans.专刊截稿信息8条
Call4Papers
7+阅读 · 2017年6月29日
Joint Monocular 3D Vehicle Detection and Tracking
Arxiv
8+阅读 · 2018年12月2日
Arxiv
8+阅读 · 2018年11月27日
Arxiv
6+阅读 · 2018年5月22日
VIP会员
相关VIP内容
相关资讯
Top
微信扫码咨询专知VIP会员