Deep learning-based music source separation has gained a lot of interest in the last decades. Most of the existing methods operate with either spectrograms or waveforms. Spectrogram based models learn suitable masks for separating magnitude spectrogram into different sources, and waveform-based models directly generate waveforms of individual sources. The two types of models have complementary strengths; the former is superior given harmonic sources such as vocals, while the latter demonstrates better results for percussion and bass instruments. In this work, we improved upon the state-of-the-art (SoTA) models and successfully combined the best of both worlds. The backbones of the proposed framework, dubbed Danna-Sep, are two spectrogram-based models including a modified X-UMX and U-Net, and an enhanced Demucs as the waveform-based model. Given an input of mixture, we linearly combined respective outputs from the three models to obtain the final result. We showed in the experiments that, despite its simplicity, Danna-Sep surpassed the SoTA models by a large margin in terms of Source-to-Distortion Ratio.


翻译:在过去几十年里,基于深层学习的音乐源的分离引起了很大的兴趣。大多数现有方法都是用光谱或波形来操作的。基于光谱的模型学会了将星度光谱分离成不同源的合适掩码,而基于波形的模型直接产生单个源的波形。两种模型具有互补的优势;前者由于声音等和谐源而优于前者,而后者则显示震动和贝斯仪器的更好结果。在这项工作中,我们改进了最先进的模型(SoTA),成功地结合了两个世界的最佳模型。拟议框架的支柱,称为Danna-Sep,是两个基于光谱的模型,包括一个修改过的X-UMX和U-Net,以及一个强化的波形模型,作为波形模型。根据混合物的输入,我们将三个模型各自的产出线性地合并,以获得最终结果。我们在实验中显示,尽管它很简单,但Danna-Sep在源到磁盘上比SoTA模型高出一个很大的空间。

0
下载
关闭预览

相关内容

ACM/IEEE第23届模型驱动工程语言和系统国际会议,是模型驱动软件和系统工程的首要会议系列,由ACM-SIGSOFT和IEEE-TCSE支持组织。自1998年以来,模型涵盖了建模的各个方面,从语言和方法到工具和应用程序。模特的参加者来自不同的背景,包括研究人员、学者、工程师和工业专业人士。MODELS 2019是一个论坛,参与者可以围绕建模和模型驱动的软件和系统交流前沿研究成果和创新实践经验。今年的版本将为建模社区提供进一步推进建模基础的机会,并在网络物理系统、嵌入式系统、社会技术系统、云计算、大数据、机器学习、安全、开源等新兴领域提出建模的创新应用以及可持续性。 官网链接:http://www.modelsconference.org/
【数据科学导论书】Introduction to Datascience,253页pdf
专知会员服务
48+阅读 · 2021年11月15日
干货|书籍《百页机器学习》推荐(附最新135页PDF下载)
专知会员服务
61+阅读 · 2020年9月22日
迁移学习简明教程,11页ppt
专知会员服务
107+阅读 · 2020年8月4日
【Manning新书】现代Java实战,592页pdf
专知会员服务
99+阅读 · 2020年5月22日
【陈天奇】TVM:端到端自动深度学习编译器,244页ppt
专知会员服务
86+阅读 · 2020年5月11日
已删除
将门创投
3+阅读 · 2019年1月15日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
Arxiv
1+阅读 · 2022年2月6日
Arxiv
28+阅读 · 2021年9月26日
Arxiv
4+阅读 · 2020年5月25日
Arxiv
8+阅读 · 2018年11月27日
VIP会员
相关VIP内容
相关资讯
已删除
将门创投
3+阅读 · 2019年1月15日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
Top
微信扫码咨询专知VIP会员