Deep learning approaches for beat and downbeat tracking have brought advancements. However, these approaches continue to rely on hand-crafted, subsampled spectral features as input, restricting the information available to the model. In this work, we propose WaveBeat, an end-to-end approach for joint beat and downbeat tracking operating directly on waveforms. This method forgoes engineered spectral features, and instead, produces beat and downbeat predictions directly from the waveform, the first of its kind for this task. Our model utilizes temporal convolutional networks (TCNs) operating on waveforms that achieve a very large receptive field ($\geq$ 30 s) at audio sample rates in a memory efficient manner by employing rapidly growing dilation factors with fewer layers. With a straightforward data augmentation strategy, our method outperforms previous state-of-the-art methods on some datasets, while producing comparable results on others, demonstrating the potential for time domain approaches.


翻译:深入学习的击打和击落跟踪方法带来了进步。 但是,这些方法继续依赖手工制作的、分抽样的光谱特征作为输入,限制了模型可获得的信息。 在这项工作中,我们提出WaveBeat, 一种端对端的方法, 即直接在波形上进行联合击败和击败跟踪。 这种方法预示了设计光谱特征, 相反, 直接从波形中作出击击击和击败预测, 这是执行这项任务的第一个类型。 我们模型使用以波形运行的时间共振网络(TCNs)运行的波形, 以非常大的可接收场($\geq$ 30 s), 以记忆速率( 30 s) 的音频样本速度, 使用快速增长的变异系数, 以较少的层进行。 有了直接的数据增强战略, 我们的方法超越了某些数据集上以前的最先进的方法, 同时产生可比较的结果, 显示了时间域方法的潜力 。

0
下载
关闭预览

相关内容

【CVPR 2021】变换器跟踪TransT: Transformer Tracking
专知会员服务
21+阅读 · 2021年4月20日
【阿里巴巴-CVPR2020】频域学习,Learning in the Frequency Domain
《DeepGCNs: Making GCNs Go as Deep as CNNs》
专知会员服务
30+阅读 · 2019年10月17日
强化学习最新教程,17页pdf
专知会员服务
174+阅读 · 2019年10月11日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用
专知会员服务
39+阅读 · 2019年10月9日
Transferring Knowledge across Learning Processes
CreateAMind
27+阅读 · 2019年5月18日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
【跟踪Tracking】15篇论文+代码 | 中秋快乐~
专知
18+阅读 · 2018年9月24日
carla 体验效果 及代码
CreateAMind
7+阅读 · 2018年2月3日
【推荐】(TensorFlow)SSD实时手部检测与追踪(附代码)
机器学习研究会
11+阅读 · 2017年12月5日
强化学习 cartpole_a3c
CreateAMind
9+阅读 · 2017年7月21日
Learning in the Frequency Domain
Arxiv
11+阅读 · 2020年3月12日
Arxiv
3+阅读 · 2018年6月19日
VIP会员
Top
微信扫码咨询专知VIP会员