论文名字
Modeling Musical Structure with Artificial Neural Networks
论文简介
近年来,人工神经网络(ANNs)已成为解决现实问题的通用工具。人工神经网络在音乐相关任务中也取得了巨大的成功,包括音乐摘要和分类、相似性估计、计算机辅助或自主作曲以及自动音乐分析。由于结构是西方音乐的一个基本特征,它在所有这些任务中都扮演着重要的角色。在当前的人工神经网络体系结构中,一些结构方面的知识尤其具有挑战性。这尤其适用于中高级的自相似性、音调和节奏关系。在本文中,我将探讨ANNs在di中的应用!音乐结构建模的不同方面,找出其中涉及的一些挑战并提出应对策略。首先,使用受限Boltzmann机器(RBM)的概率估计,研究了一种基于概率自底向上的旋律分割方法。然后,提出了一种自顶向下的方法,将卷积RBM的Gibbs抽样与梯度下降优化相结合,应用于音乐生成中。此外,我激发了音乐转换在结构建模中的相关性,并展示了如何使用连接模型门控自动编码器(GAE)来学习音乐片段之间的转换。为了学习序列中的变换,我提出了一种特殊的GAE预测训练,它将复调音乐表示为一系列的间隔。而且这些区间表示在自上而下的重复音乐节的发现中的适用性被证明了。最后,提出了一种GAE的递归变体,并将其用于音乐预测和低层重复结构的建模。
论证。
论文作者
Stefan Lattner,来自巴黎索尼计算机科学实验室(CSL),长期从事人工智能研究,是机器学习领域专家级人物,尤其在人工神经网络领域颇有建树。最近一直致力于深度神经网络与音乐之间的研究,试图通过深度学习对音乐进行建模,并取得了最大突破。主张机器学习要面向实践,面向实际,立志解决当前问题,AI必须要有商业驱动,方能足够长远的发展。。