In this paper, we propose a way to improve the compression based dissimilarity measure, CDM. We propose to use a modified value of the file size, where the original CDM uses an unmodified file size. Our application is a music score analysis. We have chosen piano pieces from five different composers. We have selected 75 famous pieces (15 pieces for each composer). We computed the distances among all pieces by using the modified CDM. We use the K-nearest neighbor method when we estimate the composer of each piece of music. The modified CDM shows improved accuracy. The difference is statistically significant.
翻译:在本文中,我们提出了一个改进压缩不同度量的方法,即CDM。 我们建议使用文件大小的修改值, 最初的CDM使用未经修改的文件大小。 我们的应用程序是音乐评分分析。 我们从五个不同的作曲家中选择了钢琴片段。 我们从每个作曲家中选择了75个著名曲目( 15个曲目)。 我们用修改的CDM来计算所有曲目之间的距离。 当我们估算每首曲子的作曲者时, 我们使用 K 最近的邻居方法。 修改的CDM显示的准确性提高了。 差别在统计上是显著的。