We explore the generation of visualisations of audio latent spaces using an audio-to-image generation pipeline. We believe this can help with the interpretability of audio latent spaces. We demonstrate a variety of results on the NSynth dataset. A web demo is available.
翻译:我们利用音频到图像生成管道探索声频潜在空间的可视化生成。 我们相信这会有助于音频潜在空间的可解释性。 我们在NSynth数据集上展示了各种结果。 网络演示可供使用 。