In this paper, we propose a new compositional tool that will generate a musical outline of speech recorded/provided by the user for use as a musical building block in their compositions. The tool allows any user to use their own speech to generate musical material, while still being able to hear the direct connection between their recorded speech and the resulting music. The tool is built on our proposed pipeline. This pipeline begins with speech-based signal processing, after which some simple musical heuristics are applied, and finally these pre-processed signals are passed through Transformer models trained on new musical tasks. We illustrate the effectiveness of our pipeline -- which does not require a paired dataset for training -- through examples of music created by musicians making use of our tool.


翻译:在本文中,我们提出了一个新的构成工具,将产生一个音乐提纲,说明用户记录/提供的演讲内容,作为音乐构件中的音乐构件。该工具允许任何用户使用自己的演讲来制作音乐材料,同时仍然能够听到其录音讲话与由此产生的音乐之间的直接联系。该工具建在我们提议的管道上。该管道从语音信号处理开始,然后应用一些简单的音乐疲劳主义,最后,这些预处理的信号通过经过新音乐任务培训的变异器模型传递。我们通过音乐家利用我们的工具创造的音乐的例子来说明我们的管道的有效性 -- -- 不需要配对的数据集来进行培训。

0
下载
关闭预览

相关内容

信号处理期刊采用了理论与实践的各个方面的信号处理。它以原始研究工作,教程和评论文章以及实际发展情况为特色。它旨在将知识和经验快速传播给从事信号处理研究,开发或实际应用的工程师和科学家。该期刊涵盖的主题领域包括:信号理论;随机过程; 检测和估计;光谱分析;过滤;信号处理系统;软件开发;图像处理; 模式识别; 光信号处理;数字信号处理; 多维信号处理;通信信号处理;生物医学信号处理;地球物理和天体信号处理;地球资源信号处理;声音和振动信号处理;数据处理; 遥感; 信号处理技术;雷达信号处理;声纳信号处理;工业应用;新的应用程序。 官网地址:http://dblp.uni-trier.de/db/journals/sigpro/
[综述]深度学习下的场景文本检测与识别
专知会员服务
78+阅读 · 2019年10月10日
已删除
AI科技评论
4+阅读 · 2018年8月12日
Arxiv
0+阅读 · 2021年10月1日
Arxiv
20+阅读 · 2021年9月21日
Arxiv
19+阅读 · 2021年4月8日
Arxiv
23+阅读 · 2020年9月16日
Phase-aware Speech Enhancement with Deep Complex U-Net
Arxiv
8+阅读 · 2018年11月27日
VIP会员
相关VIP内容
[综述]深度学习下的场景文本检测与识别
专知会员服务
78+阅读 · 2019年10月10日
相关资讯
已删除
AI科技评论
4+阅读 · 2018年8月12日
相关论文
Arxiv
0+阅读 · 2021年10月1日
Arxiv
20+阅读 · 2021年9月21日
Arxiv
19+阅读 · 2021年4月8日
Arxiv
23+阅读 · 2020年9月16日
Phase-aware Speech Enhancement with Deep Complex U-Net
Arxiv
8+阅读 · 2018年11月27日
Top
微信扫码咨询专知VIP会员