用机器学习创造独特声音,谷歌开源NSynth Super

2018 年 3 月 14 日 论智 Google
来源:Google
编译:Bing

编者按:世界上的乐器种类繁多,但这还不够。谷歌开发了一种名为NSynth Super的合成器,利用机器学习能够造出独一无二的新声音。今天谷歌将这一工具的代码开源,看看这个奇妙的“玩具”到底能变出什么花样吧。以下是论智对原文的编译。

什么是NSynth Super?

NSynth Super是谷歌研究项目Magenta正在进行的实验中的一部分,该项目的目的是探索机器学习如何帮助艺术家一新方式创作艺术和音乐。

科技在创造新声音方面一直发挥着重要作用——从声音的扭曲到合成电音。今天,机器学习和神经网络的进步为声音的创作提供了新可能。

在过去研究的基础上,Magenta创造了NSynth(神经合成器)。这是一种机器学习算法,利用深度神经网络学习声音的特征,然后根据这些特征创造出完全新的声音。

相比于简单的将声音组合起来,NSynth利用原声音的音色重新合成了全新的声音,所以你可以听到一半是笛子一半是西塔琴的声音。

自从NSynth发布后,Magenta就不断尝试开发不同的音乐交互工具,想让NSynth算法更容易上手。作为探索的一部分,Magenta与谷歌创意实验室(Google Creative Lab)合作,创造出了NSynth Super。这是一款开源的实验性工具,音乐家能通过里面默认的4种原始声音生成全新的声音。现在这款产品的原型正在音乐人圈子里进行小范围的实验,评估他们使用的感受。

NSynth Super是如何工作的?


在这个实验中,音乐家们在录音室里录制了跨15个音的16种原始声音源,然后将其输入到NSynth算法中,用算法生成新的声音。然后将生成的超过10万种新的声音加载到产品原型中。

每个旋钮代表四种不同的源声音,音乐家能通过控制旋钮选择不同音色,然后手指在触摸屏上滑动,将这四种声音结合起来。

NSynth Super可以通过任何MIDI源播放,例如DAW,音序器或者键盘。

NSynth算法是如何工作的?

根据个人水平、风格不同,NSynth利用深度神经网络生成不同的声音。NSynth直接从数据中学习,可以让艺术家直接控制音色和节凑,并能够手动探索创造新的声音。

NSynth是一种算法,可以结合现有声音的特征来生成新的声音。为此,该算法将不同的声音作为输入。

使用自动编码器,它可以从每个输入中提取16个时间特征。然后将这些特征线性插入创建新的嵌入(每个声音的数学表示)。然后将这些新的嵌入解码成新的声音,这些声音具有两个输入的声音质量。

完整地介绍可以参见Magenta的博客,数据集合算法可以在原论文中找到。

如何才能得到NSynth Super?


触摸屏可发现新声音

音色选择钮

音色调整钮

和Magenta其他项目一样,NSynth Super建立在开源库之上,例如TensorFlow和openFrameworks,目的是让更多的艺术家、编程者和研究者体验这一创造性的过程。NSynth Super的开源版本包含所有开源代码、简图和设计模板,都可以在GitHub上下载。

原文地址:nsynthsuper.withgoogle.com/

GitHub地址:github.com/googlecreativelab/open-nsynth-super

登录查看更多
0

相关内容

Magenta is a Google Brain project to ask and answer the questions, “Can we use machine learning to create compelling art and music? If so, how? If not, why not?”
 【SIGGRAPH 2020】人像阴影处理,Portrait Shadow Manipulation
专知会员服务
28+阅读 · 2020年5月19日
【Amazon】使用预先训练的Transformer模型进行数据增强
专知会员服务
56+阅读 · 2020年3月6日
【Google】无监督机器翻译,Unsupervised Machine Translation
专知会员服务
35+阅读 · 2020年3月3日
【Google AI】开源NoisyStudent:自监督图像分类
专知会员服务
54+阅读 · 2020年2月18日
用于语音识别的数据增强
AI研习社
24+阅读 · 2019年6月5日
【学界】GAN跨界合成高保真音乐,Jeff Dean听了都陶醉
GAN生成式对抗网络
7+阅读 · 2019年3月1日
要替代 TensorFlow?谷歌开源机器学习库 JAX
新智元
3+阅读 · 2018年12月14日
机器听觉:一、AI在音频处理上的潜力
论智
5+阅读 · 2018年11月25日
已删除
将门创投
5+阅读 · 2018年11月15日
谷歌放大招!数据增强实现自动化
新智元
8+阅读 · 2018年6月4日
精选10大机器学习开源项目 !(附链接)
数据派THU
7+阅读 · 2018年5月3日
Arxiv
4+阅读 · 2018年10月5日
Arxiv
3+阅读 · 2018年6月19日
Arxiv
3+阅读 · 2018年3月21日
VIP会员
相关资讯
用于语音识别的数据增强
AI研习社
24+阅读 · 2019年6月5日
【学界】GAN跨界合成高保真音乐,Jeff Dean听了都陶醉
GAN生成式对抗网络
7+阅读 · 2019年3月1日
要替代 TensorFlow?谷歌开源机器学习库 JAX
新智元
3+阅读 · 2018年12月14日
机器听觉:一、AI在音频处理上的潜力
论智
5+阅读 · 2018年11月25日
已删除
将门创投
5+阅读 · 2018年11月15日
谷歌放大招!数据增强实现自动化
新智元
8+阅读 · 2018年6月4日
精选10大机器学习开源项目 !(附链接)
数据派THU
7+阅读 · 2018年5月3日
Top
微信扫码咨询专知VIP会员