This paper proposes a generative moment matching network (GMMN)-based post-filter that provides inter-utterance pitch variation for deep neural network (DNN)-based singing voice synthesis. The natural pitch variation of a human singing voice leads to a richer musical experience and is used in double-tracking, a recording method in which two performances of the same phrase are recorded and mixed to create a richer, layered sound. However, singing voices synthesized using conventional DNN-based methods never vary because the synthesis process is deterministic and only one waveform is synthesized from one musical score. To address this problem, we use a GMMN to model the variation of the modulation spectrum of the pitch contour of natural singing voices and add a randomized inter-utterance variation to the pitch contour generated by conventional DNN-based singing voice synthesis. Experimental evaluations suggest that 1) our approach can provide perceptible inter-utterance pitch variation while preserving speech quality. We extend our approach to double-tracking, and the evaluation demonstrates that 2) GMMN-based neural double-tracking is perceptually closer to natural double-tracking than conventional signal processing-based artificial double-tracking is.


翻译:本文建议使用基因化时刻匹配网络(GMM)基于传统DNN方法合成的声音,但使用传统DNN方法合成的声音永远不会改变,因为合成过程是决定性的,从一个乐分中合成一个波形。为了解决这个问题,我们使用GMMN来模拟自然歌唱声音轮廓的调制频谱的变异,并给传统的DNN歌声合成产生的音调调频增加随机化的调频变异。实验性评价表明,1)我们的方法可以提供可见的内溢音变异,同时保持语音质量。我们扩展了双轨方法,从一个乐分中合成了一种波形。为了解决这个问题,我们使用GMND模型来模拟自然歌唱声音轮廓调调频频谱的变异,并给传统的DNNN歌唱声合成所产生的音调调调频变异异。实验性评估表明,2基于GMNM双轨的神经双轨比常规的信号处理更接近于自然双轨。

0
下载
关闭预览

相关内容

Keras François Chollet 《Deep Learning with Python 》, 386页pdf
专知会员服务
151+阅读 · 2019年10月12日
17种深度强化学习算法用Pytorch实现
新智元
30+阅读 · 2019年9月16日
ICLR2019最佳论文出炉
专知
12+阅读 · 2019年5月6日
19篇ICML2019论文摘录选读!
专知
28+阅读 · 2019年4月28日
深度自进化聚类:Deep Self-Evolution Clustering
我爱读PAMI
15+阅读 · 2019年4月13日
【SIGIR2018】五篇对抗训练文章
专知
12+阅读 · 2018年7月9日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Teacher-Student Training for Robust Tacotron-based TTS
Neural Speech Synthesis with Transformer Network
Arxiv
5+阅读 · 2019年1月30日
VIP会员
相关VIP内容
Keras François Chollet 《Deep Learning with Python 》, 386页pdf
专知会员服务
151+阅读 · 2019年10月12日
Top
微信扫码咨询专知VIP会员