项目名称: 用于非对称语料的语音转换函数训练算法研究

项目编号: No.61201301

项目类型: 青年科学基金项目

立项/批准年度: 2013

项目学科: 电子学与信息系统

项目作者: 简志华

作者单位: 杭州电子科技大学

项目金额: 24万元

中文摘要: 语音转换是要改变一个说话人语音中的个性特征信息,使之具有另外一个人的个性信息,转换后的语音听起来就像是目标说话人的声音一样,而语音中的其它信息保持不变。本项目以非对称语料情况下的语音转换函数训练算法为研究内容,具体来说,主要内容有:第一、利用高斯混合模型分别对源、目标语音的特征参数进行音素分类;第二、在音素分类的基础上,利用KL距离对源、目标语音相同或相近的音素类进行匹配;第三、在源、目标语音相对应的音素类内,根据声学距离最近原则将两者的特征参数序列进行对齐,并由此训练出语音转换函数;第四、根据人耳的听觉特性,研究语音信号韵律特性的转换。探索高质量、有效的语音转换算法和实现具有较强实用价值的转换系统是本项目的研究目标。由于语音转换是语音处理领域一项新兴的技术,它涉及的理论广,运用价值大,因此,本项目的研究具有重要的理论意义和实用价值。

中文关键词: 语音转换;非对称语料;帧间动态信息;小样本训练数据;高斯混合模型

英文摘要: The goal of voice conversion is to modify the speech signal of source speaker to be perceived as if it had been uttered by a target speaker, but not altering semantic context. In this proposal, we aim to research on the training algorithm of voice conversion for non-parallel corpora. More specifically, our research mainly focus on four aspects. Firstly, Gaussian mixture model (GMM) is to be used for the phoneme classification of the source speech and the target one respectively. Secondly, in order to find the corresponding phoneme's category, we matches each individual Gaussian components of the GMM from source speaker to target speaker and vice versa according to Kullback-Leibler (KL) distance based on the results of phoneme classification. Thirdly, our proposal performs the frame alignment of phonetically equivalent acoustic vectors for source and target speaker in their mapped sub-spaces, not in the whole space. And then, the frame-aligned feature vectors are used to train the conversion function. Finally, according to auditory characteristics, prosody modification is conducted. In summary, our research's goal is to study the training algorithm on voice conversion with high quality converted speeches and good similarity between converted and target speeches. Voice conversion is a new technology which covers a

英文关键词: voice conversion;non-parallel corpus;inter-frame dynamic information;limited training data;Gaussian mixture model

成为VIP会员查看完整内容
0

相关内容

专知会员服务
81+阅读 · 2021年10月15日
专知会员服务
9+阅读 · 2021年7月28日
专知会员服务
53+阅读 · 2021年6月17日
领域自适应研究综述
专知会员服务
54+阅读 · 2021年5月5日
【字节跳动-李航】一种按序列进行对话状态跟踪的方法
专知会员服务
29+阅读 · 2020年11月25日
少即是多?非参数语言模型,68页ppt
专知会员服务
23+阅读 · 2020年11月22日
【ICML 2020 】小样本学习即领域迁移
专知会员服务
77+阅读 · 2020年6月26日
如何亿点点降低语音识别跨领域、跨语种迁移难度?
微软研究院AI头条
0+阅读 · 2022年3月31日
通用模型、全新框架,WavLM语音预训练模型全解
微软研究院AI头条
0+阅读 · 2021年12月23日
训练技巧 | 功守道:NLP中的对抗训练 + PyTorch实现
PaperWeekly
12+阅读 · 2019年11月13日
【Github】GPT2-Chinese:中文的GPT2训练代码
AINLP
52+阅读 · 2019年8月23日
SFFAI分享 | 黄健:语音情感识别【附PPT与视频资料】
人工智能前沿讲习班
30+阅读 · 2019年6月11日
一文读懂文本处理中的对抗训练
PaperWeekly
22+阅读 · 2019年6月5日
NAACL 2019 | 一种考虑缓和KL消失的简单VAE训练方法
PaperWeekly
20+阅读 · 2019年4月24日
基于Tacotron模型的语音合成实践
深度学习每日摘要
15+阅读 · 2018年12月25日
LibRec 每周算法:LDA主题模型
LibRec智能推荐
29+阅读 · 2017年12月4日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Simple and Effective Unsupervised Speech Synthesis
Arxiv
2+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
12+阅读 · 2020年6月20日
小贴士
相关VIP内容
专知会员服务
81+阅读 · 2021年10月15日
专知会员服务
9+阅读 · 2021年7月28日
专知会员服务
53+阅读 · 2021年6月17日
领域自适应研究综述
专知会员服务
54+阅读 · 2021年5月5日
【字节跳动-李航】一种按序列进行对话状态跟踪的方法
专知会员服务
29+阅读 · 2020年11月25日
少即是多?非参数语言模型,68页ppt
专知会员服务
23+阅读 · 2020年11月22日
【ICML 2020 】小样本学习即领域迁移
专知会员服务
77+阅读 · 2020年6月26日
相关资讯
如何亿点点降低语音识别跨领域、跨语种迁移难度?
微软研究院AI头条
0+阅读 · 2022年3月31日
通用模型、全新框架,WavLM语音预训练模型全解
微软研究院AI头条
0+阅读 · 2021年12月23日
训练技巧 | 功守道:NLP中的对抗训练 + PyTorch实现
PaperWeekly
12+阅读 · 2019年11月13日
【Github】GPT2-Chinese:中文的GPT2训练代码
AINLP
52+阅读 · 2019年8月23日
SFFAI分享 | 黄健:语音情感识别【附PPT与视频资料】
人工智能前沿讲习班
30+阅读 · 2019年6月11日
一文读懂文本处理中的对抗训练
PaperWeekly
22+阅读 · 2019年6月5日
NAACL 2019 | 一种考虑缓和KL消失的简单VAE训练方法
PaperWeekly
20+阅读 · 2019年4月24日
基于Tacotron模型的语音合成实践
深度学习每日摘要
15+阅读 · 2018年12月25日
LibRec 每周算法:LDA主题模型
LibRec智能推荐
29+阅读 · 2017年12月4日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员