项目名称: 数据量匮乏条件下基于混合隐高斯随机场回归的语音转换方法研究

项目编号: No.61401148

项目类型: 青年科学基金项目

立项/批准年度: 2014

项目学科: 无线电电子学、电信技术

项目作者: 徐宁

作者单位: 河海大学

项目金额: 27万元

中文摘要: 在实际环境中,通过捕捉少量的语音数据进行自适应学习,进而能模仿任意人说话的技术具有重要的应用价值。例如使机器人模仿老人子女声音说话并与之交流,对于处于空巢中的老人可以起到情感抚慰的作用,从而增强老人的生活幸福感。 本项目以语音转换技术为背景,针对经典系统在数据量匮乏条件下性能大幅下降的问题,研究应对措施:提出建立以高斯随机场为理论平台的语音转换框架,通过研究模型的多输出、信息的联合映射以及非对称结构化训练等关键技术,克服“过拟合”问题;提出在基本高斯随机场的基础上,增加一个新的隐层,实现观测变量的非线性投影和降维,从而便于提炼本征参数,克服“维数灾难”问题;提出设计多个高斯随机场的混合结构和方法,用于对特征参数间的渐变关系进行建模,并增加模型输出的多样性。最后,将上述方法用于机器人系统,验证其可行性。

中文关键词: 高斯过程;码书转换;资源受限的机器人平台;精准语音转换;高效语音转换

英文摘要: It is a promising perspective that a robot can minic anyone's voices by adaptive training with limited amount of training data in the future. For example, an intelligent robot, who is capable of mimicing the voices of the sons or daughters of the elders,

英文关键词: Gaussian processes;code-book mapping;robotic platforms with limited resources;considerably accurate voice conversion;highly efficient voice conversion

成为VIP会员查看完整内容
0

相关内容

高斯过程(Gaussian Process, GP)是概率论和数理统计中随机过程(stochastic process)的一种,是一系列服从正态分布的随机变量(random variable)在一指数集(index set)内的组合。 高斯过程中任意随机变量的线性组合都服从正态分布,每个有限维分布都是联合正态分布,且其本身在连续指数集上的概率密度函数即是所有随机变量的高斯测度,因此被视为联合正态分布的无限维广义延伸。高斯过程由其数学期望和协方差函数完全决定,并继承了正态分布的诸多性质
时间序列计量经济学
专知会员服务
48+阅读 · 2022年4月8日
【AAAI2022】混合课程学习对话情绪识别
专知会员服务
27+阅读 · 2021年12月24日
【博士论文】开放环境下的度量学习研究
专知会员服务
49+阅读 · 2021年12月4日
【NeurIPS2021】序一致因果图的多任务学习
专知会员服务
20+阅读 · 2021年11月7日
专知会员服务
33+阅读 · 2021年7月27日
领域自适应研究综述
专知会员服务
55+阅读 · 2021年5月5日
专知会员服务
32+阅读 · 2020年9月2日
专知会员服务
51+阅读 · 2020年7月16日
【CVPR2020】用多样性最大化克服单样本NAS中的多模型遗忘
为语言障碍人士重现自然语音
TensorFlow
0+阅读 · 2021年9月28日
领域自适应研究综述
专知
6+阅读 · 2021年5月5日
语音情绪识别|声源增强|基频可视化
深度学习每日摘要
15+阅读 · 2019年5月5日
迁移自适应学习最新综述,附21页论文下载
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Simple and Effective Unsupervised Speech Synthesis
Arxiv
2+阅读 · 2022年4月20日
Tikhonov Regularization of Circle-Valued Signals
Arxiv
1+阅读 · 2022年4月20日
Arxiv
1+阅读 · 2022年4月19日
Arxiv
0+阅读 · 2022年4月17日
小贴士
相关VIP内容
时间序列计量经济学
专知会员服务
48+阅读 · 2022年4月8日
【AAAI2022】混合课程学习对话情绪识别
专知会员服务
27+阅读 · 2021年12月24日
【博士论文】开放环境下的度量学习研究
专知会员服务
49+阅读 · 2021年12月4日
【NeurIPS2021】序一致因果图的多任务学习
专知会员服务
20+阅读 · 2021年11月7日
专知会员服务
33+阅读 · 2021年7月27日
领域自适应研究综述
专知会员服务
55+阅读 · 2021年5月5日
专知会员服务
32+阅读 · 2020年9月2日
专知会员服务
51+阅读 · 2020年7月16日
【CVPR2020】用多样性最大化克服单样本NAS中的多模型遗忘
相关资讯
为语言障碍人士重现自然语音
TensorFlow
0+阅读 · 2021年9月28日
领域自适应研究综述
专知
6+阅读 · 2021年5月5日
语音情绪识别|声源增强|基频可视化
深度学习每日摘要
15+阅读 · 2019年5月5日
迁移自适应学习最新综述,附21页论文下载
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员