项目名称: 数据量匮乏条件下基于混合隐高斯随机场回归的语音转换方法研究
项目编号: No.61401148
项目类型: 青年科学基金项目
立项/批准年度: 2014
项目学科: 无线电电子学、电信技术
项目作者: 徐宁
作者单位: 河海大学
项目金额: 27万元
中文摘要: 在实际环境中,通过捕捉少量的语音数据进行自适应学习,进而能模仿任意人说话的技术具有重要的应用价值。例如使机器人模仿老人子女声音说话并与之交流,对于处于空巢中的老人可以起到情感抚慰的作用,从而增强老人的生活幸福感。 本项目以语音转换技术为背景,针对经典系统在数据量匮乏条件下性能大幅下降的问题,研究应对措施:提出建立以高斯随机场为理论平台的语音转换框架,通过研究模型的多输出、信息的联合映射以及非对称结构化训练等关键技术,克服“过拟合”问题;提出在基本高斯随机场的基础上,增加一个新的隐层,实现观测变量的非线性投影和降维,从而便于提炼本征参数,克服“维数灾难”问题;提出设计多个高斯随机场的混合结构和方法,用于对特征参数间的渐变关系进行建模,并增加模型输出的多样性。最后,将上述方法用于机器人系统,验证其可行性。
中文关键词: 高斯过程;码书转换;资源受限的机器人平台;精准语音转换;高效语音转换
英文摘要: It is a promising perspective that a robot can minic anyone's voices by adaptive training with limited amount of training data in the future. For example, an intelligent robot, who is capable of mimicing the voices of the sons or daughters of the elders,
英文关键词: Gaussian processes;code-book mapping;robotic platforms with limited resources;considerably accurate voice conversion;highly efficient voice conversion