项目名称: 面向非平行文本的说话人个性特征转换的关键技术及应用研究

项目编号: No.61401227

项目类型: 青年科学基金项目

立项/批准年度: 2014

项目学科: 无线电电子学、电信技术

项目作者: 李燕萍

作者单位: 南京邮电大学

项目金额: 24万元

中文摘要: 语音转换是实现高自然度个性化语音交互的核心技术,平行训练文本的瓶颈严重限制了该技术的广泛应用,本课题针对非平行文本条件下的说话人个性特征转换的关键问题和应用进行研究。在语音信号的韵律特性方面,注重多时间尺度韵律特征的提取与参数化表示,发展层次结构式概率统计模型对其进行融合与转换,自下而上地衔接底层信号特征提取和上层语音清晰度与自然度之间的断层。在频谱特性方面,自上而下地将语音学理论和语言学信息引入到频谱特征转换模型的分析和构建中,采用拓扑方法实现转换模型从欧氏空间向拓扑空间的转变;对于无法预先采集源说话人训练文本的实际情形提出“润色”修正的思想,实现任意源说话人直接向特定目标说话人的转换。本课题首次将自上而下和自下而上的方法论相结合,指导语音信号不同特性的分析与处理,以实现非平行文本条件下的高质量的说话人个性特征转换,为语音转换技术走向实际应用提供新的理论依据和技术支撑。

中文关键词: 非平行文本;自适应聚类;瓶颈特征;变分自动编码器;多说话人对多说话人

英文摘要: Voice conversion is a key technology to achieve high degree of natural personalized voice interaction, but it was suppressed by the bottle-neck issue of requirement for parallel training data. The proposal aims to explore key technologies at the forefron

英文关键词: Nonparallel Corpora;Adaptive Clustering;Bottleneck Feature;Variational Auto-Encoders;Multi Speaker to Multi Speaker

成为VIP会员查看完整内容
0

相关内容

多语言语音识别声学模型建模方法最新进展
专知会员服务
32+阅读 · 2022年2月7日
从视频到语言: 视频标题生成与描述研究综述
专知会员服务
19+阅读 · 2022年1月8日
专知会员服务
69+阅读 · 2021年5月21日
专知会员服务
55+阅读 · 2020年12月20日
【博士论文】辨识性特征学习及在细粒度分析中的应用
专知会员服务
29+阅读 · 2020年12月10日
专知会员服务
193+阅读 · 2020年10月14日
语音合成:模拟最像人类声音的系统
PaperWeekly
2+阅读 · 2021年11月30日
为语言障碍人士重现自然语音
TensorFlow
0+阅读 · 2021年9月28日
Interspeech 2019 | 基于多模态对齐的语音情感识别
AI科技评论
23+阅读 · 2019年9月21日
SFFAI分享 | 连政:端到端语音合成【附PPT与视频资料】
人工智能前沿讲习班
14+阅读 · 2019年6月16日
基于Tacotron模型的语音合成实践
深度学习每日摘要
15+阅读 · 2018年12月25日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
小贴士
相关VIP内容
多语言语音识别声学模型建模方法最新进展
专知会员服务
32+阅读 · 2022年2月7日
从视频到语言: 视频标题生成与描述研究综述
专知会员服务
19+阅读 · 2022年1月8日
专知会员服务
69+阅读 · 2021年5月21日
专知会员服务
55+阅读 · 2020年12月20日
【博士论文】辨识性特征学习及在细粒度分析中的应用
专知会员服务
29+阅读 · 2020年12月10日
专知会员服务
193+阅读 · 2020年10月14日
相关资讯
语音合成:模拟最像人类声音的系统
PaperWeekly
2+阅读 · 2021年11月30日
为语言障碍人士重现自然语音
TensorFlow
0+阅读 · 2021年9月28日
Interspeech 2019 | 基于多模态对齐的语音情感识别
AI科技评论
23+阅读 · 2019年9月21日
SFFAI分享 | 连政:端到端语音合成【附PPT与视频资料】
人工智能前沿讲习班
14+阅读 · 2019年6月16日
基于Tacotron模型的语音合成实践
深度学习每日摘要
15+阅读 · 2018年12月25日
相关基金
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员