声纹识别中合成语音的鲁棒性研究 - 专知基金

会员服务 ·

0

说话人识别 · 基于隐马尔可夫语音合成 · 发音差异性 ·

2009 年 12 月 31 日

声纹识别中合成语音的鲁棒性研究

国家自然科学基金

国家自然科学基金委员会

项目名称： 声纹识别中合成语音的鲁棒性研究

项目编号： No.60970161

项目类型： 面上项目

立项/批准年度： 2010

项目学科： 金属学与金属工艺

项目作者： 郭武

作者单位： 中国科学技术大学

项目金额： 30万元

中文摘要： 相对自然语音，合成语音的缺陷主要在于表现力较弱。受音库限制，合成语音的底层参数变化模式较少，整体情感和风格较平淡，口语特性和个性特征也不强。基于以上存在的问题，本项目拟从底层参数变异性、情感、风格和个性的差异来区分合成语音和自然语音。首先，通过对语义规整，以声学、基频参数的高阶统计量来计算底层参数变异性；其次，通过对韵律特征建模来展示语音中情感和风格的多样性；再次，通过语义信息和非语义信息并行的方式来识别发音习惯，以发音习惯来体现个性差异。在这些算法的基础上，通过多层面的信息融合最终实现区分合成语音和自然语音的原型系统。　　在采用语音合成技术进行信息隐藏和信息欺骗已经成为现实的情况下，有效地区分合成语音和自然语音，对自动声纹识别的应用有非常重要的工程价值；同时本项目的研究对于推动声纹识别技术的进一步发展也具有一定的理论意义。

中文关键词： 说话人识别；基于隐马尔可夫语音合成；韵律；发音差异性；

英文摘要：

英文关键词： Speaker verification；HMM-based speech synthesis；prosodic；pronunciation variability；

成为VIP会员查看完整内容

1

相关内容

说话人识别

说话人识别

AI换脸、合成语音大爆发！清华《深度合成十大趋势报告（2022）》发布

AI换脸、合成语音大爆发！清华《深度合成十大趋势报告（2022）》发布

专知会员服务

44+阅读 · 2022年3月1日

多语言语音识别声学模型建模方法最新进展

多语言语音识别声学模型建模方法最新进展

专知会员服务

36+阅读 · 2022年2月7日

深度学习模型鲁棒性研究综述

深度学习模型鲁棒性研究综述

专知会员服务

97+阅读 · 2022年1月23日

【博士论文】具有文学表现力的中文古典诗歌自动写作方法研究

【博士论文】具有文学表现力的中文古典诗歌自动写作方法研究

专知会员服务

31+阅读 · 2021年12月5日

【ICML2021】对抗学习条件变分自编码器的端到端文本转语音

专知会员服务

10+阅读 · 2021年6月21日

文本情感对话系统研究综述

专知会员服务

74+阅读 · 2021年5月21日

文本情感分析方法研究综述

专知会员服务

56+阅读 · 2021年4月20日

稀缺资源语言神经网络机器翻译研究综述

稀缺资源语言神经网络机器翻译研究综述

专知会员服务

27+阅读 · 2020年12月2日

【综述】用于语音自动处理的深度神经网络综述:从大型语料库到有限数据的调查

【综述】用于语音自动处理的深度神经网络综述:从大型语料库到有限数据的调查

专知会员服务

24+阅读 · 2020年3月9日

【文献综述】基于端到端深度神经网络的说话人与语言识别综述, 163页ppt,昆山杜克大学李明博士

【文献综述】基于端到端深度神经网络的说话人与语言识别综述, 163页ppt,昆山杜克大学李明博士

专知会员服务

33+阅读 · 2019年9月15日

AI手语主播通过朱广权魔鬼面试，残影级手速无惧贯口，今已正式上岗助力冰雪盛会

AI手语主播通过朱广权魔鬼面试，残影级手速无惧贯口，今已正式上岗助力冰雪盛会

量子位

0+阅读 · 2022年2月4日

语音合成：模拟最像人类声音的系统

语音合成：模拟最像人类声音的系统

PaperWeekly

2+阅读 · 2021年11月30日

最新综述：跨语言语音合成方法的发展趋势与方向

最新综述：跨语言语音合成方法的发展趋势与方向

PaperWeekly

1+阅读 · 2021年10月8日

Interspeech 2019 | 阿里达摩院语音实验室：联合CTC和Transformer的自动中文纠错模型

Interspeech 2019 | 阿里达摩院语音实验室：联合CTC和Transformer的自动中文纠错模型

机器之心

26+阅读 · 2019年9月15日

SFFAI分享 | 黄健：语音情感识别【附PPT与视频资料】

SFFAI分享 | 黄健：语音情感识别【附PPT与视频资料】

人工智能前沿讲习班

30+阅读 · 2019年6月11日

SFFAI 31 报名通知 | 情感语音识别与合成

SFFAI 31 报名通知 | 情感语音识别与合成

人工智能前沿讲习班

17+阅读 · 2019年5月30日

语音情绪识别|声源增强|基频可视化

语音情绪识别|声源增强|基频可视化

深度学习每日摘要

15+阅读 · 2019年5月5日

腾讯AI Lab 8篇论文入选，从0到1解读语音交互能力 | InterSpeech 2018

腾讯AI Lab 8篇论文入选，从0到1解读语音交互能力 | InterSpeech 2018

AI科技评论

12+阅读 · 2018年9月7日

ICASSP最佳学生论文：深度对抗声学模型训练框架

ICASSP最佳学生论文：深度对抗声学模型训练框架

专知

14+阅读 · 2018年4月28日

一文看懂深度学习在语音合成&增强上的应用

一文看懂深度学习在语音合成&增强上的应用

数盟

11+阅读 · 2017年9月13日

基于发音特征的汉语语音识别分层解码方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度神经网络的噪声鲁棒性语音识别方法研究

国家自然科学基金

4+阅读 · 2013年12月31日

基于稀疏编码的语音特征增强方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于非线性语音谱分析的单通道语音增强研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于压缩感知的鲁棒性语音情感识别研究

国家自然科学基金

3+阅读 · 2012年12月31日

融合语音产生机理与统计声学建模的层次化语音合成方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

非特定人自然语音情感识别的建模方法研究

国家自然科学基金

1+阅读 · 2011年12月31日

风格化人体运动合成新方法研究

国家自然科学基金

0+阅读 · 2011年12月31日

结合发音动作参数的统计建模语音合成方法研究

国家自然科学基金

0+阅读 · 2009年12月31日

适于含噪语音信号过程的随机过程叠加与声学语音特征研究

国家自然科学基金

0+阅读 · 2009年12月31日

Time Domain Adversarial Voice Conversion for ADD 2022

Arxiv

1+阅读 · 2022年4月20日

Two continuous (4, 5) pairs of explicit 9-stage Runge-Kutta methods

Arxiv

0+阅读 · 2022年4月19日

IndicXNLI: Evaluating Multilingual Inference for Indian Languages

Arxiv

0+阅读 · 2022年4月19日

CorrGAN: Input Transformation Technique Against Natural Corruptions

Arxiv

0+阅读 · 2022年4月19日

What If: Generating Code to Answer Simulation Questions

Arxiv

0+阅读 · 2022年4月16日

Directional Graph Networks

Directional Graph Networks

Arxiv

27+阅读 · 2020年12月10日

Entity Context and Relational Paths for Knowledge Graph Completion

Arxiv

29+阅读 · 2020年2月17日

BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

Arxiv

16+阅读 · 2019年5月24日

Generative Adversarial Autoencoder Networks

Arxiv

11+阅读 · 2018年3月23日

CapsuleGAN: Generative Adversarial Capsule Network

Arxiv

10+阅读 · 2018年2月17日

阅读: 0 点赞: 0

小贴士

登录享主题订阅及个性化推荐

相关主题

说话人识别

基于隐马尔可夫语音合成

发音差异性

热门VIP内容

开通专知VIP会员享更多权益服务

《乌克兰无人机产业：志愿者与政策在构建新兴无人机产业中的协同作用》最新报告

《人工智能辅助决策中的数据可视化：系统性综述》

人工智能驱动弹药制造现代化：美国陆军转型之路

《敏捷作战部署中枢纽-辐条基地选址优化研究》80页

相关VIP内容

AI换脸、合成语音大爆发！清华《深度合成十大趋势报告（2022）》发布

AI换脸、合成语音大爆发！清华《深度合成十大趋势报告（2022）》发布

专知会员服务

44+阅读 · 2022年3月1日

多语言语音识别声学模型建模方法最新进展

多语言语音识别声学模型建模方法最新进展

专知会员服务

36+阅读 · 2022年2月7日

深度学习模型鲁棒性研究综述

深度学习模型鲁棒性研究综述

专知会员服务

97+阅读 · 2022年1月23日

【博士论文】具有文学表现力的中文古典诗歌自动写作方法研究

【博士论文】具有文学表现力的中文古典诗歌自动写作方法研究

专知会员服务

31+阅读 · 2021年12月5日

【ICML2021】对抗学习条件变分自编码器的端到端文本转语音

专知会员服务

10+阅读 · 2021年6月21日

文本情感对话系统研究综述

专知会员服务

74+阅读 · 2021年5月21日

文本情感分析方法研究综述

专知会员服务

56+阅读 · 2021年4月20日

稀缺资源语言神经网络机器翻译研究综述

稀缺资源语言神经网络机器翻译研究综述

专知会员服务

27+阅读 · 2020年12月2日

【综述】用于语音自动处理的深度神经网络综述:从大型语料库到有限数据的调查

【综述】用于语音自动处理的深度神经网络综述:从大型语料库到有限数据的调查

专知会员服务

24+阅读 · 2020年3月9日

【文献综述】基于端到端深度神经网络的说话人与语言识别综述, 163页ppt,昆山杜克大学李明博士

【文献综述】基于端到端深度神经网络的说话人与语言识别综述, 163页ppt,昆山杜克大学李明博士

专知会员服务

33+阅读 · 2019年9月15日

相关资讯

AI手语主播通过朱广权魔鬼面试，残影级手速无惧贯口，今已正式上岗助力冰雪盛会

AI手语主播通过朱广权魔鬼面试，残影级手速无惧贯口，今已正式上岗助力冰雪盛会

量子位

0+阅读 · 2022年2月4日

语音合成：模拟最像人类声音的系统

语音合成：模拟最像人类声音的系统

PaperWeekly

2+阅读 · 2021年11月30日

最新综述：跨语言语音合成方法的发展趋势与方向

最新综述：跨语言语音合成方法的发展趋势与方向

PaperWeekly

1+阅读 · 2021年10月8日

Interspeech 2019 | 阿里达摩院语音实验室：联合CTC和Transformer的自动中文纠错模型

Interspeech 2019 | 阿里达摩院语音实验室：联合CTC和Transformer的自动中文纠错模型

机器之心

26+阅读 · 2019年9月15日

SFFAI分享 | 黄健：语音情感识别【附PPT与视频资料】

SFFAI分享 | 黄健：语音情感识别【附PPT与视频资料】

人工智能前沿讲习班

30+阅读 · 2019年6月11日

SFFAI 31 报名通知 | 情感语音识别与合成

SFFAI 31 报名通知 | 情感语音识别与合成

人工智能前沿讲习班

17+阅读 · 2019年5月30日

语音情绪识别|声源增强|基频可视化

语音情绪识别|声源增强|基频可视化

深度学习每日摘要

15+阅读 · 2019年5月5日

腾讯AI Lab 8篇论文入选，从0到1解读语音交互能力 | InterSpeech 2018

腾讯AI Lab 8篇论文入选，从0到1解读语音交互能力 | InterSpeech 2018

AI科技评论

12+阅读 · 2018年9月7日

ICASSP最佳学生论文：深度对抗声学模型训练框架

ICASSP最佳学生论文：深度对抗声学模型训练框架

专知

14+阅读 · 2018年4月28日

一文看懂深度学习在语音合成&增强上的应用

一文看懂深度学习在语音合成&增强上的应用

数盟

11+阅读 · 2017年9月13日

相关基金

基于发音特征的汉语语音识别分层解码方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度神经网络的噪声鲁棒性语音识别方法研究

国家自然科学基金

4+阅读 · 2013年12月31日

基于稀疏编码的语音特征增强方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于非线性语音谱分析的单通道语音增强研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于压缩感知的鲁棒性语音情感识别研究

国家自然科学基金

3+阅读 · 2012年12月31日

融合语音产生机理与统计声学建模的层次化语音合成方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

非特定人自然语音情感识别的建模方法研究

国家自然科学基金

1+阅读 · 2011年12月31日

风格化人体运动合成新方法研究

国家自然科学基金

0+阅读 · 2011年12月31日

结合发音动作参数的统计建模语音合成方法研究

国家自然科学基金

0+阅读 · 2009年12月31日

适于含噪语音信号过程的随机过程叠加与声学语音特征研究

国家自然科学基金

0+阅读 · 2009年12月31日

相关论文

Time Domain Adversarial Voice Conversion for ADD 2022

Arxiv

1+阅读 · 2022年4月20日

Two continuous (4, 5) pairs of explicit 9-stage Runge-Kutta methods

Arxiv

0+阅读 · 2022年4月19日

IndicXNLI: Evaluating Multilingual Inference for Indian Languages

Arxiv

0+阅读 · 2022年4月19日

CorrGAN: Input Transformation Technique Against Natural Corruptions

Arxiv

0+阅读 · 2022年4月19日

What If: Generating Code to Answer Simulation Questions

Arxiv

0+阅读 · 2022年4月16日

Directional Graph Networks

Directional Graph Networks

Arxiv

27+阅读 · 2020年12月10日

Entity Context and Relational Paths for Knowledge Graph Completion

Arxiv

29+阅读 · 2020年2月17日

BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

Arxiv

16+阅读 · 2019年5月24日

Generative Adversarial Autoencoder Networks

Arxiv

11+阅读 · 2018年3月23日

CapsuleGAN: Generative Adversarial Capsule Network

Arxiv

10+阅读 · 2018年2月17日

微信扫码咨询专知VIP会员