项目名称: 语音信号声纹信息成分的深层表达

项目编号: No.61273264

项目类型: 面上项目

立项/批准年度: 2013

项目学科: 自动化技术、计算机技术

项目作者: 戴礼荣

作者单位: 中国科学技术大学

项目金额: 81万元

中文摘要: 语音信号不仅包含有语言内容主要强信息成分,还包含有声纹信息成分等多种非语言弱信息成分。如何对语音信号各特定的信息成分进行有效表达,特别是对特定非语言弱信息成分的有效表达,如声纹信息成分的有效表达,是语音信号与信息处理中尚待解决的重要研究问题,也是阻碍在生物信息公共安全等领域具重大应用价值的声纹识别、声音转换等技术进一步发展的关键问题。本项目基于神经科学研究领域提出的深层表达原理,研究可有效表达语音信号中的特定声纹信息成分的深层表达可计算模型,包括层次性组件结构、模型构建模式、模型参数优化方法和算法、高效模型训练方法等;建立一种通过自动学习获得对语音信号中特定声纹信息成分进行有效表达且具一定推广性的深层表达方法;并应用于声纹识别和声音转换,以期显著提升声纹识别和声音转换的性能。本项目研究不仅具重要实际意义,对促进一般意义信号的弱信息成分分析这一信号处理领域基础问题的研究也具重要意义。

中文关键词: 深层表达;声纹信息;声纹识别;声音转换;

英文摘要: Speech signal is composed of not only linguistic dominant information component,but also other various non-linguistic minor information components such as voiceprint information component.How to effectively represent the different specific infromation component of speech signal,especialy how to effectively represent various non-linguistic minor information components such as voiceprint information component,is an unresolved important research problem in the filed of speech signal and information processing,and also is a key problom which limits the speech technology improvements such as voiceprint recognition and voice conversion that are found wide and important applications in the filed of public biology information security.Based on the deep representation principle indicated by the neuroscience research,the project proposes to study computational deep representation modelling with the ability to effecitvely represent the specific voiceprint information component of speech signal,including the hierarchical component structure、model constructing mode、model parameter optimization method and algorithms、model training method ,etc., aims to develop a deep representattion method which is capable of automaticly learning the effecitve representation for the specific voiceprint information component with good genera

英文关键词: Deep representation;;Voiceprint information;Voiceprint recognition;Voice conversion;

成为VIP会员查看完整内容
0

相关内容

多语言语音识别声学模型建模方法最新进展
专知会员服务
32+阅读 · 2022年2月7日
专知会员服务
35+阅读 · 2021年2月20日
基于生理信号的情感计算研究综述
专知会员服务
61+阅读 · 2021年2月9日
多模态情绪识别研究综述
专知会员服务
165+阅读 · 2020年12月21日
专知会员服务
46+阅读 · 2020年12月20日
【ACL2020】基于图神经网络的文本分类新方法
专知会员服务
68+阅读 · 2020年7月12日
【KDD2020】自适应多通道图卷积神经网络
专知会员服务
119+阅读 · 2020年7月9日
一文带你了解语音信号处理技术
PaperWeekly
9+阅读 · 2022年1月26日
哈工大韩纪庆教授《语音信号处理(第3版)》出版
SFFAI分享 | 黄健:语音情感识别【附PPT与视频资料】
人工智能前沿讲习班
30+阅读 · 2019年6月11日
SFFAI 31 报名通知 | 情感语音识别与合成
人工智能前沿讲习班
17+阅读 · 2019年5月30日
python语音识别终极指南
AI100
13+阅读 · 2018年4月5日
特征工程的特征理解(一)
机器学习研究会
10+阅读 · 2017年10月23日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月18日
Arxiv
19+阅读 · 2021年2月4日
小贴士
相关VIP内容
多语言语音识别声学模型建模方法最新进展
专知会员服务
32+阅读 · 2022年2月7日
专知会员服务
35+阅读 · 2021年2月20日
基于生理信号的情感计算研究综述
专知会员服务
61+阅读 · 2021年2月9日
多模态情绪识别研究综述
专知会员服务
165+阅读 · 2020年12月21日
专知会员服务
46+阅读 · 2020年12月20日
【ACL2020】基于图神经网络的文本分类新方法
专知会员服务
68+阅读 · 2020年7月12日
【KDD2020】自适应多通道图卷积神经网络
专知会员服务
119+阅读 · 2020年7月9日
相关资讯
一文带你了解语音信号处理技术
PaperWeekly
9+阅读 · 2022年1月26日
哈工大韩纪庆教授《语音信号处理(第3版)》出版
SFFAI分享 | 黄健:语音情感识别【附PPT与视频资料】
人工智能前沿讲习班
30+阅读 · 2019年6月11日
SFFAI 31 报名通知 | 情感语音识别与合成
人工智能前沿讲习班
17+阅读 · 2019年5月30日
python语音识别终极指南
AI100
13+阅读 · 2018年4月5日
特征工程的特征理解(一)
机器学习研究会
10+阅读 · 2017年10月23日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员