项目名称: 声纹表征模型及其漂移鲁棒性实现方法研究

项目编号: No.60970080

项目类型: 面上项目

立项/批准年度: 2010

项目学科: 自动化技术、计算机技术

项目作者: 杨莹春

作者单位: 浙江大学

项目金额: 31万元

中文摘要: 人不可能两次踏进同一条河流,同样,人不可能两次发出同样的语音,此即声纹识别的时间漂移现象,该现象极大地制约了声纹识别技术的实用化。要真正发挥声纹识别技术在社会信息安全和自然人机交互等国家战略至高领域中所起的重要作用,影响其稳定性的时间漂移问题亟待解决。旨在为研发漂移鲁棒性的声纹识别技术提供核心算法支撑,并在仿人听感信息处理领域作前沿探索,本项目拟沿两条途径展开工作:首先构建声纹表征模型,将实验语音学知识引入声纹统计建模,对现有的多种语音特征进行合理表达与整合。研究声纹漂移现象的机器学习与理解,利用聚类和流形学习等机器学习方法实现个体声纹漂移现象的可视化从而作机制性建模,并找寻不同个体间声纹漂移机制的迁移学习策略。其次借鉴人类的感知机理,初步探索声纹的漂移不变性表达机制及其模型实现。我们还将通过开发漂移鲁棒性的声纹识别原型系统来验证所得表征模型与漂移鲁棒性实现方法的正确与有效性。

中文关键词: 声纹识别;声纹漂移;高斯混合模型;情感变化;形变补偿

英文摘要:

英文关键词: speaker recognition;intra-speaker variability;Gassian Mixture Model;emotion variability;Deformation Compensation

成为VIP会员查看完整内容
0

相关内容

说话人识别(Speaker Recognition),或者称为声纹识别(Voiceprint Recognition, VPR),是根据语音中所包含的说话人个性信息,利用计算机以及现在的信息识别技术,自动鉴别说话人身份的一种生物特征识别技术。 说话人识别研究的目的就是从语音中提取具有说话人表征性的特征,建立有 效的模型和系统,实现自动精准的说话人鉴别。
中科院自动化所徐波团队最新《视觉-语言预训练》综述
专知会员服务
66+阅读 · 2022年2月23日
多语言语音识别声学模型建模方法最新进展
专知会员服务
32+阅读 · 2022年2月7日
深度学习模型鲁棒性研究综述
专知会员服务
91+阅读 · 2022年1月23日
《深度学习中神经注意力模型》综述论文
专知会员服务
112+阅读 · 2021年12月15日
NeurIPS 2021 | 微观特征混合进行宏观时间序列预测
专知会员服务
40+阅读 · 2021年11月12日
专知会员服务
97+阅读 · 2021年6月23日
专知会员服务
38+阅读 · 2021年3月3日
基于生理信号的情感计算研究综述
专知会员服务
61+阅读 · 2021年2月9日
企业风险知识图谱的构建及应用
专知会员服务
97+阅读 · 2020年11月6日
【ACL2020】基于图神经网络的文本分类新方法
专知会员服务
68+阅读 · 2020年7月12日
事理图谱的构建与应用分论坛|CNCC2021
哈工大SCIR
1+阅读 · 2021年12月14日
IJCAI 2021 | 不确定性感知小样本图像分类模型,实现SOTA性能
微软研究院AI头条
0+阅读 · 2021年8月19日
Interspeech 2019 | 基于多模态对齐的语音情感识别
AI科技评论
23+阅读 · 2019年9月21日
语音情绪识别|声源增强|基频可视化
深度学习每日摘要
15+阅读 · 2019年5月5日
一种关键字提取新方法
1号机器人网
21+阅读 · 2018年11月15日
生成对抗网络的研究进展与趋势
中国计算机学会
35+阅读 · 2018年11月14日
ISI新研究:胶囊生成对抗网络
论智
17+阅读 · 2018年3月7日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月14日
Arxiv
30+阅读 · 2021年7月7日
小贴士
相关VIP内容
中科院自动化所徐波团队最新《视觉-语言预训练》综述
专知会员服务
66+阅读 · 2022年2月23日
多语言语音识别声学模型建模方法最新进展
专知会员服务
32+阅读 · 2022年2月7日
深度学习模型鲁棒性研究综述
专知会员服务
91+阅读 · 2022年1月23日
《深度学习中神经注意力模型》综述论文
专知会员服务
112+阅读 · 2021年12月15日
NeurIPS 2021 | 微观特征混合进行宏观时间序列预测
专知会员服务
40+阅读 · 2021年11月12日
专知会员服务
97+阅读 · 2021年6月23日
专知会员服务
38+阅读 · 2021年3月3日
基于生理信号的情感计算研究综述
专知会员服务
61+阅读 · 2021年2月9日
企业风险知识图谱的构建及应用
专知会员服务
97+阅读 · 2020年11月6日
【ACL2020】基于图神经网络的文本分类新方法
专知会员服务
68+阅读 · 2020年7月12日
相关资讯
事理图谱的构建与应用分论坛|CNCC2021
哈工大SCIR
1+阅读 · 2021年12月14日
IJCAI 2021 | 不确定性感知小样本图像分类模型,实现SOTA性能
微软研究院AI头条
0+阅读 · 2021年8月19日
Interspeech 2019 | 基于多模态对齐的语音情感识别
AI科技评论
23+阅读 · 2019年9月21日
语音情绪识别|声源增强|基频可视化
深度学习每日摘要
15+阅读 · 2019年5月5日
一种关键字提取新方法
1号机器人网
21+阅读 · 2018年11月15日
生成对抗网络的研究进展与趋势
中国计算机学会
35+阅读 · 2018年11月14日
ISI新研究:胶囊生成对抗网络
论智
17+阅读 · 2018年3月7日
相关基金
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员