声纹表征模型及其漂移鲁棒性实现方法研究 - 专知基金

会员服务 ·

0

声纹识别 · 声纹漂移 · 高斯混合模型 · 情感变化 · 形变补偿 ·

2009 年 12 月 31 日

声纹表征模型及其漂移鲁棒性实现方法研究

国家自然科学基金

国家自然科学基金委员会

项目名称： 声纹表征模型及其漂移鲁棒性实现方法研究

项目编号： No.60970080

项目类型： 面上项目

立项/批准年度： 2010

项目学科： 自动化技术、计算机技术

项目作者： 杨莹春

作者单位： 浙江大学

项目金额： 31万元

中文摘要： 人不可能两次踏进同一条河流，同样，人不可能两次发出同样的语音，此即声纹识别的时间漂移现象，该现象极大地制约了声纹识别技术的实用化。要真正发挥声纹识别技术在社会信息安全和自然人机交互等国家战略至高领域中所起的重要作用，影响其稳定性的时间漂移问题亟待解决。旨在为研发漂移鲁棒性的声纹识别技术提供核心算法支撑，并在仿人听感信息处理领域作前沿探索，本项目拟沿两条途径展开工作：首先构建声纹表征模型，将实验语音学知识引入声纹统计建模，对现有的多种语音特征进行合理表达与整合。研究声纹漂移现象的机器学习与理解，利用聚类和流形学习等机器学习方法实现个体声纹漂移现象的可视化从而作机制性建模，并找寻不同个体间声纹漂移机制的迁移学习策略。其次借鉴人类的感知机理，初步探索声纹的漂移不变性表达机制及其模型实现。我们还将通过开发漂移鲁棒性的声纹识别原型系统来验证所得表征模型与漂移鲁棒性实现方法的正确与有效性。

中文关键词： 声纹识别；声纹漂移；高斯混合模型；情感变化；形变补偿

英文摘要：

英文关键词： speaker recognition；intra-speaker variability；Gassian Mixture Model；emotion variability；Deformation Compensation

成为VIP会员查看完整内容

0

相关内容

声纹识别

说话人识别（Speaker Recognition），或者称为声纹识别（Voiceprint Recognition, VPR），是根据语音中所包含的说话人个性信息，利用计算机以及现在的信息识别技术，自动鉴别说话人身份的一种生物特征识别技术。说话人识别研究的目的就是从语音中提取具有说话人表征性的特征，建立有效的模型和系统，实现自动精准的说话人鉴别。

中科院自动化所徐波团队最新《视觉-语言预训练》综述

中科院自动化所徐波团队最新《视觉-语言预训练》综述

专知会员服务

67+阅读 · 2022年2月23日

多语言语音识别声学模型建模方法最新进展

多语言语音识别声学模型建模方法最新进展

专知会员服务

36+阅读 · 2022年2月7日

深度学习模型鲁棒性研究综述

深度学习模型鲁棒性研究综述

专知会员服务

97+阅读 · 2022年1月23日

《深度学习中神经注意力模型》综述论文

《深度学习中神经注意力模型》综述论文

专知会员服务

114+阅读 · 2021年12月15日

NeurIPS 2021 | 微观特征混合进行宏观时间序列预测

NeurIPS 2021 | 微观特征混合进行宏观时间序列预测

专知会员服务

42+阅读 · 2021年11月12日

基于规则的建模方法的可解释性及其发展

专知会员服务

102+阅读 · 2021年6月23日

基于神经进化的深度学习模型研究综述

专知会员服务

39+阅读 · 2021年3月3日

基于生理信号的情感计算研究综述

基于生理信号的情感计算研究综述

专知会员服务

63+阅读 · 2021年2月9日

企业风险知识图谱的构建及应用

企业风险知识图谱的构建及应用

专知会员服务

98+阅读 · 2020年11月6日

【ACL2020】基于图神经网络的文本分类新方法

【ACL2020】基于图神经网络的文本分类新方法

专知会员服务

69+阅读 · 2020年7月12日

事理图谱的构建与应用分论坛｜CNCC2021

事理图谱的构建与应用分论坛｜CNCC2021

哈工大SCIR

1+阅读 · 2021年12月14日

CSIG云上微表情第二十期研讨会成功举办--基于脑电的情感计算研究

CSIG云上微表情第二十期研讨会成功举办--基于脑电的情感计算研究

CSIG机器视觉专委会

2+阅读 · 2021年9月30日

IJCAI 2021 | 不确定性感知小样本图像分类模型，实现SOTA性能

IJCAI 2021 | 不确定性感知小样本图像分类模型，实现SOTA性能

微软研究院AI头条

0+阅读 · 2021年8月19日

Interspeech 2019 | 基于多模态对齐的语音情感识别

Interspeech 2019 | 基于多模态对齐的语音情感识别

AI科技评论

23+阅读 · 2019年9月21日

语音情绪识别|声源增强|基频可视化

语音情绪识别|声源增强|基频可视化

深度学习每日摘要

15+阅读 · 2019年5月5日

推荐：一文读懂随机森林的解释和实现（附python代码）

推荐：一文读懂随机森林的解释和实现（附python代码）

数据分析

38+阅读 · 2018年12月4日

一种关键字提取新方法

一种关键字提取新方法

1号机器人网

21+阅读 · 2018年11月15日

生成对抗网络的研究进展与趋势

生成对抗网络的研究进展与趋势

中国计算机学会

35+阅读 · 2018年11月14日

ISI新研究：胶囊生成对抗网络

ISI新研究：胶囊生成对抗网络

论智

18+阅读 · 2018年3月7日

基于多模态信息集成的组合预测模型及其应用研究

国家自然科学基金

6+阅读 · 2015年12月31日

大数据环境下基于群体协同智能聚类的关键技术研究

国家自然科学基金

3+阅读 · 2014年12月31日

基于稀疏编码的语音特征增强方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

实时交通事件影响评估模型研究及其应用

国家自然科学基金

0+阅读 · 2013年12月31日

基于图论模型的文本重叠聚类研究

国家自然科学基金

0+阅读 · 2012年12月31日

动态场景下视觉事件建模与识别方法研究

国家自然科学基金

1+阅读 · 2012年12月31日

说话人识别中时变鲁棒的声纹特征研究

国家自然科学基金

2+阅读 · 2012年12月31日

声纹识别中合成语音的鲁棒性研究

国家自然科学基金

1+阅读 · 2009年12月31日

基于视感知的图像视频语义获取关键技术研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于感知模型和软计算的视频事件检测及关键技术研究

国家自然科学基金

0+阅读 · 2009年12月31日

Internet of Things Security, Device Authentication and Access Control: A Review

Arxiv

0+阅读 · 2022年4月19日

Completion Delay of Random Linear Network Coding in Full-Duplex Relay Networks

Completion Delay of Random Linear Network Coding in Full-Duplex Relay Networks

Arxiv

0+阅读 · 2022年4月18日

Cannikin's Law in Tensor Modeling: A Rank Study for Entanglement and Separability in Tensor Complexity and Model Capacity

Arxiv

0+阅读 · 2022年4月16日

An error analysis of generative adversarial networks for learning distributions

Arxiv

0+阅读 · 2022年4月16日

Model-agnostic Multi-Domain Learning with Domain-Specific Adapters for Action Recognition

Arxiv

0+阅读 · 2022年4月15日

Distributed Reconstruction of Noisy Pooled Data

Arxiv

0+阅读 · 2022年4月14日

Backward Reachability Analysis for Neural Feedback Loops

Arxiv

0+阅读 · 2022年4月14日

A Survey of Uncertainty in Deep Neural Networks

Arxiv

30+阅读 · 2021年7月7日

Entity Context and Relational Paths for Knowledge Graph Completion

Arxiv

29+阅读 · 2020年2月17日

Representation Learning with Ordered Relation Paths for Knowledge Graph Completion

Representation Learning with Ordered Relation Paths for Knowledge Graph Completion

Arxiv

12+阅读 · 2019年9月26日

阅读: 0 点赞: 0

小贴士

登录享主题订阅及个性化推荐

相关主题

高斯混合模型

热门VIP内容

开通专知VIP会员享更多权益服务

《美陆军徒步机动作战条令手册》最新168页

【博士论文】基于不确定性的可靠性：现代机器学习中的选择性预测与可信部署

军事后勤数字化未来展望

《美海军后勤体系整合与创新挑战》最新报告

相关VIP内容

中科院自动化所徐波团队最新《视觉-语言预训练》综述

中科院自动化所徐波团队最新《视觉-语言预训练》综述

专知会员服务

67+阅读 · 2022年2月23日

多语言语音识别声学模型建模方法最新进展

多语言语音识别声学模型建模方法最新进展

专知会员服务

36+阅读 · 2022年2月7日

深度学习模型鲁棒性研究综述

深度学习模型鲁棒性研究综述

专知会员服务

97+阅读 · 2022年1月23日

《深度学习中神经注意力模型》综述论文

《深度学习中神经注意力模型》综述论文

专知会员服务

114+阅读 · 2021年12月15日

NeurIPS 2021 | 微观特征混合进行宏观时间序列预测

NeurIPS 2021 | 微观特征混合进行宏观时间序列预测

专知会员服务

42+阅读 · 2021年11月12日

基于规则的建模方法的可解释性及其发展

专知会员服务

102+阅读 · 2021年6月23日

基于神经进化的深度学习模型研究综述

专知会员服务

39+阅读 · 2021年3月3日

基于生理信号的情感计算研究综述

基于生理信号的情感计算研究综述

专知会员服务

63+阅读 · 2021年2月9日

企业风险知识图谱的构建及应用

企业风险知识图谱的构建及应用

专知会员服务

98+阅读 · 2020年11月6日

【ACL2020】基于图神经网络的文本分类新方法

【ACL2020】基于图神经网络的文本分类新方法

专知会员服务

69+阅读 · 2020年7月12日

相关资讯

事理图谱的构建与应用分论坛｜CNCC2021

事理图谱的构建与应用分论坛｜CNCC2021

哈工大SCIR

1+阅读 · 2021年12月14日

CSIG云上微表情第二十期研讨会成功举办--基于脑电的情感计算研究

CSIG云上微表情第二十期研讨会成功举办--基于脑电的情感计算研究

CSIG机器视觉专委会

2+阅读 · 2021年9月30日

IJCAI 2021 | 不确定性感知小样本图像分类模型，实现SOTA性能

IJCAI 2021 | 不确定性感知小样本图像分类模型，实现SOTA性能

微软研究院AI头条

0+阅读 · 2021年8月19日

Interspeech 2019 | 基于多模态对齐的语音情感识别

Interspeech 2019 | 基于多模态对齐的语音情感识别

AI科技评论

23+阅读 · 2019年9月21日

语音情绪识别|声源增强|基频可视化

语音情绪识别|声源增强|基频可视化

深度学习每日摘要

15+阅读 · 2019年5月5日

推荐：一文读懂随机森林的解释和实现（附python代码）

推荐：一文读懂随机森林的解释和实现（附python代码）

数据分析

38+阅读 · 2018年12月4日

一种关键字提取新方法

一种关键字提取新方法

1号机器人网

21+阅读 · 2018年11月15日

生成对抗网络的研究进展与趋势

生成对抗网络的研究进展与趋势

中国计算机学会

35+阅读 · 2018年11月14日

ISI新研究：胶囊生成对抗网络

ISI新研究：胶囊生成对抗网络

论智

18+阅读 · 2018年3月7日

相关基金

基于多模态信息集成的组合预测模型及其应用研究

国家自然科学基金

6+阅读 · 2015年12月31日

大数据环境下基于群体协同智能聚类的关键技术研究

国家自然科学基金

3+阅读 · 2014年12月31日

基于稀疏编码的语音特征增强方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

实时交通事件影响评估模型研究及其应用

国家自然科学基金

0+阅读 · 2013年12月31日

基于图论模型的文本重叠聚类研究

国家自然科学基金

0+阅读 · 2012年12月31日

动态场景下视觉事件建模与识别方法研究

国家自然科学基金

1+阅读 · 2012年12月31日

说话人识别中时变鲁棒的声纹特征研究

国家自然科学基金

2+阅读 · 2012年12月31日

声纹识别中合成语音的鲁棒性研究

国家自然科学基金

1+阅读 · 2009年12月31日

基于视感知的图像视频语义获取关键技术研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于感知模型和软计算的视频事件检测及关键技术研究

国家自然科学基金

0+阅读 · 2009年12月31日

相关论文

Internet of Things Security, Device Authentication and Access Control: A Review

Arxiv

0+阅读 · 2022年4月19日

Completion Delay of Random Linear Network Coding in Full-Duplex Relay Networks

Completion Delay of Random Linear Network Coding in Full-Duplex Relay Networks

Arxiv

0+阅读 · 2022年4月18日

Cannikin's Law in Tensor Modeling: A Rank Study for Entanglement and Separability in Tensor Complexity and Model Capacity

Arxiv

0+阅读 · 2022年4月16日

An error analysis of generative adversarial networks for learning distributions

Arxiv

0+阅读 · 2022年4月16日

Model-agnostic Multi-Domain Learning with Domain-Specific Adapters for Action Recognition

Arxiv

0+阅读 · 2022年4月15日

Distributed Reconstruction of Noisy Pooled Data

Arxiv

0+阅读 · 2022年4月14日

Backward Reachability Analysis for Neural Feedback Loops

Arxiv

0+阅读 · 2022年4月14日

A Survey of Uncertainty in Deep Neural Networks

Arxiv

30+阅读 · 2021年7月7日

Entity Context and Relational Paths for Knowledge Graph Completion

Arxiv

29+阅读 · 2020年2月17日

Representation Learning with Ordered Relation Paths for Knowledge Graph Completion

Representation Learning with Ordered Relation Paths for Knowledge Graph Completion

Arxiv

12+阅读 · 2019年9月26日

微信扫码咨询专知VIP会员