项目名称: 声纹表征模型及其漂移鲁棒性实现方法研究
项目编号: No.60970080
项目类型: 面上项目
立项/批准年度: 2010
项目学科: 自动化技术、计算机技术
项目作者: 杨莹春
作者单位: 浙江大学
项目金额: 31万元
中文摘要: 人不可能两次踏进同一条河流,同样,人不可能两次发出同样的语音,此即声纹识别的时间漂移现象,该现象极大地制约了声纹识别技术的实用化。要真正发挥声纹识别技术在社会信息安全和自然人机交互等国家战略至高领域中所起的重要作用,影响其稳定性的时间漂移问题亟待解决。旨在为研发漂移鲁棒性的声纹识别技术提供核心算法支撑,并在仿人听感信息处理领域作前沿探索,本项目拟沿两条途径展开工作:首先构建声纹表征模型,将实验语音学知识引入声纹统计建模,对现有的多种语音特征进行合理表达与整合。研究声纹漂移现象的机器学习与理解,利用聚类和流形学习等机器学习方法实现个体声纹漂移现象的可视化从而作机制性建模,并找寻不同个体间声纹漂移机制的迁移学习策略。其次借鉴人类的感知机理,初步探索声纹的漂移不变性表达机制及其模型实现。我们还将通过开发漂移鲁棒性的声纹识别原型系统来验证所得表征模型与漂移鲁棒性实现方法的正确与有效性。
中文关键词: 声纹识别;声纹漂移;高斯混合模型;情感变化;形变补偿
英文摘要:
英文关键词: speaker recognition;intra-speaker variability;Gassian Mixture Model;emotion variability;Deformation Compensation