项目名称: 融合言语产生系统发音信息和中层鉴别性表征的说话人识别与语种识别
项目编号: No.61401524
项目类型: 青年科学基金项目
立项/批准年度: 2014
项目学科: 无线电电子学、电信技术
项目作者: 李明
作者单位: 中山大学
项目金额: 28万元
中文摘要: (限400字):说话人识别与语种识别一直是语音信息处理领域的研究热点。传统方法主要是利用音素层,声学层和韵律层的信息。本文旨在从言语产生系统发音信息和中层鉴别性表征这两个方向展开说话人识别与语种识别的研究。本项目拟利用电磁发音仪采集一个以汉语为主体的较大规模的函盖多个语种或方言多个说话人的言语产生系统发音轨迹数据库,并以此为基础研究不同说话人和语种在发音层上的差异并提出新特征。研究基于多个参考说话人及语种的语音到发音逆求解方法来估计普通信道下的发音特征以用来提高识别性能。本项目还拟把图像场景分析中的最新研究热点中层鉴别性图像块思想用于语种识别和说话人识别上以提高系统综合性能。我们将研究中层鉴别性表征在语音上的中层定义,分段,代表单元学习,表征,后端分类等一系列核心问题。本项目不仅为说话人和语种识别提供两种新途径,也为言语产生和副语言信息听觉认知模型带来新观点,具有重要的理论意义与实际价值。
中文关键词: 说话人识别;语种识别;语音产生;中层鉴别性表征;
英文摘要: (限3000 Characters): Speaker recognition and language recognition continue to attract attention and remain as hot research topics in speech processing. Conventional methods mainly focus on information from phonetic, acoustic, and prosodic these three level
英文关键词: speaker recognition;language recognition;speech production;mid-level discriminative tokenization;