项目名称: 精神压力下基于物理模型的变异语音生成机理探索及检测方法研究

项目编号: No.61501170

项目类型: 青年科学基金项目

立项/批准年度: 2016

项目学科: 无线电电子学、电信技术

项目作者: 姚潇

作者单位: 河海大学

项目金额: 19万元

中文摘要: 压力、情感、心理紧张引起的说话人发声变异一直是语音领域的研究热点。因变异语音生成机理复杂,且缺少统一的表征和描述,使得精神压力下语音的检测识别存在着一定局限性。为此,本研究基于传统模型,建立说话人变异语音生成的物理模型,揭示精神压力状态下说话人发声生理系统及其中气流流态的变化规律,探索变异语音的生成机理;通过物理模型模拟,设计生理特征估计算法,建立压力相关生理特征与声门波参数的关联,提取与压力因素有关且拥有物理意义的声门波参数;以说话人生理信号作为压力异常状态的客观评价标准,在语音收集的过程中对样本进行标注。重点解决:(1)建立针对变异语音的物理生成模型;(2)设计基于物理模型的特征提取算法,进行压力下变异语音识别;(3)通过说话人生理信号进行压力的客观评价。研究成果不仅可以处理语音中的言语和非言语信息,而且可为语音技术的相关研究领域问题的解决奠定了理论和实践基础。

中文关键词: 变异语音;物理模型;语音生成机理;生理特征;气流流态

英文摘要: The speech under stress induced by high workload, multi-tasking, fatigue, and emotional situations has been the subject of many studies. Methods for stress classification used at present have their limitation because of the lack of a description for the stressed speech production. In this project, the physical model for stressed speech production is proposed, and the production mechanism for the stressed speech is studied by focusing on variations in the aerodynamics of airflow patterns in vocal system physiology. The relationship of physiological feature related to stress and parameters of glottal flow is established by physical modeling, and the algorithm is designed to extract the glottal-flow parameters with physical meaning. Also an objective evaluation standard for stress based on physiological signals is proposed to label the speech samples during the data collection process. Main focus: (1) Physical modeling for the stressed speech. (2) Algorithm design for feature extraction based on physical model for stress classification. (3) An objective evaluation using physiological signals. The study based on speech production could process verbal and non-verbal information in speech signal, and lay the theoretical and practical foundation for related area of speech technology.

英文关键词: speech under stress ;physical model;speech production ;physiological feature;airflow pattern

成为VIP会员查看完整内容
0

相关内容

多语言语音识别声学模型建模方法最新进展
专知会员服务
33+阅读 · 2022年2月7日
视频隐私保护技术综述
专知会员服务
34+阅读 · 2022年1月19日
专知会员服务
15+阅读 · 2021年5月13日
专知会员服务
55+阅读 · 2021年4月20日
虚假评论识别研究综述
专知会员服务
23+阅读 · 2021年3月2日
基于生理信号的情感计算研究综述
专知会员服务
61+阅读 · 2021年2月9日
专知会员服务
55+阅读 · 2020年12月20日
【NeurIPS 2020】视觉注意力神经编码
专知会员服务
40+阅读 · 2020年10月4日
如何亿点点降低语音识别跨领域、跨语种迁移难度?
微软研究院AI头条
0+阅读 · 2022年3月31日
一文带你了解语音信号处理技术
PaperWeekly
9+阅读 · 2022年1月26日
语音合成:模拟最像人类声音的系统
PaperWeekly
2+阅读 · 2021年11月30日
语音情绪识别|声源增强|基频可视化
深度学习每日摘要
15+阅读 · 2019年5月5日
书单 | 语音研究进阶指南
微软研究院AI头条
12+阅读 · 2019年3月22日
语音关键词检测方法综述【附PPT与视频资料】
人工智能前沿讲习班
10+阅读 · 2019年2月2日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
2D Human Pose Estimation: A Survey
Arxiv
0+阅读 · 2022年4月15日
Arxiv
15+阅读 · 2021年12月22日
Arxiv
25+阅读 · 2021年3月20日
Arxiv
110+阅读 · 2020年2月5日
小贴士
相关VIP内容
多语言语音识别声学模型建模方法最新进展
专知会员服务
33+阅读 · 2022年2月7日
视频隐私保护技术综述
专知会员服务
34+阅读 · 2022年1月19日
专知会员服务
15+阅读 · 2021年5月13日
专知会员服务
55+阅读 · 2021年4月20日
虚假评论识别研究综述
专知会员服务
23+阅读 · 2021年3月2日
基于生理信号的情感计算研究综述
专知会员服务
61+阅读 · 2021年2月9日
专知会员服务
55+阅读 · 2020年12月20日
【NeurIPS 2020】视觉注意力神经编码
专知会员服务
40+阅读 · 2020年10月4日
相关资讯
如何亿点点降低语音识别跨领域、跨语种迁移难度?
微软研究院AI头条
0+阅读 · 2022年3月31日
一文带你了解语音信号处理技术
PaperWeekly
9+阅读 · 2022年1月26日
语音合成:模拟最像人类声音的系统
PaperWeekly
2+阅读 · 2021年11月30日
语音情绪识别|声源增强|基频可视化
深度学习每日摘要
15+阅读 · 2019年5月5日
书单 | 语音研究进阶指南
微软研究院AI头条
12+阅读 · 2019年3月22日
语音关键词检测方法综述【附PPT与视频资料】
人工智能前沿讲习班
10+阅读 · 2019年2月2日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员