项目名称: 腭裂语音高鼻音等级自动识别关键技术研究

项目编号: No.61503264

项目类型: 青年科学基金项目

立项/批准年度: 2016

项目学科: 其他

项目作者: 何凌

作者单位: 四川大学

项目金额: 19万元

中文摘要: 高鼻音是腭裂语音最常见的临床表现之一。对腭裂高鼻音的语音评估具有十分重要的临床意义,目前国际各唇腭裂治疗单位均通过专业语音师的主观判听实现,该方式受语音师经验及主观状态等影响因素较多。自动腭裂高鼻音等级识别将为腭裂语音评估提供客观辅助诊断,社会应用前景广泛。目前,国内外对腭裂语音信号处理研究仍属起步阶段,其最主要瓶颈为腭裂语音数据采集。课题针对该瓶颈,与国内最大最权威的腭裂语音治疗中心合作,建立样本广泛的权威腭裂语音数据库。目前,国内外对腭裂高鼻音语音研究停滞在对高鼻音有无的判别上,临床意义不大。临床实践中,医生与语音师更希望得到对高鼻音等级的识别。课题首次实现普通话腭裂语音高鼻音四个等级(正常、轻、中、重度)自动识别的关键问题研究:从发音机理探索腭裂高鼻音声学特征的形成;研究腭裂高鼻音等级敏感声学特征参数;探讨腭裂高鼻音声学特性与模式识别算法的结合。课题开展弥补了国内在该领域的研究空白。

中文关键词: 腭裂语音;高鼻音;病理语音;声学特征参数提取;分类器

英文摘要: Hypernasality is one the most typical characteristics of Cleft Palate (CP) speech. The grades of hypernasality reflect different open port sizes of velopharyngeal. It is an important indicator to evaluate operation effectiveness. Moreover, ti provides assistant diagnosis for the necessity of carrying out the follow-up operation and treatment. Currently, the evaluation of CP speech is mostly carried out by experienced speech therapists. However, it strongly depends on their clinical experience and subjective judgment. Automatic evaluation of CP speech provides an objective and assistant assessment for both CP patients and doctors. It has various clinical applications. Currently, the major bottleneck in the field of CP speech research is the collection of CP speech data, which is tremendously limited by the number of patients, the accent of speakers, and thoughtful design of vocabulary list, which highly reflects typical CP speech characteristics. The majority of current CP speech researches are based on small size of CP speech databases, which only include several vowels or words. In this work, a more extensive CP database is applied. The speech data are collected by the Department of Cleft Lip and Palate (DCLP), Hospital of Stomatology, Sichuan University, which has the largest number of CLP patients in China. The majority of current researches on CP speech hypernasality analysis detect the existence of hypernasality only. However, CP speech therapists are more interested in finding out different levels of hypernasality, which indicates the velopharyngeal gap size. Whereas, very few works have been done in this field. In this work, we propose an automatic CP speech hypernasality grades evaluation algorithm. We investigate the acoustic features extraction methods and pattern recognition algorithms to classify four hypernasality grades: normal, mild,moderate and severe. This is the first domestic research on this topic.

英文关键词: cleft palate speech;hypernasality;pathology voice;acoustic feature extraction;classifier

成为VIP会员查看完整内容
0

相关内容

「大规模图神经网络系统」最新2022综述:从算法到系统
专知会员服务
113+阅读 · 2022年1月14日
深度学习人脸特征点自动定位综述
专知会员服务
23+阅读 · 2021年12月1日
专知会员服务
35+阅读 · 2021年9月12日
专知会员服务
54+阅读 · 2021年6月28日
专知会员服务
71+阅读 · 2021年5月21日
视频人脸识别进展综述
专知会员服务
55+阅读 · 2021年3月12日
专知会员服务
36+阅读 · 2020年12月14日
【博士论文】搜索引擎中的实体推荐关键技术研究
专知会员服务
44+阅读 · 2020年12月9日
多模态视觉语言表征学习研究综述
专知会员服务
191+阅读 · 2020年12月3日
一文带你了解语音信号处理技术
PaperWeekly
9+阅读 · 2022年1月26日
语音合成:模拟最像人类声音的系统
PaperWeekly
2+阅读 · 2021年11月30日
微软翻译突破百种语言和方言大关
微软研究院AI头条
0+阅读 · 2021年10月15日
自动化所人工智能辅助诊断方法进入肿瘤诊疗指南
中国科学院自动化研究所
1+阅读 · 2021年9月3日
SFFAI分享 | 连政:端到端语音合成【附PPT与视频资料】
人工智能前沿讲习班
14+阅读 · 2019年6月16日
微表情检测和识别的研究进展与趋势
中国计算机学会
15+阅读 · 2018年3月23日
领域应用 | 中医临床知识图谱的构建与应用
开放知识图谱
33+阅读 · 2017年12月12日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Tikhonov Regularization of Circle-Valued Signals
Arxiv
1+阅读 · 2022年4月20日
Arxiv
17+阅读 · 2022年1月11日
小贴士
相关VIP内容
「大规模图神经网络系统」最新2022综述:从算法到系统
专知会员服务
113+阅读 · 2022年1月14日
深度学习人脸特征点自动定位综述
专知会员服务
23+阅读 · 2021年12月1日
专知会员服务
35+阅读 · 2021年9月12日
专知会员服务
54+阅读 · 2021年6月28日
专知会员服务
71+阅读 · 2021年5月21日
视频人脸识别进展综述
专知会员服务
55+阅读 · 2021年3月12日
专知会员服务
36+阅读 · 2020年12月14日
【博士论文】搜索引擎中的实体推荐关键技术研究
专知会员服务
44+阅读 · 2020年12月9日
多模态视觉语言表征学习研究综述
专知会员服务
191+阅读 · 2020年12月3日
相关资讯
一文带你了解语音信号处理技术
PaperWeekly
9+阅读 · 2022年1月26日
语音合成:模拟最像人类声音的系统
PaperWeekly
2+阅读 · 2021年11月30日
微软翻译突破百种语言和方言大关
微软研究院AI头条
0+阅读 · 2021年10月15日
自动化所人工智能辅助诊断方法进入肿瘤诊疗指南
中国科学院自动化研究所
1+阅读 · 2021年9月3日
SFFAI分享 | 连政:端到端语音合成【附PPT与视频资料】
人工智能前沿讲习班
14+阅读 · 2019年6月16日
微表情检测和识别的研究进展与趋势
中国计算机学会
15+阅读 · 2018年3月23日
领域应用 | 中医临床知识图谱的构建与应用
开放知识图谱
33+阅读 · 2017年12月12日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员