项目名称: 基于影像和语音分析的发音器官运动可视化

项目编号: No.61273288

项目类型: 面上项目

立项/批准年度: 2013

项目学科: 自动化技术、计算机技术

项目作者: 杨明浩

作者单位: 中国科学院自动化研究所

项目金额: 81万元

中文摘要: 目前,语言病理学家和言语治疗师们对发音障碍进行诊断和康复评估时,通常依赖个人经验做出判断,其主要原因有两点:一是医学界对人类的发音机理尚不完全清楚;二是多数发音器官隐藏在人体内部,器官运动与语音的关系难以观测,缺乏客观评估依据。本课题以同步分析器官运动和对应语音之间的关系为出发点和目标,建立形状约束的发音器官三维运动离散紧凑表示和三维精细控制模型,研究器官二维残缺影像轮廓的三维形状复原方法,从低质量医学影像中重建发音器官的三维运动,实现发音器官的协同控制和可视化。在此基础上,对比典型患者与正常者语音及器官三维运动的差异,在时序上深入分析发音器官运动缺陷与异常语音的关联,在合作医院的支持下,将可视化工具和病理语音映射模型在临床中验证,提高科研成果的实用性。本课题的开展,除了为语音障碍诊断和康复训练提供客观评估依据外,也为进一步研究发音障碍的生理机理提供直观的可视化分析工具和重要的数据支持。

中文关键词: 多模态病理语音数据库;医学图像处理;语音分析;语音可视化;嗓音评估

英文摘要: In spite of great progress have been achieved in voice medicine recently, the situation has not changed that the diagnosis for language disorder patients depends on the personal experience of speech pathologists and speech therapists. There are mainly two reasons behind this phenomenon. (1) How speech is produced is not completely clear in physiological mechanism for speech pathologists; (2) Most speech organs are hided deeply in body, which makes them difficult to observe, so that objective voice analysis in dysphonic patients is still a huge challenge for speech pathologists and speech therapists. This study analysis the relationship between organs' movements and voice features firstly and then elaborately construct the 3D model of speech organs from the low-resolution medical video and drive the vocal tract movements based on input voice. Based on the visualization technique for speech organs movements, this study further construct the mapping model between organ movements and pathological voice by analysising and comparing the difference of organ movements and voice between language disorder sufferers and normal persons. And a speech organs' movements and voice feature database will be constructed depending on the mapping model. Finally, supported by cooperative hospital, we will verify the visualization too

英文关键词: Multi-modal pathological voice database;Medical video analysis;Speech analysis;Speech visualization;Voice measurement

成为VIP会员查看完整内容
0

相关内容

医学图像关键点检测深度学习方法研究与挑战
专知会员服务
50+阅读 · 2022年4月10日
专知会员服务
56+阅读 · 2021年9月22日
专知会员服务
45+阅读 · 2021年8月28日
专知会员服务
40+阅读 · 2021年7月24日
专知会员服务
65+阅读 · 2021年6月3日
专知会员服务
14+阅读 · 2021年6月1日
专知会员服务
27+阅读 · 2021年1月29日
多模态情绪识别研究综述
专知会员服务
165+阅读 · 2020年12月21日
【人大】图实现算法综述与评测分析
专知会员服务
37+阅读 · 2020年4月28日
开源数据支撑下的人物与装备分析
PaperWeekly
4+阅读 · 2022年3月20日
图像分割在医学影像中的应用
极市平台
2+阅读 · 2022年2月16日
最全综述 | 医学图像处理
计算机视觉life
57+阅读 · 2019年6月15日
SkeletonNet:完整的人体三维位姿重建方法
计算机视觉life
21+阅读 · 2019年1月21日
干货|全景视频拼接的关键技术分析
全球人工智能
13+阅读 · 2017年7月15日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月16日
Arxiv
64+阅读 · 2021年6月18日
Arxiv
92+阅读 · 2021年5月17日
小贴士
相关VIP内容
医学图像关键点检测深度学习方法研究与挑战
专知会员服务
50+阅读 · 2022年4月10日
专知会员服务
56+阅读 · 2021年9月22日
专知会员服务
45+阅读 · 2021年8月28日
专知会员服务
40+阅读 · 2021年7月24日
专知会员服务
65+阅读 · 2021年6月3日
专知会员服务
14+阅读 · 2021年6月1日
专知会员服务
27+阅读 · 2021年1月29日
多模态情绪识别研究综述
专知会员服务
165+阅读 · 2020年12月21日
【人大】图实现算法综述与评测分析
专知会员服务
37+阅读 · 2020年4月28日
相关资讯
开源数据支撑下的人物与装备分析
PaperWeekly
4+阅读 · 2022年3月20日
图像分割在医学影像中的应用
极市平台
2+阅读 · 2022年2月16日
最全综述 | 医学图像处理
计算机视觉life
57+阅读 · 2019年6月15日
SkeletonNet:完整的人体三维位姿重建方法
计算机视觉life
21+阅读 · 2019年1月21日
干货|全景视频拼接的关键技术分析
全球人工智能
13+阅读 · 2017年7月15日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员