基于观测图像的发音器官运动合成研究 - 专知基金

会员服务 ·

0

语音产生 · 语音合成 · 声道模型 · 超声图像处理 ·

2011 年 12 月 31 日

基于观测图像的发音器官运动合成研究

国家自然科学基金

国家自然科学基金委员会

项目名称： 基于观测图像的发音器官运动合成研究

项目编号： No.61175016

项目类型： 面上项目

立项/批准年度： 2012

项目学科： 自动化技术、计算机技术

项目作者： 魏建国

作者单位： 天津大学

项目金额： 59万元

中文摘要： 发音器官运动的可视化是进行语音学习和语音康复指导的重要辅助手段。目前可视化语音合成主要包括可见发音器官，本课题是要基于观测图像来同时合成可见及不可见发音器官运动。声道中不可见发音器官如舌头，上颚等，其数据采集非常困难并涉及多模态数据的同步与融合。本研究将利用由超声仪、高速摄像头等设备组成的多模态数据采集系统，记录发音器官的运动,并建立保证各个模态数据间同步和融合的方法。利用语音学知识作为约束来解决从高噪声的超声图像中自动提取发音器官边界等特征的难题。利用生理发音模型用仿真拟合的方法从超声图像中重构完整声道形状。最后，利用隐马尔科夫模型生成的参数轨迹来进行图像拼接单元的选取，合成基于观测图像的发音器官运动视频。

中文关键词： 语音产生；语音合成；发音运动；声道模型；超声图像处理

英文摘要：

英文关键词： Speech production；Speech synthesis；Articulatory movement；Vocal tract model；Ultrasound image processing

成为VIP会员查看完整内容

0

相关内容

语音产生

【MM 2021】基于单张图像的多风格说话人合成，Imitating Arbitrary Talking Style for Realistic Audio-Driven Talking Face Synthesis

【MM 2021】基于单张图像的多风格说话人合成，Imitating Arbitrary Talking Style for Realistic Audio-Driven Talking Face Synthesis

专知会员服务

6+阅读 · 2022年3月22日

AAAI 2022：三角分解一致性约束的端到端语音翻译

AAAI 2022：三角分解一致性约束的端到端语音翻译

专知会员服务

9+阅读 · 2022年1月17日

基于深度学习的医学影像分割研究综述

专知会员服务

49+阅读 · 2021年8月28日

基于深度学习的语音合成与转换技术综述

专知会员服务

31+阅读 · 2021年8月16日

SIGGRAPH 2021 | 学习带神经融合形状的人物动画

专知会员服务

15+阅读 · 2021年6月1日

【CVPR 2021】姿态可控的语音驱动说话人脸

专知会员服务

16+阅读 · 2021年5月13日

【ECCV2020-牛津大学】基于自监督学习的视频音视觉物体结构化

【ECCV2020-牛津大学】基于自监督学习的视频音视觉物体结构化

专知会员服务

20+阅读 · 2020年8月11日

多模态学习方法综述

专知会员服务

235+阅读 · 2020年5月6日

姿势服装随心换-CVPR2019

姿势服装随心换-CVPR2019

专知会员服务

36+阅读 · 2020年1月26日

【CCF优秀博士学位论文奖-2019】融合结构先验的图像及视频去模糊研究，天津大学任文琦

【CCF优秀博士学位论文奖-2019】融合结构先验的图像及视频去模糊研究，天津大学任文琦

专知会员服务

48+阅读 · 2019年11月8日

只讲关键点之兼容100+种关键点检测数据增强方法

只讲关键点之兼容100+种关键点检测数据增强方法

极市平台

4+阅读 · 2022年2月22日

一文带你了解语音信号处理技术

一文带你了解语音信号处理技术

PaperWeekly

9+阅读 · 2022年1月26日

语音合成：模拟最像人类声音的系统

语音合成：模拟最像人类声音的系统

PaperWeekly

2+阅读 · 2021年11月30日

自动生成模型动画：北大神经融合形状新方法登上SIGGRAPH 2021

自动生成模型动画：北大神经融合形状新方法登上SIGGRAPH 2021

机器之心

1+阅读 · 2021年5月7日

综述 | 激光与视觉融合SLAM

综述 | 激光与视觉融合SLAM

计算机视觉life

18+阅读 · 2020年10月8日

【综述】基于深度学习的图像数据增强方法最新进展，48页论文带你快速了解领域进展

【综述】基于深度学习的图像数据增强方法最新进展，48页论文带你快速了解领域进展

专知

43+阅读 · 2019年7月10日

最全综述 | 医学图像处理

最全综述 | 医学图像处理

计算机视觉life

57+阅读 · 2019年6月15日

用于语音识别的数据增强

用于语音识别的数据增强

AI研习社

24+阅读 · 2019年6月5日

人体骨骼关键点检测综述

人体骨骼关键点检测综述

极市平台

22+阅读 · 2018年6月29日

干货｜全景视频拼接的关键技术分析

干货｜全景视频拼接的关键技术分析

全球人工智能

13+阅读 · 2017年7月15日

融合多源图像与光流运动的旋转背景下对地运动目标检测研究

国家自然科学基金

2+阅读 · 2014年12月31日

基于计算机视觉的地面运动观测方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于全向深度视觉的高精度人体肢体运动三维重建研究

国家自然科学基金

0+阅读 · 2014年12月31日

语音及情感语义同步的三维人脸可视化：从发声器官到外观

国家自然科学基金

3+阅读 · 2014年12月31日

基于压缩感知的肺损伤三维动态阻抗图像重建理论研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于超声图像的静音语音识别关键技术研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于影像和语音分析的发音器官运动可视化

国家自然科学基金

0+阅读 · 2012年12月31日

面向多时相腹部CT图像的多器官计算机辅助诊断关键技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

结合发音动作参数的统计建模语音合成方法研究

国家自然科学基金

0+阅读 · 2009年12月31日

应用触觉交互的人手运动功能虚拟康复系统的关键问题研究

国家自然科学基金

0+阅读 · 2009年12月31日

A multi-task learning for cavitation detection and cavitation intensity recognition of valve acoustic signals

Arxiv

0+阅读 · 2022年4月20日

A comparison of different atmospheric turbulence simulation methods for image restoration

A comparison of different atmospheric turbulence simulation methods for image restoration

Arxiv

1+阅读 · 2022年4月19日

Unsupervised Learning of Efficient Geometry-Aware Neural Articulated Representations

Arxiv

0+阅读 · 2022年4月19日

Towards Unification of Discourse Annotation Frameworks

Arxiv

0+阅读 · 2022年4月16日

Synthesizing Informative Training Samples with GAN

Synthesizing Informative Training Samples with GAN

Arxiv

0+阅读 · 2022年4月15日

A Survey of Natural Language Generation

Arxiv

15+阅读 · 2021年12月22日

The Principles of Deep Learning Theory

Arxiv

66+阅读 · 2021年6月18日

Deep Learning-Based Human Pose Estimation: A Survey

Arxiv

27+阅读 · 2020年12月24日

FocalMix: Semi-Supervised Learning for 3D Medical Image Detection

FocalMix: Semi-Supervised Learning for 3D Medical Image Detection

Arxiv

10+阅读 · 2020年3月20日

A 3D Coarse-to-Fine Framework for Volumetric Medical Image Segmentation

A 3D Coarse-to-Fine Framework for Volumetric Medical Image Segmentation

Arxiv

15+阅读 · 2018年8月2日

阅读: 0 点赞: 0

小贴士

登录享主题订阅及个性化推荐

相关主题

超声图像处理

热门VIP内容

开通专知VIP会员享更多权益服务

【CMU博士论文】基础模型训练中网络规模数据的负责任与高效使用

《俄乌战争背景下俄罗斯的战略性海军分析（2022-2025年）》最新100页报告

人工智能时代背景下的未来海战

相关VIP内容

【MM 2021】基于单张图像的多风格说话人合成，Imitating Arbitrary Talking Style for Realistic Audio-Driven Talking Face Synthesis

【MM 2021】基于单张图像的多风格说话人合成，Imitating Arbitrary Talking Style for Realistic Audio-Driven Talking Face Synthesis

专知会员服务

6+阅读 · 2022年3月22日

AAAI 2022：三角分解一致性约束的端到端语音翻译

AAAI 2022：三角分解一致性约束的端到端语音翻译

专知会员服务

9+阅读 · 2022年1月17日

基于深度学习的医学影像分割研究综述

专知会员服务

49+阅读 · 2021年8月28日

基于深度学习的语音合成与转换技术综述

专知会员服务

31+阅读 · 2021年8月16日

SIGGRAPH 2021 | 学习带神经融合形状的人物动画

专知会员服务

15+阅读 · 2021年6月1日

【CVPR 2021】姿态可控的语音驱动说话人脸

专知会员服务

16+阅读 · 2021年5月13日

【ECCV2020-牛津大学】基于自监督学习的视频音视觉物体结构化

【ECCV2020-牛津大学】基于自监督学习的视频音视觉物体结构化

专知会员服务

20+阅读 · 2020年8月11日

多模态学习方法综述

专知会员服务

235+阅读 · 2020年5月6日

姿势服装随心换-CVPR2019

姿势服装随心换-CVPR2019

专知会员服务

36+阅读 · 2020年1月26日

【CCF优秀博士学位论文奖-2019】融合结构先验的图像及视频去模糊研究，天津大学任文琦

【CCF优秀博士学位论文奖-2019】融合结构先验的图像及视频去模糊研究，天津大学任文琦

专知会员服务

48+阅读 · 2019年11月8日

相关资讯

只讲关键点之兼容100+种关键点检测数据增强方法

只讲关键点之兼容100+种关键点检测数据增强方法

极市平台

4+阅读 · 2022年2月22日

一文带你了解语音信号处理技术

一文带你了解语音信号处理技术

PaperWeekly

9+阅读 · 2022年1月26日

语音合成：模拟最像人类声音的系统

语音合成：模拟最像人类声音的系统

PaperWeekly

2+阅读 · 2021年11月30日

自动生成模型动画：北大神经融合形状新方法登上SIGGRAPH 2021

自动生成模型动画：北大神经融合形状新方法登上SIGGRAPH 2021

机器之心

1+阅读 · 2021年5月7日

综述 | 激光与视觉融合SLAM

综述 | 激光与视觉融合SLAM

计算机视觉life

18+阅读 · 2020年10月8日

【综述】基于深度学习的图像数据增强方法最新进展，48页论文带你快速了解领域进展

【综述】基于深度学习的图像数据增强方法最新进展，48页论文带你快速了解领域进展

专知

43+阅读 · 2019年7月10日

最全综述 | 医学图像处理

最全综述 | 医学图像处理

计算机视觉life

57+阅读 · 2019年6月15日

用于语音识别的数据增强

用于语音识别的数据增强

AI研习社

24+阅读 · 2019年6月5日

人体骨骼关键点检测综述

人体骨骼关键点检测综述

极市平台

22+阅读 · 2018年6月29日

干货｜全景视频拼接的关键技术分析

干货｜全景视频拼接的关键技术分析

全球人工智能

13+阅读 · 2017年7月15日

相关基金

融合多源图像与光流运动的旋转背景下对地运动目标检测研究

国家自然科学基金

2+阅读 · 2014年12月31日

基于计算机视觉的地面运动观测方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于全向深度视觉的高精度人体肢体运动三维重建研究

国家自然科学基金

0+阅读 · 2014年12月31日

语音及情感语义同步的三维人脸可视化：从发声器官到外观

国家自然科学基金

3+阅读 · 2014年12月31日

基于压缩感知的肺损伤三维动态阻抗图像重建理论研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于超声图像的静音语音识别关键技术研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于影像和语音分析的发音器官运动可视化

国家自然科学基金

0+阅读 · 2012年12月31日

面向多时相腹部CT图像的多器官计算机辅助诊断关键技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

结合发音动作参数的统计建模语音合成方法研究

国家自然科学基金

0+阅读 · 2009年12月31日

应用触觉交互的人手运动功能虚拟康复系统的关键问题研究

国家自然科学基金

0+阅读 · 2009年12月31日

相关论文

A multi-task learning for cavitation detection and cavitation intensity recognition of valve acoustic signals

Arxiv

0+阅读 · 2022年4月20日

A comparison of different atmospheric turbulence simulation methods for image restoration

A comparison of different atmospheric turbulence simulation methods for image restoration

Arxiv

1+阅读 · 2022年4月19日

Unsupervised Learning of Efficient Geometry-Aware Neural Articulated Representations

Arxiv

0+阅读 · 2022年4月19日

Towards Unification of Discourse Annotation Frameworks

Arxiv

0+阅读 · 2022年4月16日

Synthesizing Informative Training Samples with GAN

Synthesizing Informative Training Samples with GAN

Arxiv

0+阅读 · 2022年4月15日

A Survey of Natural Language Generation

Arxiv

15+阅读 · 2021年12月22日

The Principles of Deep Learning Theory

Arxiv

66+阅读 · 2021年6月18日

Deep Learning-Based Human Pose Estimation: A Survey

Arxiv

27+阅读 · 2020年12月24日

FocalMix: Semi-Supervised Learning for 3D Medical Image Detection

FocalMix: Semi-Supervised Learning for 3D Medical Image Detection

Arxiv

10+阅读 · 2020年3月20日

A 3D Coarse-to-Fine Framework for Volumetric Medical Image Segmentation

A 3D Coarse-to-Fine Framework for Volumetric Medical Image Segmentation

Arxiv

15+阅读 · 2018年8月2日

微信扫码咨询专知VIP会员