项目名称: 基于图像视觉分析与人类听觉系统机理的单通道CASA研究

项目编号: No.61202084

项目类型: 青年科学基金项目

立项/批准年度: 2013

项目学科: 自动化技术、计算机技术

项目作者: 林劼

作者单位: 电子科技大学

项目金额: 24万元

中文摘要: 本项目交叉了图像视觉处理、计算听觉场景分析(CASA)和人类听觉系统原理,以图像视觉分析与人类听觉系统机理为新思路,研究基于CASA理论的一类新型语音分离理论与算法,以解决单通道语音分离技术中存在的多项挑战性关键问题,改进与提升语音分离系统的整体性能与实用性。项目一方面以对语音时频谱图或Cochleagram图的图像视觉性分析为突破点,研究混合语音信号中原始语音信号的组合遮掩关键性问题的图形化解决方法。另一方面围绕我们提出的人类听觉系统机理的基本概念,以计算机模型和算法对该理论进行原始创新性描述。从图像视觉分析技术与基于模型学习的CASA基本机理出发,探索研究采用这一计算模型与算法实现语音分离过程中模型间约束关系表示问题、特征提取问题和语音模式鲁棒性估计问题的有效解决方法。进一步围绕提出的两类新方法,探索基于模型学习但说话人非依赖性的语音分离系统实现过程,揭示新模型与方法的有效性和实用性。

中文关键词: 语音分离;计算听觉场景分析;图像视觉分析;人类听觉系统机理;鲁棒性

英文摘要: From the points of image & vision analysis and principles of the human auditory system, by bring together the knowledge in image & vision processing, computational auditory scene analysis(CASA) and principles of the human auditory system, we will

英文关键词: Speech Separation;CASA;image and vision analysis;auditory system principle;robust

成为VIP会员查看完整内容
0

相关内容

【AI+军事】附PPT 《前瞻性分析:获得决策优势的方法》
专知会员服务
90+阅读 · 2022年4月17日
多语言语音识别声学模型建模方法最新进展
专知会员服务
32+阅读 · 2022年2月7日
【博士论文】视觉语言交互中的视觉推理研究
专知会员服务
61+阅读 · 2021年12月1日
混合增强视觉认知架构及其关键技术进展
专知会员服务
40+阅读 · 2021年11月20日
专知会员服务
35+阅读 · 2021年2月20日
基于生理信号的情感计算研究综述
专知会员服务
61+阅读 · 2021年2月9日
【KDD2020】自适应多通道图卷积神经网络
专知会员服务
119+阅读 · 2020年7月9日
专知会员服务
221+阅读 · 2020年5月6日
基于文档的对话技术研究
专知
2+阅读 · 2022年2月20日
【动态】CSIG多媒体计算学术会议青年论坛成功召开
中国图象图形学学会CSIG
0+阅读 · 2021年12月10日
语音合成:模拟最像人类声音的系统
PaperWeekly
2+阅读 · 2021年11月30日
混合增强视觉认知架构及其关键技术进展
专知
2+阅读 · 2021年11月20日
中国类脑计算先行者:在AI“无人区”探路
THU数据派
0+阅读 · 2021年9月24日
【CAA智库】高文院士:转向跨媒体智能
中国自动化学会
22+阅读 · 2018年8月20日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
1+阅读 · 2022年4月19日
Arxiv
0+阅读 · 2022年4月16日
Directional Graph Networks
Arxiv
27+阅读 · 2020年12月10日
Arxiv
10+阅读 · 2020年11月26日
Arxiv
10+阅读 · 2018年3月23日
小贴士
相关VIP内容
【AI+军事】附PPT 《前瞻性分析:获得决策优势的方法》
专知会员服务
90+阅读 · 2022年4月17日
多语言语音识别声学模型建模方法最新进展
专知会员服务
32+阅读 · 2022年2月7日
【博士论文】视觉语言交互中的视觉推理研究
专知会员服务
61+阅读 · 2021年12月1日
混合增强视觉认知架构及其关键技术进展
专知会员服务
40+阅读 · 2021年11月20日
专知会员服务
35+阅读 · 2021年2月20日
基于生理信号的情感计算研究综述
专知会员服务
61+阅读 · 2021年2月9日
【KDD2020】自适应多通道图卷积神经网络
专知会员服务
119+阅读 · 2020年7月9日
专知会员服务
221+阅读 · 2020年5月6日
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
相关论文
Arxiv
0+阅读 · 2022年4月20日
Arxiv
1+阅读 · 2022年4月19日
Arxiv
0+阅读 · 2022年4月16日
Directional Graph Networks
Arxiv
27+阅读 · 2020年12月10日
Arxiv
10+阅读 · 2020年11月26日
Arxiv
10+阅读 · 2018年3月23日
微信扫码咨询专知VIP会员