混合口音语音识别中自适应分层发音变异模型研究 - 专知基金

会员服务 ·

0

混合口音语音识别 ·

2009 年 12 月 31 日

混合口音语音识别中自适应分层发音变异模型研究

国家自然科学基金

国家自然科学基金委员会

项目名称： 混合口音语音识别中自适应分层发音变异模型研究

项目编号： No.60975018

项目类型： 面上项目

立项/批准年度： 2010

项目学科： 自动化技术、计算机技术

项目作者： 刘轶

作者单位： 清华大学

项目金额： 27万元

中文摘要： 本课题提出并研究自适应分层发音变异模型在混合口音语音识别上的应用。根据混合口音发音变异的单方向性和非对称性特点，建立二维发音变异平面，采用置信度准则和非对称距离在多状态多高斯分布的模型上度量方法对变异程度的高低进行描述，构造四类发音变异模型子空间，实现发音变异模型的分层描述方法。同时，采用数据驱动和规则相结合及语音学和语言学知识相结合的方法，对基本发音单元构造自适应辅助决策树，实现发音变异模型对具有不同发音变异复杂度的自适应描述。由于发音变异不仅仅存在于口音中，也存在于各种自发式语音中，包括对话语音，讲座语音，访谈语音等。因此本课题的研究既针对语音识别技术的应用需求，也为口音及其他自发式语音识别研究提供新思路和新方法。

中文关键词： 混合口音语音识别；自适应分层发音变异模型；；；

英文摘要：

英文关键词： Mixed accented speech recognit；adaptive layered pronunciation；；；

成为VIP会员查看完整内容

0

相关内容

「图像异常检测」最新2022研究综述

「图像异常检测」最新2022研究综述

专知会员服务

91+阅读 · 2022年4月15日

从视频到语言: 视频标题生成与描述研究综述

从视频到语言: 视频标题生成与描述研究综述

专知会员服务

21+阅读 · 2022年1月8日

【上海交通大学陈露博士论文】认知型口语交互系统中的对话管理技术

【上海交通大学陈露博士论文】认知型口语交互系统中的对话管理技术

专知会员服务

39+阅读 · 2021年11月23日

自然语言预训练模型知识增强方法综述

专知会员服务

62+阅读 · 2021年8月4日

基于生成模型的闲聊机器人自动评价方法综述

专知会员服务

33+阅读 · 2021年4月18日

【博士论文】面向文本生成的深度序列模型研究

专知会员服务

56+阅读 · 2020年12月20日

纽约大学最新《语音识别Speech Recognition》2020课程，不可错过！

纽约大学最新《语音识别Speech Recognition》2020课程，不可错过！

专知会员服务

44+阅读 · 2020年11月2日

神经机器翻译前沿综述

专知会员服务

28+阅读 · 2020年9月9日

【综述】用于语音自动处理的深度神经网络综述:从大型语料库到有限数据的调查

【综述】用于语音自动处理的深度神经网络综述:从大型语料库到有限数据的调查

专知会员服务

24+阅读 · 2020年3月9日

【上海交大-ICASSP2020】Transformer端到端的多说话人语音识别

【上海交大-ICASSP2020】Transformer端到端的多说话人语音识别

专知会员服务

51+阅读 · 2020年2月16日

如何亿点点降低语音识别跨领域、跨语种迁移难度？

如何亿点点降低语音识别跨领域、跨语种迁移难度？

微软研究院AI头条

0+阅读 · 2022年3月31日

GPT-3好“搭档”：这种方法缓解模型退化，让输出更自然

GPT-3好“搭档”：这种方法缓解模型退化，让输出更自然

大数据文摘

0+阅读 · 2022年3月30日

多语言语音识别声学模型建模方法最新进展

多语言语音识别声学模型建模方法最新进展

专知

2+阅读 · 2022年2月7日

一文带你了解语音信号处理技术

一文带你了解语音信号处理技术

PaperWeekly

9+阅读 · 2022年1月26日

语音合成：模拟最像人类声音的系统

语音合成：模拟最像人类声音的系统

PaperWeekly

2+阅读 · 2021年11月30日

SFFAI 31 报名通知 | 情感语音识别与合成

SFFAI 31 报名通知 | 情感语音识别与合成

人工智能前沿讲习班

17+阅读 · 2019年5月30日

使用RNN-Transducer进行语音识别建模【附PPT与视频资料】

使用RNN-Transducer进行语音识别建模【附PPT与视频资料】

人工智能前沿讲习班

74+阅读 · 2019年1月29日

python语音识别终极指南

python语音识别终极指南

AI100

13+阅读 · 2018年4月5日

一文看懂深度学习在语音合成&增强上的应用

一文看懂深度学习在语音合成&增强上的应用

数盟

11+阅读 · 2017年9月13日

语音识别之--韩语语音识别

语音识别之--韩语语音识别

微信AI

16+阅读 · 2017年8月2日

基于发音特征的汉语语音识别分层解码方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于压缩感知的单通道混合语音分离理论及算法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于音节模型的音频点播关键技术研究

国家自然科学基金

0+阅读 · 2013年12月31日

面向非平行文本的说话人个性特征转换的关键技术及应用研究

国家自然科学基金

0+阅读 · 2013年12月31日

多语言语音识别声学建模理论和容错识别新方法研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于结构化统计声学模型的非平行语料非联合训练说话人语音转换研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于分段条件随机场的连续语音识别技术

国家自然科学基金

1+阅读 · 2011年12月31日

非特定人自然语音情感识别的建模方法研究

国家自然科学基金

1+阅读 · 2011年12月31日

基于语流音变认知机理建模的语音识别研究

国家自然科学基金

0+阅读 · 2011年12月31日

未知模型混沌系统的建模与控制的研究

国家自然科学基金

0+阅读 · 2009年12月31日

Dependent Optics

Arxiv

0+阅读 · 2022年4月20日

Analyzing the Intensity of Complaints on Social Media

Arxiv

0+阅读 · 2022年4月20日

A Sound Up-to-$n$,$δ$ Bisimilarity for PCTL

Arxiv

0+阅读 · 2022年4月20日

Blockwise Streaming Transformer for Spoken Language Understanding and Simultaneous Speech Translation

Blockwise Streaming Transformer for Spoken Language Understanding and Simultaneous Speech Translation

Arxiv

0+阅读 · 2022年4月19日

Using deep learning to detect patients at risk for prostate cancer despite benign biopsies

Arxiv

0+阅读 · 2022年4月19日

Research on Domain Information Mining and Theme Evolution of Scientific Papers

Arxiv

0+阅读 · 2022年4月18日

Positive definite functions on a regular domain

Arxiv

0+阅读 · 2022年4月17日

Automatic spinal curvature measurement on ultrasound spine images using Faster R-CNN

Arxiv

1+阅读 · 2022年4月17日

Speaker-Aware Mixture of Mixtures Training for Weakly Supervised Speaker Extraction

Arxiv

0+阅读 · 2022年4月15日

Faster Meta Update Strategy for Noise-Robust Deep Learning

Arxiv

11+阅读 · 2021年4月30日

阅读: 0 点赞: 0

小贴士

登录享主题订阅及个性化推荐

相关主题

混合口音语音识别

热门VIP内容

开通专知VIP会员享更多权益服务

人机协同时代的军事指挥控制演进

《英国智库：瓦解俄罗斯防空系统生产，夺回制空权》最新报告

《通过仿真与开源数据提升战略决策：机遇与局限》最新报告

《战术突击工具包：军队的“边缘”操作系统》报告

相关VIP内容

「图像异常检测」最新2022研究综述

「图像异常检测」最新2022研究综述

专知会员服务

91+阅读 · 2022年4月15日

从视频到语言: 视频标题生成与描述研究综述

从视频到语言: 视频标题生成与描述研究综述

专知会员服务

21+阅读 · 2022年1月8日

【上海交通大学陈露博士论文】认知型口语交互系统中的对话管理技术

【上海交通大学陈露博士论文】认知型口语交互系统中的对话管理技术

专知会员服务

39+阅读 · 2021年11月23日

自然语言预训练模型知识增强方法综述

专知会员服务

62+阅读 · 2021年8月4日

基于生成模型的闲聊机器人自动评价方法综述

专知会员服务

33+阅读 · 2021年4月18日

【博士论文】面向文本生成的深度序列模型研究

专知会员服务

56+阅读 · 2020年12月20日

纽约大学最新《语音识别Speech Recognition》2020课程，不可错过！

纽约大学最新《语音识别Speech Recognition》2020课程，不可错过！

专知会员服务

44+阅读 · 2020年11月2日

神经机器翻译前沿综述

专知会员服务

28+阅读 · 2020年9月9日

【综述】用于语音自动处理的深度神经网络综述:从大型语料库到有限数据的调查

【综述】用于语音自动处理的深度神经网络综述:从大型语料库到有限数据的调查

专知会员服务

24+阅读 · 2020年3月9日

【上海交大-ICASSP2020】Transformer端到端的多说话人语音识别

【上海交大-ICASSP2020】Transformer端到端的多说话人语音识别

专知会员服务

51+阅读 · 2020年2月16日

相关资讯

如何亿点点降低语音识别跨领域、跨语种迁移难度？

如何亿点点降低语音识别跨领域、跨语种迁移难度？

微软研究院AI头条

0+阅读 · 2022年3月31日

GPT-3好“搭档”：这种方法缓解模型退化，让输出更自然

GPT-3好“搭档”：这种方法缓解模型退化，让输出更自然

大数据文摘

0+阅读 · 2022年3月30日

多语言语音识别声学模型建模方法最新进展

多语言语音识别声学模型建模方法最新进展

专知

2+阅读 · 2022年2月7日

一文带你了解语音信号处理技术

一文带你了解语音信号处理技术

PaperWeekly

9+阅读 · 2022年1月26日

语音合成：模拟最像人类声音的系统

语音合成：模拟最像人类声音的系统

PaperWeekly

2+阅读 · 2021年11月30日

SFFAI 31 报名通知 | 情感语音识别与合成

SFFAI 31 报名通知 | 情感语音识别与合成

人工智能前沿讲习班

17+阅读 · 2019年5月30日

使用RNN-Transducer进行语音识别建模【附PPT与视频资料】

使用RNN-Transducer进行语音识别建模【附PPT与视频资料】

人工智能前沿讲习班

74+阅读 · 2019年1月29日

python语音识别终极指南

python语音识别终极指南

AI100

13+阅读 · 2018年4月5日

一文看懂深度学习在语音合成&增强上的应用

一文看懂深度学习在语音合成&增强上的应用

数盟

11+阅读 · 2017年9月13日

语音识别之--韩语语音识别

语音识别之--韩语语音识别

微信AI

16+阅读 · 2017年8月2日

相关基金

基于发音特征的汉语语音识别分层解码方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于压缩感知的单通道混合语音分离理论及算法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于音节模型的音频点播关键技术研究

国家自然科学基金

0+阅读 · 2013年12月31日

面向非平行文本的说话人个性特征转换的关键技术及应用研究

国家自然科学基金

0+阅读 · 2013年12月31日

多语言语音识别声学建模理论和容错识别新方法研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于结构化统计声学模型的非平行语料非联合训练说话人语音转换研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于分段条件随机场的连续语音识别技术

国家自然科学基金

1+阅读 · 2011年12月31日

非特定人自然语音情感识别的建模方法研究

国家自然科学基金

1+阅读 · 2011年12月31日

基于语流音变认知机理建模的语音识别研究

国家自然科学基金

0+阅读 · 2011年12月31日

未知模型混沌系统的建模与控制的研究

国家自然科学基金

0+阅读 · 2009年12月31日

相关论文

Dependent Optics

Arxiv

0+阅读 · 2022年4月20日

Analyzing the Intensity of Complaints on Social Media

Arxiv

0+阅读 · 2022年4月20日

A Sound Up-to-$n$,$δ$ Bisimilarity for PCTL

Arxiv

0+阅读 · 2022年4月20日

Blockwise Streaming Transformer for Spoken Language Understanding and Simultaneous Speech Translation

Blockwise Streaming Transformer for Spoken Language Understanding and Simultaneous Speech Translation

Arxiv

0+阅读 · 2022年4月19日

Using deep learning to detect patients at risk for prostate cancer despite benign biopsies

Arxiv

0+阅读 · 2022年4月19日

Research on Domain Information Mining and Theme Evolution of Scientific Papers

Arxiv

0+阅读 · 2022年4月18日

Positive definite functions on a regular domain

Arxiv

0+阅读 · 2022年4月17日

Automatic spinal curvature measurement on ultrasound spine images using Faster R-CNN

Arxiv

1+阅读 · 2022年4月17日

Speaker-Aware Mixture of Mixtures Training for Weakly Supervised Speaker Extraction

Arxiv

0+阅读 · 2022年4月15日

Faster Meta Update Strategy for Noise-Robust Deep Learning

Arxiv

11+阅读 · 2021年4月30日

微信扫码咨询专知VIP会员