融合言语产生系统发音信息和中层鉴别性表征的说话人识别与语种识别 - 专知基金

会员服务 ·

0

说话人识别 · 语种识别 · 语音产生 · 中层鉴别性表征 ·

2013 年 12 月 31 日

融合言语产生系统发音信息和中层鉴别性表征的说话人识别与语种识别

国家自然科学基金

国家自然科学基金委员会

项目名称： 融合言语产生系统发音信息和中层鉴别性表征的说话人识别与语种识别

项目编号： No.61401524

项目类型： 青年科学基金项目

立项/批准年度： 2014

项目学科： 无线电电子学、电信技术

项目作者： 李明

作者单位： 中山大学

项目金额： 28万元

中文摘要： (限400字)：说话人识别与语种识别一直是语音信息处理领域的研究热点。传统方法主要是利用音素层，声学层和韵律层的信息。本文旨在从言语产生系统发音信息和中层鉴别性表征这两个方向展开说话人识别与语种识别的研究。本项目拟利用电磁发音仪采集一个以汉语为主体的较大规模的函盖多个语种或方言多个说话人的言语产生系统发音轨迹数据库，并以此为基础研究不同说话人和语种在发音层上的差异并提出新特征。研究基于多个参考说话人及语种的语音到发音逆求解方法来估计普通信道下的发音特征以用来提高识别性能。本项目还拟把图像场景分析中的最新研究热点中层鉴别性图像块思想用于语种识别和说话人识别上以提高系统综合性能。我们将研究中层鉴别性表征在语音上的中层定义，分段，代表单元学习，表征，后端分类等一系列核心问题。本项目不仅为说话人和语种识别提供两种新途径，也为言语产生和副语言信息听觉认知模型带来新观点，具有重要的理论意义与实际价值。

中文关键词： 说话人识别；语种识别；语音产生；中层鉴别性表征；

英文摘要： (限3000 Characters): Speaker recognition and language recognition continue to attract attention and remain as hot research topics in speech processing. Conventional methods mainly focus on information from phonetic, acoustic, and prosodic these three level

英文关键词： speaker recognition；language recognition；speech production；mid-level discriminative tokenization；

成为VIP会员查看完整内容

1

相关内容

说话人识别

说话人识别

多语言语音识别声学模型建模方法最新进展

多语言语音识别声学模型建模方法最新进展

专知会员服务

36+阅读 · 2022年2月7日

【NeurIPS2021】基于预测信息识别输入特征的细粒度神经网络解释

专知会员服务

12+阅读 · 2021年10月6日

多模态视觉语言表征学习研究综述

多模态视觉语言表征学习研究综述

专知会员服务

194+阅读 · 2020年12月3日

神经机器翻译前沿综述

专知会员服务

28+阅读 · 2020年9月9日

【ACM MM2020】跨模态分布匹配的半监督多模态情感识别

【ACM MM2020】跨模态分布匹配的半监督多模态情感识别

专知会员服务

43+阅读 · 2020年9月8日

【硬核课】CMU《多模态机器学习》2020课程，附课件与视频

【硬核课】CMU《多模态机器学习》2020课程，附课件与视频

专知会员服务

138+阅读 · 2020年9月3日

【Google Research】Wavesplit:通过说话者聚类实现端到端的语音分离，Wavesplit: End-to-End Speech Separation by Speaker Clustering

【Google Research】Wavesplit:通过说话者聚类实现端到端的语音分离，Wavesplit: End-to-End Speech Separation by Speaker Clustering

专知会员服务

19+阅读 · 2020年2月26日

语音处理中的深度表示学习综述论文:挑战、最新进展和未来趋势，25页pdf

语音处理中的深度表示学习综述论文:挑战、最新进展和未来趋势，25页pdf

专知会员服务

32+阅读 · 2020年1月2日

【论文推荐】将机器语言模型扩展到人类级别的语言理解，Extending Machine Language Models toward Human-Level Language Understanding

【论文推荐】将机器语言模型扩展到人类级别的语言理解，Extending Machine Language Models toward Human-Level Language Understanding

专知会员服务

18+阅读 · 2019年12月14日

【文献综述】基于端到端深度神经网络的说话人与语言识别综述, 163页ppt,昆山杜克大学李明博士

【文献综述】基于端到端深度神经网络的说话人与语言识别综述, 163页ppt,昆山杜克大学李明博士

专知会员服务

33+阅读 · 2019年9月15日

AAAI2022 预训练中的多模态信息融合与表征探究

AAAI2022 预训练中的多模态信息融合与表征探究

RUC AI Box

3+阅读 · 2022年3月15日

一文带你了解语音信号处理技术

一文带你了解语音信号处理技术

PaperWeekly

9+阅读 · 2022年1月26日

语音合成：模拟最像人类声音的系统

语音合成：模拟最像人类声音的系统

PaperWeekly

2+阅读 · 2021年11月30日

最新综述：跨语言语音合成方法的发展趋势与方向

最新综述：跨语言语音合成方法的发展趋势与方向

PaperWeekly

1+阅读 · 2021年10月8日

基于端到端深度神经网络的说话人与语言识别综述, 163页ppt,[InterSpeech2019]昆山杜克大学李明博士

基于端到端深度神经网络的说话人与语言识别综述, 163页ppt,[InterSpeech2019]昆山杜克大学李明博士

专知

15+阅读 · 2019年9月22日

Interspeech 2019 | 基于多模态对齐的语音情感识别

Interspeech 2019 | 基于多模态对齐的语音情感识别

AI科技评论

23+阅读 · 2019年9月21日

语音关键词检测方法综述【附PPT与视频资料】

语音关键词检测方法综述【附PPT与视频资料】

人工智能前沿讲习班

10+阅读 · 2019年2月2日

图像检索研究进展：浅层、深层特征及特征融合

图像检索研究进展：浅层、深层特征及特征融合

中国计算机学会

122+阅读 · 2018年3月26日

特征工程的特征理解（一）

特征工程的特征理解（一）

机器学习研究会

10+阅读 · 2017年10月23日

一文看懂深度学习在语音合成&增强上的应用

一文看懂深度学习在语音合成&增强上的应用

数盟

11+阅读 · 2017年9月13日

基于发音特征的汉语语音识别分层解码方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于语谱图信息的汉语词汇整体识别和语音增强方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向非平行文本的说话人个性特征转换的关键技术及应用研究

国家自然科学基金

0+阅读 · 2013年12月31日

多语言语音识别声学建模理论和容错识别新方法研究

国家自然科学基金

1+阅读 · 2012年12月31日

情感驱动的人机交互中文本语音情感信息耦合关键技术研究

国家自然科学基金

1+阅读 · 2012年12月31日

融合语音产生机理与统计声学建模的层次化语音合成方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

说话人识别中时变鲁棒的声纹特征研究

国家自然科学基金

2+阅读 · 2012年12月31日

基于多目视觉的形体语言感知与识别研究

国家自然科学基金

2+阅读 · 2011年12月31日

非特定人自然语音情感识别的建模方法研究

国家自然科学基金

1+阅读 · 2011年12月31日

声纹识别中合成语音的鲁棒性研究

国家自然科学基金

1+阅读 · 2009年12月31日

Analyzing the Intensity of Complaints on Social Media

Arxiv

0+阅读 · 2022年4月20日

Investigating Data Variance in Evaluations of Automatic Machine Translation Metrics

Arxiv

0+阅读 · 2022年4月19日

VCoach: A Customizable Visualization and Analysis System for Video-based Running Coaching

Arxiv

0+阅读 · 2022年4月19日

Inference for Cluster Randomized Experiments with Non-ignorable Cluster Sizes

Inference for Cluster Randomized Experiments with Non-ignorable Cluster Sizes

Arxiv

0+阅读 · 2022年4月18日

Mixed Isogeometric Discretizations for Planar Linear Elasticity

Arxiv

0+阅读 · 2022年4月17日

A Contrastive Cross-Channel Data Augmentation Framework for Aspect-based Sentiment Analysis

Arxiv

0+阅读 · 2022年4月16日

Model-assisted complier average treatment effect estimates in randomized experiments with non-compliance and a binary outcome

Arxiv

0+阅读 · 2022年4月16日

A User Study to Evaluate a Web-based Prototype for Smart Home Internet of Things Device Management

Arxiv

0+阅读 · 2022年4月16日

Commonsense Knowledge Base Completion with Structural and Semantic Context

Commonsense Knowledge Base Completion with Structural and Semantic Context

Arxiv

20+阅读 · 2019年12月19日

Self-Driving Cars: A Survey

Self-Driving Cars: A Survey

Arxiv

41+阅读 · 2019年1月14日

阅读: 0 点赞: 0

小贴士

登录享主题订阅及个性化推荐

相关主题

说话人识别

中层鉴别性表征

热门VIP内容

开通专知VIP会员享更多权益服务

《复杂工程系统模型驱动设计决策支持系统：早期设计阶段挑战》最新138页

《日本陆上自卫队2040年作战方式与未来作战研究》最新23页slides

人工智能作为战争武器

《后勤保障》最新23页

相关VIP内容

多语言语音识别声学模型建模方法最新进展

多语言语音识别声学模型建模方法最新进展

专知会员服务

36+阅读 · 2022年2月7日

【NeurIPS2021】基于预测信息识别输入特征的细粒度神经网络解释

专知会员服务

12+阅读 · 2021年10月6日

多模态视觉语言表征学习研究综述

多模态视觉语言表征学习研究综述

专知会员服务

194+阅读 · 2020年12月3日

神经机器翻译前沿综述

专知会员服务

28+阅读 · 2020年9月9日

【ACM MM2020】跨模态分布匹配的半监督多模态情感识别

【ACM MM2020】跨模态分布匹配的半监督多模态情感识别

专知会员服务

43+阅读 · 2020年9月8日

【硬核课】CMU《多模态机器学习》2020课程，附课件与视频

【硬核课】CMU《多模态机器学习》2020课程，附课件与视频

专知会员服务

138+阅读 · 2020年9月3日

【Google Research】Wavesplit:通过说话者聚类实现端到端的语音分离，Wavesplit: End-to-End Speech Separation by Speaker Clustering

【Google Research】Wavesplit:通过说话者聚类实现端到端的语音分离，Wavesplit: End-to-End Speech Separation by Speaker Clustering

专知会员服务

19+阅读 · 2020年2月26日

语音处理中的深度表示学习综述论文:挑战、最新进展和未来趋势，25页pdf

语音处理中的深度表示学习综述论文:挑战、最新进展和未来趋势，25页pdf

专知会员服务

32+阅读 · 2020年1月2日

【论文推荐】将机器语言模型扩展到人类级别的语言理解，Extending Machine Language Models toward Human-Level Language Understanding

【论文推荐】将机器语言模型扩展到人类级别的语言理解，Extending Machine Language Models toward Human-Level Language Understanding

专知会员服务

18+阅读 · 2019年12月14日

【文献综述】基于端到端深度神经网络的说话人与语言识别综述, 163页ppt,昆山杜克大学李明博士

【文献综述】基于端到端深度神经网络的说话人与语言识别综述, 163页ppt,昆山杜克大学李明博士

专知会员服务

33+阅读 · 2019年9月15日

相关资讯

AAAI2022 预训练中的多模态信息融合与表征探究

AAAI2022 预训练中的多模态信息融合与表征探究

RUC AI Box

3+阅读 · 2022年3月15日

一文带你了解语音信号处理技术

一文带你了解语音信号处理技术

PaperWeekly

9+阅读 · 2022年1月26日

语音合成：模拟最像人类声音的系统

语音合成：模拟最像人类声音的系统

PaperWeekly

2+阅读 · 2021年11月30日

最新综述：跨语言语音合成方法的发展趋势与方向

最新综述：跨语言语音合成方法的发展趋势与方向

PaperWeekly

1+阅读 · 2021年10月8日

基于端到端深度神经网络的说话人与语言识别综述, 163页ppt,[InterSpeech2019]昆山杜克大学李明博士

基于端到端深度神经网络的说话人与语言识别综述, 163页ppt,[InterSpeech2019]昆山杜克大学李明博士

专知

15+阅读 · 2019年9月22日

Interspeech 2019 | 基于多模态对齐的语音情感识别

Interspeech 2019 | 基于多模态对齐的语音情感识别

AI科技评论

23+阅读 · 2019年9月21日

语音关键词检测方法综述【附PPT与视频资料】

语音关键词检测方法综述【附PPT与视频资料】

人工智能前沿讲习班

10+阅读 · 2019年2月2日

图像检索研究进展：浅层、深层特征及特征融合

图像检索研究进展：浅层、深层特征及特征融合

中国计算机学会

122+阅读 · 2018年3月26日

特征工程的特征理解（一）

特征工程的特征理解（一）

机器学习研究会

10+阅读 · 2017年10月23日

一文看懂深度学习在语音合成&增强上的应用

一文看懂深度学习在语音合成&增强上的应用

数盟

11+阅读 · 2017年9月13日

相关基金

基于发音特征的汉语语音识别分层解码方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于语谱图信息的汉语词汇整体识别和语音增强方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向非平行文本的说话人个性特征转换的关键技术及应用研究

国家自然科学基金

0+阅读 · 2013年12月31日

多语言语音识别声学建模理论和容错识别新方法研究

国家自然科学基金

1+阅读 · 2012年12月31日

情感驱动的人机交互中文本语音情感信息耦合关键技术研究

国家自然科学基金

1+阅读 · 2012年12月31日

融合语音产生机理与统计声学建模的层次化语音合成方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

说话人识别中时变鲁棒的声纹特征研究

国家自然科学基金

2+阅读 · 2012年12月31日

基于多目视觉的形体语言感知与识别研究

国家自然科学基金

2+阅读 · 2011年12月31日

非特定人自然语音情感识别的建模方法研究

国家自然科学基金

1+阅读 · 2011年12月31日

声纹识别中合成语音的鲁棒性研究

国家自然科学基金

1+阅读 · 2009年12月31日

相关论文

Analyzing the Intensity of Complaints on Social Media

Arxiv

0+阅读 · 2022年4月20日

Investigating Data Variance in Evaluations of Automatic Machine Translation Metrics

Arxiv

0+阅读 · 2022年4月19日

VCoach: A Customizable Visualization and Analysis System for Video-based Running Coaching

Arxiv

0+阅读 · 2022年4月19日

Inference for Cluster Randomized Experiments with Non-ignorable Cluster Sizes

Inference for Cluster Randomized Experiments with Non-ignorable Cluster Sizes

Arxiv

0+阅读 · 2022年4月18日

Mixed Isogeometric Discretizations for Planar Linear Elasticity

Arxiv

0+阅读 · 2022年4月17日

A Contrastive Cross-Channel Data Augmentation Framework for Aspect-based Sentiment Analysis

Arxiv

0+阅读 · 2022年4月16日

Model-assisted complier average treatment effect estimates in randomized experiments with non-compliance and a binary outcome

Arxiv

0+阅读 · 2022年4月16日

A User Study to Evaluate a Web-based Prototype for Smart Home Internet of Things Device Management

Arxiv

0+阅读 · 2022年4月16日

Commonsense Knowledge Base Completion with Structural and Semantic Context

Commonsense Knowledge Base Completion with Structural and Semantic Context

Arxiv

20+阅读 · 2019年12月19日

Self-Driving Cars: A Survey

Self-Driving Cars: A Survey

Arxiv

41+阅读 · 2019年1月14日

微信扫码咨询专知VIP会员