项目名称: 面向多媒体信息检索的语音处理关键技术研究

项目编号: No.60972132

项目类型: 面上项目

立项/批准年度: 2010

项目学科: 自动化技术、计算机技术

项目作者: 贺前华

作者单位: 华南理工大学

项目金额: 29万元

中文摘要: 多媒体信息已经成为互联网的主体信息之一,目前基于内容的检索技术研究重点是图像、视频及音乐;对语音信息,一般采用语音识别技术将语音转换成文本,然后采用文本检索的方式加以处理。而ASR所得到的转换文本存在识别不准确、集外词、结构信息和非文字信息丢失等多种缺陷。如何直接利用语音信息提高多媒体检索效率和人机交互的友好性没有得到足够的重视。针对这些问题,本课题重点研究1)多媒体中音频分割及分类;2)关键音段确定; 3)说话人信息提取方法及其在信息检索中的应用;4)语音信息和视频信息在多媒体检索中的相互作用方式。 本课题有非常明确的应用前景:多媒体检索。理论上也具有很大的挑战性,研究内容日益得到人们的重视,对加快我国信息产业的发展有重要作用。预期发表学术论文10篇,申报专利1项。

中文关键词: 多媒体信息检索;说话人信息分析;非文字语音信息;说话人改变检测;

英文摘要:

英文关键词: Multimedia Retrieval;Speaker information analysis;Non-Lexical Audio;speaker change detection;

成为VIP会员查看完整内容
0

相关内容

多语言语音识别声学模型建模方法最新进展
专知会员服务
30+阅读 · 2022年2月7日
面向语义搜索的自然语言处理
专知会员服务
58+阅读 · 2021年12月18日
专知会员服务
29+阅读 · 2021年10月11日
专知会员服务
68+阅读 · 2021年5月21日
专知会员服务
14+阅读 · 2021年3月26日
【博士论文】搜索引擎中的实体推荐关键技术研究
专知会员服务
42+阅读 · 2020年12月9日
专知会员服务
188+阅读 · 2020年10月14日
专知会员服务
135+阅读 · 2020年9月6日
一文带你了解语音信号处理技术
PaperWeekly
8+阅读 · 2022年1月26日
多媒体推理与认知 | CNCC2021
CCF多媒体专委会
1+阅读 · 2021年12月16日
Interspeech 2019 | 基于多模态对齐的语音情感识别
AI科技评论
23+阅读 · 2019年9月21日
SFFAI分享 | 连政:端到端语音合成【附PPT与视频资料】
人工智能前沿讲习班
14+阅读 · 2019年6月16日
语音关键词检测方法综述【附PPT与视频资料】
人工智能前沿讲习班
10+阅读 · 2019年2月2日
【深度】多媒体计算国际团队:从单通道感知到跨媒体认知
中国科学院自动化研究所
73+阅读 · 2017年8月14日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月14日
Arxiv
13+阅读 · 2018年4月18日
小贴士
相关VIP内容
多语言语音识别声学模型建模方法最新进展
专知会员服务
30+阅读 · 2022年2月7日
面向语义搜索的自然语言处理
专知会员服务
58+阅读 · 2021年12月18日
专知会员服务
29+阅读 · 2021年10月11日
专知会员服务
68+阅读 · 2021年5月21日
专知会员服务
14+阅读 · 2021年3月26日
【博士论文】搜索引擎中的实体推荐关键技术研究
专知会员服务
42+阅读 · 2020年12月9日
专知会员服务
188+阅读 · 2020年10月14日
专知会员服务
135+阅读 · 2020年9月6日
相关资讯
一文带你了解语音信号处理技术
PaperWeekly
8+阅读 · 2022年1月26日
多媒体推理与认知 | CNCC2021
CCF多媒体专委会
1+阅读 · 2021年12月16日
Interspeech 2019 | 基于多模态对齐的语音情感识别
AI科技评论
23+阅读 · 2019年9月21日
SFFAI分享 | 连政:端到端语音合成【附PPT与视频资料】
人工智能前沿讲习班
14+阅读 · 2019年6月16日
语音关键词检测方法综述【附PPT与视频资料】
人工智能前沿讲习班
10+阅读 · 2019年2月2日
【深度】多媒体计算国际团队:从单通道感知到跨媒体认知
中国科学院自动化研究所
73+阅读 · 2017年8月14日
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员