项目名称: 基于结构建模的语音理解及应用研究

项目编号: No.61300197

项目类型: 青年科学基金项目

立项/批准年度: 2014

项目学科: 自动化技术、计算机技术

项目作者: 张剑

作者单位: 东莞理工学院

项目金额: 20万元

中文摘要: 近年来发展的语音理解是建立在语音识别和自然语言理解之上的新兴研究领域。本项目主要研究基于结构建模的语音理解与摘要技术,以能够帮助人们从语音文档中抽取出隐含的结构信息,更快速准确地理解语音文档,已成为本领域研究热点和前沿。由于语音识别技术的不完善,所生成文本含有不准确之处,对传统的基于文本结构建模是极大的挑战。针对此问题,本项目将在特征提取、模型算法及应用方面,在现有工作基础上进行深入研究:分析深层次语音文档结构,寻找对抽取语音文档结构帮助更大的新特征;应用不同的机器学习算法,提高抽取语音文档结构的性能,并运用抽取的结构信息,改善语音理解与摘要抽取的性能;将新算法应用于演讲语音领域。通过本项目的研究,一方面能够建立更有效的针对深层次语音文档结构建模的新算法,提高抽取语音摘要的性能与效率;另一方面基于结构建模的语音理解为海量语音文档管理与安全提供更好的理论支持与实用途径。

中文关键词: 结构建模;语音文档结构;语音理解;语音摘要;抽取式摘要

英文摘要: Speech Understanding (SU) is a young and under-exploited research field based on Automatic Speech Recognition (ASR) and Natural Language Understanding (NLU). In the proposal, our research work focuses on how to apply structural modeling technology for speech understanding and summarization, which can help users understand speech documents faster and more exactly by hidden structure information extracted from speech documents. More and more researchers take their interests in this topic. Considering that speech recognition result is not reliable, traditional structural modeling algorithms only using transcribed text do not perform well due to recognition errors by speech recognition system. To handle this challenge, we investigate sorts of features extracted from speech signal and transcribed documents and select the best ones to extract the hidden structure information from speech documents. We then propose novel algorithms based on traditional machine learning algorithms for structure extraction process and further using structure information to improve the performance of speech understanding and summariztion task. We will evaluate the proposed algorithms on the lecture conference speech corpus. On one hand, using our proposed algorithms can extract structure information hidden in speech documents more effectiv

英文关键词: structure modeling;speech document structure;speech understanding;speech summarization;extractive summarization

成为VIP会员查看完整内容
1

相关内容

多语言语音识别声学模型建模方法最新进展
专知会员服务
31+阅读 · 2022年2月7日
专知会员服务
27+阅读 · 2021年8月16日
专知会员服务
92+阅读 · 2021年6月23日
专知会员服务
39+阅读 · 2021年6月2日
专知会员服务
51+阅读 · 2021年4月3日
专知会员服务
78+阅读 · 2020年8月4日
一文带你了解语音信号处理技术
PaperWeekly
9+阅读 · 2022年1月26日
语音合成:模拟最像人类声音的系统
PaperWeekly
2+阅读 · 2021年11月30日
面向任务型的对话系统研究进展
专知
0+阅读 · 2021年11月17日
基于规则的建模方法的可解释性及其发展
专知
4+阅读 · 2021年6月23日
基于深度学习的文本生成【附217页PPT下载】
专知
34+阅读 · 2018年11月24日
特征工程的特征理解(一)
机器学习研究会
10+阅读 · 2017年10月23日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
12+阅读 · 2021年10月22日
Hierarchical Graph Capsule Network
Arxiv
20+阅读 · 2020年12月16日
Arxiv
27+阅读 · 2018年4月12日
小贴士
相关VIP内容
多语言语音识别声学模型建模方法最新进展
专知会员服务
31+阅读 · 2022年2月7日
专知会员服务
27+阅读 · 2021年8月16日
专知会员服务
92+阅读 · 2021年6月23日
专知会员服务
39+阅读 · 2021年6月2日
专知会员服务
51+阅读 · 2021年4月3日
专知会员服务
78+阅读 · 2020年8月4日
相关资讯
一文带你了解语音信号处理技术
PaperWeekly
9+阅读 · 2022年1月26日
语音合成:模拟最像人类声音的系统
PaperWeekly
2+阅读 · 2021年11月30日
面向任务型的对话系统研究进展
专知
0+阅读 · 2021年11月17日
基于规则的建模方法的可解释性及其发展
专知
4+阅读 · 2021年6月23日
基于深度学习的文本生成【附217页PPT下载】
专知
34+阅读 · 2018年11月24日
特征工程的特征理解(一)
机器学习研究会
10+阅读 · 2017年10月23日
相关基金
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员