项目名称: 面向高准确率语音转写的用户反馈学习与识别结果优化
项目编号: No.61202209
项目类型: 青年科学基金项目
立项/批准年度: 2013
项目学科: 自动化技术、计算机技术
项目作者: 王向东
作者单位: 中国科学院计算技术研究所
项目金额: 22万元
中文摘要: 近年来,自动语音识别技术取得了长足进展,但面向真实场景的语音转写技术仍然无法满足应用需求。当前出现了一批融合用户反馈的语音识别系统,但这些系统只利用用户反馈信息进行错误修正,高准确率的取得完全依赖于人的操作,无法实现高效的语音转写。针对这一问题,本项目拟研究面向高准确率语音转写的用户反馈学习与识别结果优化方法,研究可融合非确定性反馈的反馈后快速重新识别、基于反馈历史的词汇学习和重复性错误自动修正、基于修正文本的语言模型自适应等关键技术,实现一种利用用户反馈信息不断学习和提高的语音识别系统:用户的每次修正反馈,都会影响当前句的识别结果,与用户修正的字相关联的错误可得到自动修正;同时,系统学习反馈涉及的词汇,调整内部模型,避免相似的错误再次发生。与当前已有的语音识别模型自适应方法相比,本项目研究的方法充分利用了用户反馈中包含的丰富信息,学习更有针对性,对识别性能的提升更为明显。
中文关键词: 语音识别;用户反馈;候选列表;自动纠错;语言模型自适应
英文摘要: In this project, research on methods of user feed-back learning and recognition result refining for speech transcription systems will be conducted based on current work on error correction in speech recognition and computer-assisted speech transcription.
英文关键词: speech recognition;user feedback;alternative list;automatic error correction;language model adaptation