项目名称: 基于深度学习的机器译文质量估计方法研究

项目编号: No.61462044

项目类型: 地区科学基金项目

立项/批准年度: 2015

项目学科: 计算机科学学科

项目作者: 李茂西

作者单位: 江西师范大学

项目金额: 46万元

中文摘要: 作为一种新的译文自动评价方法,机器译文质量估计不仅能一定程度上替代传统方法自动评价译文质量,而且能提供一种全新的统计翻译系统特征权重优化方式。针对目前机器译文质量估计中特征提取严重依赖语言学分析、算法复杂度高、译文质量估计效果不够理想且这些严重制约着其在统计翻译系统自训练中的应用等不足,本项目将在以下方面进行深入的研究和探索:(1)研究新的机器译文质量估计模型,通过建立基于递归神经网络的机器译文逐层结构化表示和基于soft-max回归的译文质量估计模型,提高估计的效果。(2)不仅研究英语译文的质量估计方法,而且通过标注一定规模的汉语译文质量语料并结合汉语译文分词特点,对汉语译文的质量估计方法展开研究。(3)探索无需开发集的统计翻译系统自训练方法,结合解码时的知识和减少特征权重优化的迭代次数,将新的译文质量估计方法应用于翻译系统自训练中。最终建立机器译文质量估计的新框架,推动机器翻译的发展。

中文关键词: 统计机器翻译;机器译文质量估计;统计翻译系统自训练;递归神经网络;soft-max回归

英文摘要: As a new method for automatic evaluation of machine translation, quality estimation of machine translation not only can replace the traditional methods on automatically evaluating the translation quality to some extent, but also can provide a new weight optimization mode for statistical translation system. However, there exist some shortcomings in nowadays research on quality estimation of machine translation, such as it depend heavily on linguistic analysis and algorithm complexity is high in feature extraction, as well as its performance is not satisfactory, and all of which restricts severely its application in self-training of statistical translation system etc. Thus, this project will investigate and delve deeply in the following areas: (1) study a new model to quality estimation of machine translation, establish a layer by layer structured representation of machine translation based on recursive neural network and a translation quality estimated model based on soft-max regression to improve the effect of quality estimation. (2) not only investigate the approach of quality estimation for English translation, but also investigate the approach for Chinese translation by annotating a certain amount of translation quality of Chinese translation and combining the characteristics of Chinese word segmentation in Chinese translation.(3)investigate the self-training issue of statistical translation system without development set, achieve the optimization algorithm of feature weights by integrating the decoding knowledge of machine translation system and reducing the iteration times in feature weights optimization. Finally, we will establish a new framework for quality estimation of machine translation, which will promote the development of research on machine translation.

英文关键词: Statistical machine translation;Quality estimation of machine translation;Self-training of statistical translation system;Recursive neural network;Soft-max regression

成为VIP会员查看完整内容
3

相关内容

专知会员服务
82+阅读 · 2021年10月15日
专知会员服务
57+阅读 · 2021年10月12日
专知会员服务
88+阅读 · 2021年9月4日
专知会员服务
48+阅读 · 2021年8月28日
专知会员服务
40+阅读 · 2021年5月30日
专知会员服务
31+阅读 · 2021年1月9日
基于深度学习的数据融合方法研究综述
专知会员服务
139+阅读 · 2020年12月10日
【CCL2020】基于深度学习的实体关系抽取研究综述
专知会员服务
53+阅读 · 2020年11月4日
[综述]基于深度学习的开放领域对话系统研究综述
专知会员服务
80+阅读 · 2019年10月12日
「机器翻译评测研究」最新2022综述
专知
0+阅读 · 2022年3月13日
基于深度学习的交互式问答研究综述
专知
0+阅读 · 2021年11月30日
ACL杰出论文+NAACL最佳论文,腾讯AI Lab解读两项NLP成果
腾讯AI实验室
0+阅读 · 2021年8月5日
基于编辑方法的文本生成(上)
哈工大SCIR
0+阅读 · 2021年6月30日
基于深度学习的数据融合方法研究综述
专知
31+阅读 · 2020年12月10日
基于深度学习的文本生成【附217页PPT下载】
专知
35+阅读 · 2018年11月24日
赛尔原创 | 教聊天机器人进行多轮对话
哈工大SCIR
18+阅读 · 2017年9月18日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月18日
小贴士
相关VIP内容
专知会员服务
82+阅读 · 2021年10月15日
专知会员服务
57+阅读 · 2021年10月12日
专知会员服务
88+阅读 · 2021年9月4日
专知会员服务
48+阅读 · 2021年8月28日
专知会员服务
40+阅读 · 2021年5月30日
专知会员服务
31+阅读 · 2021年1月9日
基于深度学习的数据融合方法研究综述
专知会员服务
139+阅读 · 2020年12月10日
【CCL2020】基于深度学习的实体关系抽取研究综述
专知会员服务
53+阅读 · 2020年11月4日
[综述]基于深度学习的开放领域对话系统研究综述
专知会员服务
80+阅读 · 2019年10月12日
相关资讯
「机器翻译评测研究」最新2022综述
专知
0+阅读 · 2022年3月13日
基于深度学习的交互式问答研究综述
专知
0+阅读 · 2021年11月30日
ACL杰出论文+NAACL最佳论文,腾讯AI Lab解读两项NLP成果
腾讯AI实验室
0+阅读 · 2021年8月5日
基于编辑方法的文本生成(上)
哈工大SCIR
0+阅读 · 2021年6月30日
基于深度学习的数据融合方法研究综述
专知
31+阅读 · 2020年12月10日
基于深度学习的文本生成【附217页PPT下载】
专知
35+阅读 · 2018年11月24日
赛尔原创 | 教聊天机器人进行多轮对话
哈工大SCIR
18+阅读 · 2017年9月18日
相关基金
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员