项目名称: 基于树的句法翻译模型关键技术研究

项目编号: No.61272376

项目类型: 面上项目

立项/批准年度: 2013

项目学科: 自动化技术、计算机技术

项目作者: 朱靖波

作者单位: 东北大学

项目金额: 81万元

中文摘要: 统计机器翻译核心思想是给每个潜在的翻译结果都赋予一定的概率,并选择概率最大的翻译作为最终的翻译结果。统计机器翻译的研究和系统开发已经成为自然语言处理乃至整个人工智能领域的核心问题之一,已经被广泛地应用在在线翻译和受限领域的机器辅助翻译中。本申请课题重点研究基于树的句法翻译模型(包括树到串和树到树模型)的一些关键问题,目的更好利用源语句法结构来改善句法翻译规则抽取和解码搜索技术,最终改善翻译性能。主要研究内容涉及到句法翻译规则抽取、模型训练、特征权重优化、解码搜索和目标语句法结构评价等关键技术,最后计划将集成相关研究成果到实验室研制的开源统计机器翻译系统NiuTrans中,与国内外同行们共享相关研究成果。

中文关键词: 机器翻译;句法分析;语义分析;机器学习;自然语言处理

英文摘要: Statistical machine translation (SMT) aims to assign each candidate translation a probability, and outputs the best translation with maximum probability. Currently SMT topics become one of key issues of the fields of natural language processing and even artificial intelligence. Also SMT techniques have been widely used for online translation and domain-limited aided translation applications. In this proposal, we mainly focus on some key issues of tree-based syntax translation models including tree-to-string and tree-to-tree models. Our goal is to learn better knowledge from source parse trees to help syntactic rule extraction and decoding techniques, which in turn improves machine translation performance. The main topics we study in this proposal involve syntactic translation rule extraction, model training, weight tuning, decoding and target tree structure evaluation etc. Finally, we will integrate these techniques into the NiuTrans that is an open-source SMT platform developed our group, and release the NiuTrans to SMT community.

英文关键词: Machine translation;syntactic parsing;semantic parsing;machine learning;natural language processing

成为VIP会员查看完整内容
0

相关内容

机器翻译,又称为自动翻译,是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。它是计算语言学的一个分支,是人工智能的终极目标之一,具有重要的科学研究价值。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
多语言语音识别声学模型建模方法最新进展
专知会员服务
32+阅读 · 2022年2月7日
EMNLP 2021 | 学习改写非自回归机器翻译的翻译结果
专知会员服务
14+阅读 · 2021年12月25日
专知会员服务
28+阅读 · 2021年9月11日
神经问题生成前沿综述
专知会员服务
15+阅读 · 2021年6月5日
专知会员服务
49+阅读 · 2020年10月21日
专知会员服务
26+阅读 · 2020年9月9日
实体关系抽取方法研究综述
专知会员服务
176+阅读 · 2020年7月19日
注意力机制模型最新综述
专知会员服务
264+阅读 · 2019年10月20日
[综述]基于深度学习的开放领域对话系统研究综述
专知会员服务
78+阅读 · 2019年10月12日
几种句子表示方法的比较
AINLP
15+阅读 · 2019年9月21日
一文读懂依存句法分析
AINLP
16+阅读 · 2019年4月28日
别说还不懂依存句法分析
人工智能头条
23+阅读 · 2019年4月8日
基于深度学习的文本生成【附217页PPT下载】
专知
35+阅读 · 2018年11月24日
一种关键字提取新方法
1号机器人网
21+阅读 · 2018年11月15日
论文动态 | 基于知识图谱的问答系统关键技术研究 #01
开放知识图谱
16+阅读 · 2017年8月3日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
7+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月19日
小贴士
相关VIP内容
多语言语音识别声学模型建模方法最新进展
专知会员服务
32+阅读 · 2022年2月7日
EMNLP 2021 | 学习改写非自回归机器翻译的翻译结果
专知会员服务
14+阅读 · 2021年12月25日
专知会员服务
28+阅读 · 2021年9月11日
神经问题生成前沿综述
专知会员服务
15+阅读 · 2021年6月5日
专知会员服务
49+阅读 · 2020年10月21日
专知会员服务
26+阅读 · 2020年9月9日
实体关系抽取方法研究综述
专知会员服务
176+阅读 · 2020年7月19日
注意力机制模型最新综述
专知会员服务
264+阅读 · 2019年10月20日
[综述]基于深度学习的开放领域对话系统研究综述
专知会员服务
78+阅读 · 2019年10月12日
相关资讯
几种句子表示方法的比较
AINLP
15+阅读 · 2019年9月21日
一文读懂依存句法分析
AINLP
16+阅读 · 2019年4月28日
别说还不懂依存句法分析
人工智能头条
23+阅读 · 2019年4月8日
基于深度学习的文本生成【附217页PPT下载】
专知
35+阅读 · 2018年11月24日
一种关键字提取新方法
1号机器人网
21+阅读 · 2018年11月15日
论文动态 | 基于知识图谱的问答系统关键技术研究 #01
开放知识图谱
16+阅读 · 2017年8月3日
相关基金
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
7+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员