机器翻译(Machine Translation, MT)研究旨在构建一个自动转换系统, 将给定源语言序列自动地转换为具有相同语义的目标语言序列. 由于机器翻译广阔的应用场景, 使其成为自然语言理解领域乃至人工智能领域的一个重要的研究方向. 近年来, 端到端的神经机器翻译(Neural Machine Translation, NMT)方法显著超越了统计机器翻译方法, 成为目前机器翻译研究的主流方法. 然而, 神经机器翻译系统通常以句子为翻译单位, 在面向文档的翻译场景中, 将文档中每个句子独立地进行翻译, 会因脱离文档的篇章语境引起一些篇章级的错误, 如词语错翻、句子间不连贯等. 因此将文档级的信息融入到翻译的过程中去解决跨句的篇章级错误是更加自然和合理的做法, 文档级的神经机器翻译(Document-level Neural Machine Translation, DNMT)的目标正是如此, 成为了机器翻译研究的热门方向. 本文调研了近年来在文档级神经机器翻译研究方向的主要工作, 从篇章评测方法、使用的数据集和模型方法等方面系统地对当前研究工作进行了归纳与阐述, 目的是帮助研究者们快速了解文档级神经机器翻译研究现状以及未来的发展和研究方向. 同时在文中也阐述了在文档级神经机器翻译的一些展望, 困难和挑战, 希望能带给研究者们一些启发.

成为VIP会员查看完整内容
12

相关内容

机器翻译,又称为自动翻译,是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。它是计算语言学的一个分支,是人工智能的终极目标之一,具有重要的科学研究价值。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
情感对话技术综述
专知会员服务
27+阅读 · 4月3日
大规模图神经网络研究综述
专知会员服务
80+阅读 · 2023年8月25日
神经网络加速器架构概述
专知会员服务
35+阅读 · 2022年4月23日
神经结构搜索的研究进展综述
专知会员服务
35+阅读 · 2022年1月12日
基于RGB-D图像的语义场景补全研究进展综述
专知会员服务
28+阅读 · 2021年11月8日
专知会员服务
32+阅读 · 2021年10月8日
专知会员服务
53+阅读 · 2021年9月3日
专知会员服务
61+阅读 · 2021年8月4日
专知会员服务
43+阅读 · 2021年1月18日
专知会员服务
26+阅读 · 2020年9月9日
「基于通信的多智能体强化学习」 进展综述
综述| 当图神经网络遇上强化学习
图与推荐
29+阅读 · 2022年7月1日
时空数据挖掘:综述
专知
24+阅读 · 2022年6月30日
多模态视觉语言表征学习研究综述
专知
27+阅读 · 2020年12月3日
清华大学《高级机器学习》课程
专知
38+阅读 · 2020年7月21日
实体关系抽取方法研究综述
专知
11+阅读 · 2020年7月19日
深度学习与医学图像分析
人工智能前沿讲习班
40+阅读 · 2019年6月8日
硬件加速神经网络综述
计算机研究与发展
26+阅读 · 2019年2月1日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
37+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
15+阅读 · 2013年12月31日
Arxiv
156+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
398+阅读 · 2023年3月31日
Arxiv
66+阅读 · 2023年3月26日
Arxiv
20+阅读 · 2023年3月17日
VIP会员
相关VIP内容
情感对话技术综述
专知会员服务
27+阅读 · 4月3日
大规模图神经网络研究综述
专知会员服务
80+阅读 · 2023年8月25日
神经网络加速器架构概述
专知会员服务
35+阅读 · 2022年4月23日
神经结构搜索的研究进展综述
专知会员服务
35+阅读 · 2022年1月12日
基于RGB-D图像的语义场景补全研究进展综述
专知会员服务
28+阅读 · 2021年11月8日
专知会员服务
32+阅读 · 2021年10月8日
专知会员服务
53+阅读 · 2021年9月3日
专知会员服务
61+阅读 · 2021年8月4日
专知会员服务
43+阅读 · 2021年1月18日
专知会员服务
26+阅读 · 2020年9月9日
相关资讯
「基于通信的多智能体强化学习」 进展综述
综述| 当图神经网络遇上强化学习
图与推荐
29+阅读 · 2022年7月1日
时空数据挖掘:综述
专知
24+阅读 · 2022年6月30日
多模态视觉语言表征学习研究综述
专知
27+阅读 · 2020年12月3日
清华大学《高级机器学习》课程
专知
38+阅读 · 2020年7月21日
实体关系抽取方法研究综述
专知
11+阅读 · 2020年7月19日
深度学习与医学图像分析
人工智能前沿讲习班
40+阅读 · 2019年6月8日
硬件加速神经网络综述
计算机研究与发展
26+阅读 · 2019年2月1日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
37+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
15+阅读 · 2013年12月31日
微信扫码咨询专知VIP会员