文档级神经机器翻译综述 - 专知VIP

会员服务 ·

7

机器翻译 · 神经机器翻译 · Transformer模型 ·

2024 年 8 月 29 日

文档级神经机器翻译综述

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

机器翻译(Machine Translation, MT)研究旨在构建一个自动转换系统, 将给定源语言序列自动地转换为具有相同语义的目标语言序列. 由于机器翻译广阔的应用场景, 使其成为自然语言理解领域乃至人工智能领域的一个重要的研究方向. 近年来, 端到端的神经机器翻译(Neural Machine Translation, NMT)方法显著超越了统计机器翻译方法, 成为目前机器翻译研究的主流方法. 然而, 神经机器翻译系统通常以句子为翻译单位, 在面向文档的翻译场景中, 将文档中每个句子独立地进行翻译, 会因脱离文档的篇章语境引起一些篇章级的错误, 如词语错翻、句子间不连贯等. 因此将文档级的信息融入到翻译的过程中去解决跨句的篇章级错误是更加自然和合理的做法, 文档级的神经机器翻译(Document-level Neural Machine Translation, DNMT)的目标正是如此, 成为了机器翻译研究的热门方向. 本文调研了近年来在文档级神经机器翻译研究方向的主要工作, 从篇章评测方法、使用的数据集和模型方法等方面系统地对当前研究工作进行了归纳与阐述, 目的是帮助研究者们快速了解文档级神经机器翻译研究现状以及未来的发展和研究方向. 同时在文中也阐述了在文档级神经机器翻译的一些展望, 困难和挑战, 希望能带给研究者们一些启发.

成为VIP会员查看完整内容

13

相关内容

机器翻译

机器翻译，又称为自动翻译，是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。它是计算语言学的一个分支，是人工智能的终极目标之一，具有重要的科学研究价值。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

神经网络加速器架构概述

神经网络加速器架构概述

专知会员服务

37+阅读 · 2022年4月23日

基于RGB-D图像的语义场景补全研究进展综述

基于RGB-D图像的语义场景补全研究进展综述

专知会员服务

29+阅读 · 2021年11月8日

深度对抗视觉生成综述

专知会员服务

56+阅读 · 2021年9月3日

面向自然语言处理的深度学习对抗样本综述

专知会员服务

45+阅读 · 2021年1月18日

神经机器翻译前沿综述

专知会员服务

28+阅读 · 2020年9月9日

「基于通信的多智能体强化学习」进展综述

「基于通信的多智能体强化学习」进展综述

专知

31+阅读 · 2022年11月12日

综述| 当图神经网络遇上强化学习

综述| 当图神经网络遇上强化学习

图与推荐

35+阅读 · 2022年7月1日

多模态视觉语言表征学习研究综述

多模态视觉语言表征学习研究综述

专知

27+阅读 · 2020年12月3日

硬件加速神经网络综述

硬件加速神经网络综述

计算机研究与发展

26+阅读 · 2019年2月1日

机器翻译新时代：Facebook 开源无监督机器翻译模型和大规模训练语料

机器翻译新时代：Facebook 开源无监督机器翻译模型和大规模训练语料

机器学习研究会

12+阅读 · 2017年12月24日

面向人类工作记忆改善的脑电复杂网络信息反馈非线性计算模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

46+阅读 · 2015年12月31日

数据驱动的人体图像语义分割研究

国家自然科学基金

4+阅读 · 2014年12月31日

排序管理的帕累托优化问题研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于融合先验知识的机器学习的多传感器融合研究

国家自然科学基金

16+阅读 · 2013年12月31日

Linear combinations of Gaussian latents in generative models: interpolation and beyond

Arxiv

0+阅读 · 2024年10月4日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

224+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

495+阅读 · 2023年3月31日

Nature Language Reasoning, A Survey

Arxiv

82+阅读 · 2023年3月26日

Data-centric Artificial Intelligence: A Survey

Arxiv

25+阅读 · 2023年3月17日

VIP会员

相关主题

神经机器翻译

Transformer模型

相关VIP内容

神经网络加速器架构概述

神经网络加速器架构概述

专知会员服务

37+阅读 · 2022年4月23日

基于RGB-D图像的语义场景补全研究进展综述

基于RGB-D图像的语义场景补全研究进展综述

专知会员服务

29+阅读 · 2021年11月8日

深度对抗视觉生成综述

专知会员服务

56+阅读 · 2021年9月3日

面向自然语言处理的深度学习对抗样本综述

专知会员服务

45+阅读 · 2021年1月18日

神经机器翻译前沿综述

专知会员服务

28+阅读 · 2020年9月9日

热门VIP内容

开通专知VIP会员享更多权益服务

从代码基础模型到智能体与应用：代码智能的全面综述与实践指南

《北约认知战概念报告》

【MIT博士论文】高效的视觉合成生成模型

美海军放弃星座级转而采用国家安全巡逻舰设计

相关资讯

「基于通信的多智能体强化学习」进展综述

「基于通信的多智能体强化学习」进展综述

专知

31+阅读 · 2022年11月12日

综述| 当图神经网络遇上强化学习

综述| 当图神经网络遇上强化学习

图与推荐

35+阅读 · 2022年7月1日

多模态视觉语言表征学习研究综述

多模态视觉语言表征学习研究综述

专知

27+阅读 · 2020年12月3日

硬件加速神经网络综述

硬件加速神经网络综述

计算机研究与发展

26+阅读 · 2019年2月1日

机器翻译新时代：Facebook 开源无监督机器翻译模型和大规模训练语料

机器翻译新时代：Facebook 开源无监督机器翻译模型和大规模训练语料

机器学习研究会

12+阅读 · 2017年12月24日

相关基金

面向人类工作记忆改善的脑电复杂网络信息反馈非线性计算模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

46+阅读 · 2015年12月31日

数据驱动的人体图像语义分割研究

国家自然科学基金

4+阅读 · 2014年12月31日

排序管理的帕累托优化问题研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于融合先验知识的机器学习的多传感器融合研究

国家自然科学基金

16+阅读 · 2013年12月31日

相关论文

Linear combinations of Gaussian latents in generative models: interpolation and beyond

Arxiv

0+阅读 · 2024年10月4日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

224+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

495+阅读 · 2023年3月31日

Nature Language Reasoning, A Survey

Arxiv

82+阅读 · 2023年3月26日

Data-centric Artificial Intelligence: A Survey

Arxiv

25+阅读 · 2023年3月17日

微信扫码咨询专知VIP会员