【Tom Kocmi博士论文】探索迁移学习在神经机器翻译中的益处，附162页PDF下载 - 专知VIP

会员服务 ·

1

迁移学习 · 神经机器翻译 ·

2020 年 1 月 10 日

【Tom Kocmi博士论文】探索迁移学习在神经机器翻译中的益处，附162页PDF下载

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

随着技术的传播，世界各地的人们比以往任何时候都更加紧密地联系在一起，无缝沟通和理解的需求变得至关重要。根据Simons 2018年的研究，世界上现存的语言有7097种。然而，语料中，大多数成对的语言最多有几百到几千个平行的句子，而且成对的语言数量有限。由于统计机器翻译(SMT)和神经机器翻译(NMT)都是需要大量数据的机器学习方法，因此缺乏数据是训练合适机器翻译(MT)系统的一个严重问题。

Tom Kocmi的博士论文《Exploring Benefits of Transfer Learning in Neural Machine Translation》（《探索迁移学习在神经机器翻译中的益处》）提出相关的迁移学习技术，并提供了详细地分析。论文展示了几种利用基于大量资源语言对训练的模型来提升少量资源情况下的模型训练。在分析过程中，作者发现:

迁移学习同时适用于少量资源和大量资源的语言对，并且比随机初始化训练的性能更好。
迁移学习在神经机器翻译中没有其他领域所知的负面影响，可以作为神经机器翻译实验的初始化方法。
结果表明，在迁移学习中，平行语料库的数量比语言对的相关性更重要。
作者观察到，迁移学习是一种更好的初始化技术，即使两个模型面向的语言没有交集，性能也能得到提升。

除了上述主要的贡献，论文也描述其他几个研究的想法，包括作者对Czech-English平行语料库的贡献（Bojar et al., 2016a）、使用预训练词嵌入的实验（Kocmi and Bojar, 2017c）、使用子词信息的词嵌入（Kocmi and Bojar, 2016）、神经语言识别工具（Kocmi and Bojar, 2017b）。另外，作者还为一个sequence-to-sequence的研究框架Nerual Monkey（Helcl et al., 2018）的实现做了贡献。

博士论文《Exploring Benefits of Transfer Learning in Neural Machine Translation》的内容大致如下：

简介
- 贡献
- 论文结构
背景
- 语言资源
- LanideNN：语言识别工具
- 训练数据
- 机器翻译评价
神经机器翻译
- 词嵌入
- 子词表示
- 神经机器翻译架构
- 神经机器翻译模型设置
- 度量训练过程
迁移学习
- 术语
- 域适应
- 迁移学习
- 冷启动迁移学习
- 冷启动直系迁移
- 冷启动词汇变换
- 热启动迁移学习
- 热启动和冷启动对比
- 相关工作
- 总结
分析
- 负迁移
- 共享语言的位置是否影响迁移学习
- 语言相关性和数据量
- 语言特征和更好的初始化
- 迁移学习分析汇总
- 案例：反翻译迁移学习
总结
- 生态追踪
- 结束语

成为VIP会员查看完整内容

25

相关内容

迁移学习

迁移学习（Transfer Learning）是一种机器学习方法，是把一个领域（即源领域）的知识，迁移到另外一个领域（即目标领域），使得目标领域能够取得更好的学习效果。迁移学习（TL）是机器学习（ML）中的一个研究问题，着重于存储在解决一个问题时获得的知识并将其应用于另一个但相关的问题。例如，在学习识别汽车时获得的知识可以在尝试识别卡车时应用。尽管这两个领域之间的正式联系是有限的，但这一领域的研究与心理学文献关于学习转移的悠久历史有关。从实践的角度来看，为学习新任务而重用或转移先前学习的任务中的信息可能会显着提高强化学习代理的样本效率。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

最新《自然语言处理迁移学习》综述论文，A Survey on Transfer Learning in Natural Language Processing

最新《自然语言处理迁移学习》综述论文，A Survey on Transfer Learning in Natural Language Processing

专知会员服务

139+阅读 · 2020年7月10日

如何写论文？这份《科研论文撰写策略》看下

专知会员服务

147+阅读 · 2020年6月15日

还在修改博士论文？这份《博士论文写作技巧》为你指南

还在修改博士论文？这份《博士论文写作技巧》为你指南

专知会员服务

165+阅读 · 2020年6月9日

多语言神经机器翻译综述论文，34页pdf，A Comprehensive Survey of Multilingual Neural Machine Translation

多语言神经机器翻译综述论文，34页pdf，A Comprehensive Survey of Multilingual Neural Machine Translation

专知会员服务

19+阅读 · 2020年4月25日

【教程】自然语言处理中的迁移学习原理，41 页PPT

【教程】自然语言处理中的迁移学习原理，41 页PPT

专知会员服务

96+阅读 · 2020年2月8日

【Tom Kocmi博士论文】探讨迁移学习在神经机器翻译中的应用，Exploring Benefits of Transfer Learning in Neural Machine Translation

【Tom Kocmi博士论文】探讨迁移学习在神经机器翻译中的应用，Exploring Benefits of Transfer Learning in Neural Machine Translation

专知会员服务

10+阅读 · 2020年1月9日

【剑桥大学】神经机器翻译综述论文，Neural Machine Translation: A Review，附88页pdf

【剑桥大学】神经机器翻译综述论文，Neural Machine Translation: A Review，附88页pdf

专知会员服务

37+阅读 · 2019年12月4日

【ACL 2019 Tutorials】论据挖掘研究进展（Advances in Argument Mining）

【ACL 2019 Tutorials】论据挖掘研究进展（Advances in Argument Mining）

专知会员服务

16+阅读 · 2019年11月18日

【中科院计算所】迁移学习全面综述论文，A Comprehensive Survey on Transfer Learning，27页pdf，171篇参考文献

【中科院计算所】迁移学习全面综述论文，A Comprehensive Survey on Transfer Learning，27页pdf，171篇参考文献

专知会员服务

99+阅读 · 2019年11月11日

【伯克利博士论文】从自然语言中学习（附106页pdf全文下载）

【伯克利博士论文】从自然语言中学习（附106页pdf全文下载）

专知会员服务

51+阅读 · 2019年10月26日

单语言表征如何迁移到多语言去？

单语言表征如何迁移到多语言去？

AI科技评论

5+阅读 · 2019年11月21日

赛尔笔记 | 自然语言处理中的迁移学习(下)

赛尔笔记 | 自然语言处理中的迁移学习(下)

AI科技评论

11+阅读 · 2019年10月21日

ACL 2019 | 多语言BERT的语言表征探索

ACL 2019 | 多语言BERT的语言表征探索

AI科技评论

21+阅读 · 2019年9月6日

NLP领域中的迁移学习现状

NLP领域中的迁移学习现状

AI科技评论

7+阅读 · 2019年9月1日

一文看懂自然语言处理中迁移学习的现状

一文看懂自然语言处理中迁移学习的现状

AI前线

10+阅读 · 2019年8月27日

中文版-BERT-预训练的深度双向Transformer语言模型-详细介绍

中文版-BERT-预训练的深度双向Transformer语言模型-详细介绍

深度学习与NLP

30+阅读 · 2019年3月30日

DeepMind网红博士300页论文出炉：面向NLP的神经迁移学习（附下载）

DeepMind网红博士300页论文出炉：面向NLP的神经迁移学习（附下载）

新智元

10+阅读 · 2019年3月27日

面向自然语言处理的神经网络迁移学习，NLP网红Ruder博士329页论文（附下载）

面向自然语言处理的神经网络迁移学习，NLP网红Ruder博士329页论文（附下载）

专知

18+阅读 · 2019年3月24日

概览迁移学习在NLP领域中的应用

概览迁移学习在NLP领域中的应用

论智

4+阅读 · 2018年7月31日

【迁移学习】简述迁移学习在深度学习中的应用

【迁移学习】简述迁移学习在深度学习中的应用

产业智能官

15+阅读 · 2018年1月9日

Deep Universal Graph Embedding Neural Network

Arxiv

6+阅读 · 2019年9月25日

Language Modeling with Deep Transformers

Arxiv

6+阅读 · 2019年7月11日

Adversarial Transfer Learning

Adversarial Transfer Learning

Arxiv

12+阅读 · 2018年12月6日

Multi-task Deep Reinforcement Learning with PopArt

Multi-task Deep Reinforcement Learning with PopArt

Arxiv

4+阅读 · 2018年9月12日

Transfer Learning with Neural AutoML

Arxiv

5+阅读 · 2018年9月11日

Sockeye: A Toolkit for Neural Machine Translation

Arxiv

7+阅读 · 2018年6月1日

Neural Machine Translation Decoding with Terminology Constraints

Arxiv

5+阅读 · 2018年5月9日

Self-Attention with Relative Position Representations

Arxiv

27+阅读 · 2018年4月12日

Why not be Versatile? Applications of the SGNMT Decoder for Machine Translation

Arxiv

3+阅读 · 2018年3月20日

Unsupervised Neural Machine Translation

Arxiv

6+阅读 · 2018年2月26日

VIP会员

相关主题

神经机器翻译

相关VIP内容

最新《自然语言处理迁移学习》综述论文，A Survey on Transfer Learning in Natural Language Processing

最新《自然语言处理迁移学习》综述论文，A Survey on Transfer Learning in Natural Language Processing

专知会员服务

139+阅读 · 2020年7月10日

如何写论文？这份《科研论文撰写策略》看下

专知会员服务

147+阅读 · 2020年6月15日

还在修改博士论文？这份《博士论文写作技巧》为你指南

还在修改博士论文？这份《博士论文写作技巧》为你指南

专知会员服务

165+阅读 · 2020年6月9日

多语言神经机器翻译综述论文，34页pdf，A Comprehensive Survey of Multilingual Neural Machine Translation

多语言神经机器翻译综述论文，34页pdf，A Comprehensive Survey of Multilingual Neural Machine Translation

专知会员服务

19+阅读 · 2020年4月25日

【教程】自然语言处理中的迁移学习原理，41 页PPT

【教程】自然语言处理中的迁移学习原理，41 页PPT

专知会员服务

96+阅读 · 2020年2月8日

【Tom Kocmi博士论文】探讨迁移学习在神经机器翻译中的应用，Exploring Benefits of Transfer Learning in Neural Machine Translation

【Tom Kocmi博士论文】探讨迁移学习在神经机器翻译中的应用，Exploring Benefits of Transfer Learning in Neural Machine Translation

专知会员服务

10+阅读 · 2020年1月9日

【剑桥大学】神经机器翻译综述论文，Neural Machine Translation: A Review，附88页pdf

【剑桥大学】神经机器翻译综述论文，Neural Machine Translation: A Review，附88页pdf

专知会员服务

37+阅读 · 2019年12月4日

【ACL 2019 Tutorials】论据挖掘研究进展（Advances in Argument Mining）

【ACL 2019 Tutorials】论据挖掘研究进展（Advances in Argument Mining）

专知会员服务

16+阅读 · 2019年11月18日

【中科院计算所】迁移学习全面综述论文，A Comprehensive Survey on Transfer Learning，27页pdf，171篇参考文献

【中科院计算所】迁移学习全面综述论文，A Comprehensive Survey on Transfer Learning，27页pdf，171篇参考文献

专知会员服务

99+阅读 · 2019年11月11日

【伯克利博士论文】从自然语言中学习（附106页pdf全文下载）

【伯克利博士论文】从自然语言中学习（附106页pdf全文下载）

专知会员服务

51+阅读 · 2019年10月26日

热门VIP内容

开通专知VIP会员享更多权益服务

【博士论文】扩展可扩展会话推荐的边界

别想太多：高效 R1 风格大型推理模型综述

【ACMMM2025】EvoVLMA: 进化式视觉-语言模型自适应

智能体网络：用AI智能体编织下一代网络

相关资讯

单语言表征如何迁移到多语言去？

单语言表征如何迁移到多语言去？

AI科技评论

5+阅读 · 2019年11月21日

赛尔笔记 | 自然语言处理中的迁移学习(下)

赛尔笔记 | 自然语言处理中的迁移学习(下)

AI科技评论

11+阅读 · 2019年10月21日

ACL 2019 | 多语言BERT的语言表征探索

ACL 2019 | 多语言BERT的语言表征探索

AI科技评论

21+阅读 · 2019年9月6日

NLP领域中的迁移学习现状

NLP领域中的迁移学习现状

AI科技评论

7+阅读 · 2019年9月1日

一文看懂自然语言处理中迁移学习的现状

一文看懂自然语言处理中迁移学习的现状

AI前线

10+阅读 · 2019年8月27日

中文版-BERT-预训练的深度双向Transformer语言模型-详细介绍

中文版-BERT-预训练的深度双向Transformer语言模型-详细介绍

深度学习与NLP

30+阅读 · 2019年3月30日

DeepMind网红博士300页论文出炉：面向NLP的神经迁移学习（附下载）

DeepMind网红博士300页论文出炉：面向NLP的神经迁移学习（附下载）

新智元

10+阅读 · 2019年3月27日

面向自然语言处理的神经网络迁移学习，NLP网红Ruder博士329页论文（附下载）

面向自然语言处理的神经网络迁移学习，NLP网红Ruder博士329页论文（附下载）

专知

18+阅读 · 2019年3月24日

概览迁移学习在NLP领域中的应用

概览迁移学习在NLP领域中的应用

论智

4+阅读 · 2018年7月31日

【迁移学习】简述迁移学习在深度学习中的应用

【迁移学习】简述迁移学习在深度学习中的应用

产业智能官

15+阅读 · 2018年1月9日

相关论文

Deep Universal Graph Embedding Neural Network

Arxiv

6+阅读 · 2019年9月25日

Language Modeling with Deep Transformers

Arxiv

6+阅读 · 2019年7月11日

Adversarial Transfer Learning

Adversarial Transfer Learning

Arxiv

12+阅读 · 2018年12月6日

Multi-task Deep Reinforcement Learning with PopArt

Multi-task Deep Reinforcement Learning with PopArt

Arxiv

4+阅读 · 2018年9月12日

Transfer Learning with Neural AutoML

Arxiv

5+阅读 · 2018年9月11日

Sockeye: A Toolkit for Neural Machine Translation

Arxiv

7+阅读 · 2018年6月1日

Neural Machine Translation Decoding with Terminology Constraints

Arxiv

5+阅读 · 2018年5月9日

Self-Attention with Relative Position Representations

Arxiv

27+阅读 · 2018年4月12日

Why not be Versatile? Applications of the SGNMT Decoder for Machine Translation

Arxiv

3+阅读 · 2018年3月20日

Unsupervised Neural Machine Translation

Arxiv

6+阅读 · 2018年2月26日

微信扫码咨询专知VIP会员