题目: Exploring Benefits of Transfer Learning in Neural Machine Translation

摘要: 众所周知,神经机器翻译需要大量的并行训练语句,这通常会妨碍它在低资源语言对上的优势。本文探讨了跨语言迁移学习在神经网络中的应用,以解决资源匮乏的问题。我们提出了几种转移学习方法来重用预先训练在高资源语言对上的模型。我们特别注意技术的简单性。我们研究了两种情形:(a)当我们重用高资源模型而不事先修改其训练过程时;(b)当我们可以预先准备第一阶段的高资源模型用于转移学习时。对于前一个场景,我们通过重用其他研究人员训练的模型,提出了一种概念证明方法。在后一种情况下,我们提出了一种在翻译性能上得到更大改进的方法。除了提出的技术外,我们还着重于对迁移学习技术进行深入的分析,并试图对迁移学习的改进有所启发。我们展示了我们的技术如何解决低资源语言的特定问题,甚至在高资源转移学习中也是适用的。我们通过研究转移学习在各种情况下的潜在缺陷和行为,例如,在人为损坏的训练语料库下,或者在固定的模型部分下。

作者简介: Tom Kocmi,查尔斯特大学,数学与物理学院,形式与应用语言学研究所博士,他的主要研究方向是基于神经网络的机器翻译。个人主页:https://ufal.mff.cuni.cz/tom-kocmi

成为VIP会员查看完整内容
9

相关内容

“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【Google】无监督机器翻译,Unsupervised Machine Translation
专知会员服务
35+阅读 · 2020年3月3日
【CMU】机器学习导论课程(Introduction to Machine Learning)
专知会员服务
59+阅读 · 2019年8月26日
赛尔笔记 | 自然语言处理中的迁移学习(上)
哈工大SCIR
16+阅读 · 2019年10月17日
NLP领域中的迁移学习现状
AI科技评论
7+阅读 · 2019年9月1日
一文看懂自然语言处理中迁移学习的现状
AI前线
10+阅读 · 2019年8月27日
预训练模型迁移学习
极市平台
11+阅读 · 2018年11月6日
【迁移学习】简述迁移学习在深度学习中的应用
产业智能官
15+阅读 · 2018年1月9日
迁移学习在深度学习中的应用
专知
23+阅读 · 2017年12月24日
【回顾】迁移学习的发展和现状
AI研习社
8+阅读 · 2017年11月17日
Arxiv
17+阅读 · 2019年3月28日
Arxiv
3+阅读 · 2018年6月1日
Arxiv
6+阅读 · 2018年2月28日
Arxiv
6+阅读 · 2018年2月26日
VIP会员
相关VIP内容
【Google】无监督机器翻译,Unsupervised Machine Translation
专知会员服务
35+阅读 · 2020年3月3日
【CMU】机器学习导论课程(Introduction to Machine Learning)
专知会员服务
59+阅读 · 2019年8月26日
相关资讯
赛尔笔记 | 自然语言处理中的迁移学习(上)
哈工大SCIR
16+阅读 · 2019年10月17日
NLP领域中的迁移学习现状
AI科技评论
7+阅读 · 2019年9月1日
一文看懂自然语言处理中迁移学习的现状
AI前线
10+阅读 · 2019年8月27日
预训练模型迁移学习
极市平台
11+阅读 · 2018年11月6日
【迁移学习】简述迁移学习在深度学习中的应用
产业智能官
15+阅读 · 2018年1月9日
迁移学习在深度学习中的应用
专知
23+阅读 · 2017年12月24日
【回顾】迁移学习的发展和现状
AI研习社
8+阅读 · 2017年11月17日
微信扫码咨询专知VIP会员