【CMU博士论文】缓解负迁移提高迁移学习的泛化和效率，201页pdf

2022 年 4 月 19 日 专知

传统的机器学习范式在单个任务上训练特定任务模型，已经在许多领域(如计算机视觉和自然语言处理)取得了最先进的性能。为了使机器学习模型具有更广泛的适用性，迁移学习旨在适应从源任务中学习到的知识，以提高在其他目标任务中的表现。然而，现有的迁移学习范式还有待进一步研究，因此我们对其潜在的局限性、潜在的机制以及实现更智能迁移的解决方案的认识有限。特别是，当知识从一个不太相关的来源转移时，可能会对目标性能造成负面影响，这种现象称为负转移。然而，负迁移的原因尚不明确，负迁移如何影响模型的泛化和样本效率也不清楚。在这篇论文中，我们的目标是彻底描述和解决机器学习模型中的负迁移，我们仔细研究了流行的视觉和自然语言处理设置中的负迁移，收集了其原因的见解，并提出了提高泛化和样本效率的解决方案。本文由三个部分组成。第一部分对当前迁移学习模型中的负迁移现象进行了系统的分析。我们在领域适应和多语言自然语言处理模型中正式描述了其条件，并证明任务冲突是负迁移的一个关键因素。在第二部分，我们提出了各种对齐方法，通过更好的对齐表示和梯度解决上述任务冲突，增强可转移模型的泛化。最后，在第三部分，我们探索了有效样本迁移学习算法，使用较少的训练和/或校准数据来缓解负迁移。本文的主要贡献包括对迁移学习中的负迁移问题提出了新的见解，提出了一系列实用的方法和算法，提高了模型的泛化和效率。

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“NT201” 就可以获取《【CMU博士论文】缓解负迁移提高迁移学习的泛化和效率，201页pdf》专知下载链接

专知，专业可信的人工智能知识分发 ，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取70000+AI(AI与军事、医药、公安等)主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取70000+AI主题知识资料

登录查看更多

相关内容

博士论文

关注 118

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下，选择自己能够把握和驾驭的潜在的研究方向，开辟新的研究领域。由此可见，这就对作者提出了较高要求，它要求作者必须在本学科的专业领域具备大量的理论知识，并对所学专业的理论知识有相当深入的理解和思考，同时还要具有相当水平的独立科学研究能力，能够为在学科领域提出独创性的见解和有价值的科研成果。因而，较之学士论文、硕士论文，博士论文具有更高的学术价值，对学科的发展具有重要的推动作用。

《实现稳健和弹性机器学习》243页CMU博士论文

专知会员服务

35+阅读 · 2022年5月12日

【ETH博士论文】贝叶斯深度学习，241页pdf

专知会员服务

130+阅读 · 2022年1月16日

【CMU博士论文】通过记忆的元强化学习

专知会员服务

57+阅读 · 2021年10月16日

【CMU博士论文】面向分布偏移的自然语言处理学习神经模型，148页pdf

专知会员服务

37+阅读 · 2021年9月7日