【CMU博士论文】面向分布偏移的自然语言处理学习神经模型，148页pdf - 专知VIP

会员服务 ·

5

自然语言处理 · 神经模型 · 分布偏移 · 博士论文 ·

2021 年 9 月 7 日

【CMU博士论文】面向分布偏移的自然语言处理学习神经模型，148页pdf

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

在一个特定的数据集上训练一个强大的神经预测器执行一项任务的主流NLP范式取得了在各种应用上的成功(如:情感分类、基于广度预测的问答或机器翻译)。然而，它建立在数据分布是平稳的假设之上，即。在训练和测试时，数据都是从一个固定的分布中取样的。这种训练方式与我们人类在不断变化的信息流中学习和操作的方式不一致。此外，它不适合于真实世界的用例，在这些用例中，数据分布预计会在模型的生命周期中发生变化。

本文的第一个目标是描述这种偏移在自然语言处理环境中可能采取的不同形式，并提出基准和评价指标来衡量它对当前深度学习体系结构的影响。然后，我们继续采取步骤，以减轻分布转移对NLP模型的影响。为此，我们开发了基于分布鲁棒优化框架的参数化重构方法。从经验上讲，我们证明了这些方法产生了更鲁棒的模型，正如在选择的现实问题上所证明的那样。在本文的第三部分和最后一部分，我们探索了有效地适应现有模型的新领域或任务的方法。我们对这个主题的贡献来自于信息几何学的灵感，获得了一个新的梯度更新规则，缓解了适应过程中灾难性的遗忘问题。

我们从评估开始，因为分布转移特别难以描述和测量，特别是在自然语言方面。这部分是由于数据缺乏规范的度量结构。换句话说，如何有效地衡量两个句子之间的语义相似度还不清楚，因此没有直接的方法来衡量两个样本之间的差异，更不用说两种分布了。因此，作为解决分布偏移的第一步，我们提出了一个新的基准(第3章)和评估指标(第4章)，分别评估域偏移和对抗扰动的鲁棒性。有了这些工具在手，我们开始构建鲁棒的模型，这些模型经过训练，即使在没有关于转移本质的明确信息的情况下，对分布转移也不那么敏感。这是通过利用训练分布中的数据多样性来实现的，以确保在训练数据(子群体)中存在的各种领域上的统一性能。具体来说，我们制定了一个分布鲁棒优化框架的参数化版本，该框架允许训练模型对子群体转移更为稳健(第5章和第6章)。最后，在静态环境中学习从根本上是次优的:我们不能期望我们的模型在每一个可能的未来环境中都表现良好，我们必须能够使它们适应我们遇到的任何新情况。因此，我们研究了一种机制，通过这种机制，我们能够根据新的证据微调训练模型，而不会忘记之前获得的知识(第7章)。

https://www.zhuanzhi.ai/paper/c5e7a9742d6a6313d63c5976499166dc

成为VIP会员查看完整内容

37

相关内容

自然语言处理

自然语言处理

自然语言处理（NLP）是语言学，计算机科学，信息工程和人工智能的一个子领域，与计算机和人类（自然）语言之间的相互作用有关，尤其是如何对计算机进行编程以处理和分析大量自然语言数据。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

深度学习为何泛化好？CMU博士论文《解释深度学习中的泛化性》探究深度学习泛化性的理论基础进展

深度学习为何泛化好？CMU博士论文《解释深度学习中的泛化性》探究深度学习泛化性的理论基础进展

专知会员服务

84+阅读 · 2021年10月22日

【CMU博士论文】通过记忆的元强化学习

【CMU博士论文】通过记忆的元强化学习

专知会员服务

57+阅读 · 2021年10月16日

神经文本生成可用么？斯坦福Abigail博士论文《开放式文本和对话的神经生成》，192页pdf

专知会员服务

26+阅读 · 2021年9月1日

【CMU博士论文】开放世界目标检测与跟踪，168页pdf

【CMU博士论文】开放世界目标检测与跟踪，168页pdf

专知会员服务

60+阅读 · 2021年6月14日

【UMASS博士论文】几何表示学习，162页pdf

专知会员服务

65+阅读 · 2021年4月11日

【纽约大学Martin Arjovsky 博士论文】机器学习的分布外泛化,106页pdf

【纽约大学Martin Arjovsky 博士论文】机器学习的分布外泛化,106页pdf

专知会员服务

61+阅读 · 2021年3月28日

【牛津大学BoYang博士论文】学习重建和分割三维物体，143页pdf

【牛津大学BoYang博士论文】学习重建和分割三维物体，143页pdf

专知会员服务

67+阅读 · 2020年11月9日

【CMU博士论文Wen Sun】强化学习的泛化性与效率，206页pdf

【CMU博士论文Wen Sun】强化学习的泛化性与效率，206页pdf

专知会员服务

93+阅读 · 2020年9月28日

最新《深度持续学习》综述论文，32页pdf

最新《深度持续学习》综述论文，32页pdf

专知会员服务

86+阅读 · 2020年9月6日

【CMU博士论文】信息检索中的神经匹配和重要性学习，163页pdf

【CMU博士论文】信息检索中的神经匹配和重要性学习，163页pdf

专知会员服务

58+阅读 · 2020年7月20日

最新《知识驱动的文本生成》综述论文，44页pdf

最新《知识驱动的文本生成》综述论文，44页pdf

专知

25+阅读 · 2020年10月14日

《文本分类大综述：从浅层到深度学习》最新2020版35页pdf

《文本分类大综述：从浅层到深度学习》最新2020版35页pdf

专知

59+阅读 · 2020年8月6日

【CMU博士论文2019】建立知识感知的自然语言理解系统，附118页论文全文下载

【CMU博士论文2019】建立知识感知的自然语言理解系统，附118页论文全文下载

专知

22+阅读 · 2019年10月23日

【论文笔记】基于文本语料库中分类法学习的综述：问题、资源和最新进展

【论文笔记】基于文本语料库中分类法学习的综述：问题、资源和最新进展

专知

12+阅读 · 2019年10月13日

面向自然语言处理的神经网络迁移学习，NLP网红Ruder博士329页论文（附下载）

面向自然语言处理的神经网络迁移学习，NLP网红Ruder博士329页论文（附下载）

专知

18+阅读 · 2019年3月24日

斯坦福 | 156页PDF讲解【神经网络阅读理解】

斯坦福 | 156页PDF讲解【神经网络阅读理解】

机器学习算法与Python学习

14+阅读 · 2018年12月16日

斯坦福陈丹琦博士论文：神经网络阅读理解与更多【附156页pdf】

斯坦福陈丹琦博士论文：神经网络阅读理解与更多【附156页pdf】

专知

62+阅读 · 2018年12月15日

学界 | 伯克利、OpenAI等提出基于模型的元策略优化强化学习

学界 | 伯克利、OpenAI等提出基于模型的元策略优化强化学习

机器之心

15+阅读 · 2018年10月21日

论文Express | 自然语言十项全能：转化为问答的多任务学习

论文Express | 自然语言十项全能：转化为问答的多任务学习

大数据文摘

6+阅读 · 2018年6月25日

综述 | 一文读懂自然语言处理NLP（附学习资料）

综述 | 一文读懂自然语言处理NLP（附学习资料）

PaperWeekly

9+阅读 · 2017年11月14日

Understanding the Role of Self-Supervised Learning in Out-of-Distribution Detection Task

Arxiv

0+阅读 · 2021年10月26日

Adversarial Robustness through Bias Variance Decomposition: A New Perspective for Federated Learning

Arxiv

0+阅读 · 2021年10月26日

On the Variance of the Adaptive Learning Rate and Beyond

Arxiv

0+阅读 · 2021年10月26日

Domain Adaptation and Multi-Domain Adaptation for Neural Machine Translation: A Survey

Arxiv

9+阅读 · 2021年4月14日

Meta Learning for Causal Direction

Meta Learning for Causal Direction

Arxiv

5+阅读 · 2020年7月6日

A Modern Introduction to Online Learning

A Modern Introduction to Online Learning

Arxiv

21+阅读 · 2019年12月31日

One-Shot Federated Learning

One-Shot Federated Learning

Arxiv

9+阅读 · 2019年3月5日

Sample Efficient Adaptive Text-to-Speech

Arxiv

7+阅读 · 2018年9月27日

Learning to Update for Object Tracking

Arxiv

8+阅读 · 2018年6月19日

Large-Scale Object Discovery and Detector Adaptation from Unlabeled Video

Arxiv

3+阅读 · 2017年12月23日

VIP会员

相关主题

自然语言处理

相关VIP内容

深度学习为何泛化好？CMU博士论文《解释深度学习中的泛化性》探究深度学习泛化性的理论基础进展

深度学习为何泛化好？CMU博士论文《解释深度学习中的泛化性》探究深度学习泛化性的理论基础进展

专知会员服务

84+阅读 · 2021年10月22日

【CMU博士论文】通过记忆的元强化学习

【CMU博士论文】通过记忆的元强化学习

专知会员服务

57+阅读 · 2021年10月16日

神经文本生成可用么？斯坦福Abigail博士论文《开放式文本和对话的神经生成》，192页pdf

专知会员服务

26+阅读 · 2021年9月1日

【CMU博士论文】开放世界目标检测与跟踪，168页pdf

【CMU博士论文】开放世界目标检测与跟踪，168页pdf

专知会员服务

60+阅读 · 2021年6月14日

【UMASS博士论文】几何表示学习，162页pdf

专知会员服务

65+阅读 · 2021年4月11日

【纽约大学Martin Arjovsky 博士论文】机器学习的分布外泛化,106页pdf

【纽约大学Martin Arjovsky 博士论文】机器学习的分布外泛化,106页pdf

专知会员服务

61+阅读 · 2021年3月28日

【牛津大学BoYang博士论文】学习重建和分割三维物体，143页pdf

【牛津大学BoYang博士论文】学习重建和分割三维物体，143页pdf

专知会员服务

67+阅读 · 2020年11月9日

【CMU博士论文Wen Sun】强化学习的泛化性与效率，206页pdf

【CMU博士论文Wen Sun】强化学习的泛化性与效率，206页pdf

专知会员服务

93+阅读 · 2020年9月28日

最新《深度持续学习》综述论文，32页pdf

最新《深度持续学习》综述论文，32页pdf

专知会员服务

86+阅读 · 2020年9月6日

【CMU博士论文】信息检索中的神经匹配和重要性学习，163页pdf

【CMU博士论文】信息检索中的神经匹配和重要性学习，163页pdf

专知会员服务

58+阅读 · 2020年7月20日

热门VIP内容

开通专知VIP会员享更多权益服务

操作系统智能体：基于多模态大模型（MLLM）的通用计算设备智能体综述

《美国太空军系统全生命周期建模、仿真与分析效能提升方案》最新84页报告

【博士论文】推进数据高效的深度学习：非参数 Transformer、主动测试与上下文学习

自主人工智能：未来战争是否将是自主化的？

相关资讯

最新《知识驱动的文本生成》综述论文，44页pdf

最新《知识驱动的文本生成》综述论文，44页pdf

专知

25+阅读 · 2020年10月14日

《文本分类大综述：从浅层到深度学习》最新2020版35页pdf

《文本分类大综述：从浅层到深度学习》最新2020版35页pdf

专知

59+阅读 · 2020年8月6日

【CMU博士论文2019】建立知识感知的自然语言理解系统，附118页论文全文下载

【CMU博士论文2019】建立知识感知的自然语言理解系统，附118页论文全文下载

专知

22+阅读 · 2019年10月23日

【论文笔记】基于文本语料库中分类法学习的综述：问题、资源和最新进展

【论文笔记】基于文本语料库中分类法学习的综述：问题、资源和最新进展

专知

12+阅读 · 2019年10月13日

面向自然语言处理的神经网络迁移学习，NLP网红Ruder博士329页论文（附下载）

面向自然语言处理的神经网络迁移学习，NLP网红Ruder博士329页论文（附下载）

专知

18+阅读 · 2019年3月24日

斯坦福 | 156页PDF讲解【神经网络阅读理解】

斯坦福 | 156页PDF讲解【神经网络阅读理解】

机器学习算法与Python学习

14+阅读 · 2018年12月16日

斯坦福陈丹琦博士论文：神经网络阅读理解与更多【附156页pdf】

斯坦福陈丹琦博士论文：神经网络阅读理解与更多【附156页pdf】

专知

62+阅读 · 2018年12月15日

学界 | 伯克利、OpenAI等提出基于模型的元策略优化强化学习

学界 | 伯克利、OpenAI等提出基于模型的元策略优化强化学习

机器之心

15+阅读 · 2018年10月21日

论文Express | 自然语言十项全能：转化为问答的多任务学习

论文Express | 自然语言十项全能：转化为问答的多任务学习

大数据文摘

6+阅读 · 2018年6月25日

综述 | 一文读懂自然语言处理NLP（附学习资料）

综述 | 一文读懂自然语言处理NLP（附学习资料）

PaperWeekly

9+阅读 · 2017年11月14日

相关论文

Understanding the Role of Self-Supervised Learning in Out-of-Distribution Detection Task

Arxiv

0+阅读 · 2021年10月26日

Adversarial Robustness through Bias Variance Decomposition: A New Perspective for Federated Learning

Arxiv

0+阅读 · 2021年10月26日

On the Variance of the Adaptive Learning Rate and Beyond

Arxiv

0+阅读 · 2021年10月26日

Domain Adaptation and Multi-Domain Adaptation for Neural Machine Translation: A Survey

Arxiv

9+阅读 · 2021年4月14日

Meta Learning for Causal Direction

Meta Learning for Causal Direction

Arxiv

5+阅读 · 2020年7月6日

A Modern Introduction to Online Learning

A Modern Introduction to Online Learning

Arxiv

21+阅读 · 2019年12月31日

One-Shot Federated Learning

One-Shot Federated Learning

Arxiv

9+阅读 · 2019年3月5日

Sample Efficient Adaptive Text-to-Speech

Arxiv

7+阅读 · 2018年9月27日

Learning to Update for Object Tracking

Arxiv

8+阅读 · 2018年6月19日

Large-Scale Object Discovery and Detector Adaptation from Unlabeled Video

Arxiv

3+阅读 · 2017年12月23日

微信扫码咨询专知VIP会员