NLP数据增广不故障！清华大学提出FlipDA，轻松解决小样本任务｜ACL 2022

会员服务 ·

NLP数据增广不故障！清华大学提出FlipDA，轻松解决小样本任务｜ACL 2022

2022 年 4 月 9 日 新智元

新智元报道

作者：zhoujing zhengyanan

编辑：好困

【新智元导读】数据增广是通过自动生成新的训练数据来提升模型性能的方法，而现有方法多基于简单问题设置。然而，在极限问题场景下，这些方法会全部失效。

针对数据增广方法在困难任务（小样本自然语言理解任务）以及更强的基线模型（超过1亿参数量的大规模预训练模型）条件下的「故障模式（Failure Modes）」问题。

清华大学的团队提出了一个全新的方法——「FlipDA: Effective and Robust Data Augmentation for Few-Shot Learning」，不仅实现了小样本学习性能和鲁棒性的提升，同时还能有效避免「故障模式」的发生。

目前，该工作已被ACL2022主会接收。

论文地址：https://arxiv.org/abs/2108.06332

项目地址：https://github.com/zhouj8553/FlipDA

小样本学习数据增广

数据增广需求：有效性和鲁棒性

小样本学习设置下，数据增广主要有两方面关键需求：有效性和鲁棒性。

有效性强调数据增广方法应该至少在某些任务上有大幅提升；鲁棒性则要求数据增广方法不会在任何情况下陷入「故障模式 (Failure Modes)」，即因为某些微小条件变化或者扰动造成的性能大幅度下降。

有效性：手动数据增广可以大幅提升模型性能

我们首先通过手动数据增广，分别构造出了，改变数据标签和保持数据标签两种不同的增广样本。数据增广后的小样本学习性能结果如表格所示。

结果表明：改变数据标签的增广样本可以在某些任务上带来近10个点的提升，而保持数据标签的增广样本只能带来少量提升。

这个手动增广结果给我们带来启发，构造改变标签的增广数据对于提升性能是至关重要的。

鲁棒性: 什么导致了故障模式？

通过观察已有增广方法的失败样例我们发现：增删词以及改变关键词会改变数据标签，导致了增广数据和标签对的不一致。

从而让使用EDA方法增广数据后性能发生了显著下降，结果如下表所示。

我们进一步尝试修正上述问题增广数据：

（1）将错误标签的数据样本替换为原始样本；

（2）改变错误的标签。修正增广数据后的结果如下表格所示，结果表明通过删除错误样本和纠正样本标签都可以有效矫正上述故障模式，大幅提升小样本学习性能。

FlipDA: 自动标签反转数据增广

基于上述观察和实验结果，我们提出了FlipDA，一种自动进行标签反转的数据增广方法。该方法整体基于self-training架构，总共包含如下4个步骤：

1. 使用原始数据训练一个分类器。

2. 使用T5模型生成改变样本和保持样本标签的增广样本。

先将样本中的句子进行mask操作，然后使用prompt将句子进行连接。对于不同的标签，我们会填入不同的标签，然后让T5模型自动补全被mask掉的句子，从而生成保持标签和翻转标签的不同样本。下图（a）。

3. 使用分类器为每个类别选择最可能的样本。

先用分类器给生成的候选样本打标，然后对于每个标签选择可能性最大的样本。下图（b）。

4. 使用原始数据样本和新增广数据样本混合重新训练分类器。

FlipDA方法示意图

实验结果

我们在SuperGLUE的8个数据集上进行了实验，其中涵盖了共指消歧、因果推断、文本蕴含、词义消歧、问答等较为困难的自然语言理解任务。

我们分别在两个大规模预训练模型：DeBERTa-v2-xxlarge和ALBERT-xxlarge-v2上进行了实验。

实验结果表明：FlipDA相较于诸多基准方法有显著优势，FlipDA在大多数任务上获得更显著的性能提升(Avg.)，同时几乎未发生性能下降(MD, max drop)。

此外，我们基于RTE数据集对不同类型的增广样本进行案例分析。

结果表明：FlipDA在四种不同类型的增广条件下生成的样本自然可读，且信息更加准确。

总结

FlipDA强调并且有效解决了小样本自然语言理解任务上，数据增广的有效性和鲁棒性问题。通过自动化的标签反转数据增广，FlipDA进一步提升小样本泛化性能，进而实现了更大幅度更稳健的性能提升。

此外，从理论上进一步理解为什么，以及如何在现有数据点附近生成标签翻转数据提高泛化能力将是至关重要的；增加增强数据生成的多样性和质量也是一个重要的长期目标。

参考资料：

https://arxiv.org/abs/2108.06332

登录查看更多

相关内容

数据增广

关注 0

【CVPR2022】基于密集学习的半监督目标检测

专知会员服务

20+阅读 · 2022年4月19日

【AAAI 2022】基于数据分布生成的可预测概念漂移适应

专知会员服务

34+阅读 · 2022年1月12日

【KDD2021】知识增强领域自适应的少样本关系分类

专知会员服务

38+阅读 · 2021年9月15日

[ICML2021]KD3A: 一种满足隐私保护要求的去中心化无监督域适应范式

专知会员服务

16+阅读 · 2021年7月20日

【ICML2021】满足隐私保护要求的去中心化无监督域适应范式

专知会员服务

21+阅读 · 2021年7月14日

【CVPR2021】密集对比学习的自监督视觉预训练

专知会员服务

39+阅读 · 2021年5月16日

【EMNLP 2020】融合自训练和自监督方法的无监督文本顺滑研究

专知会员服务

24+阅读 · 2020年10月18日

【EMNLP2020】开放领域对话的数据增广的方法：“对话蒸馏”

专知会员服务

30+阅读 · 2020年9月29日

【CVPR2020-Oral】无监督域内自适应语义分割，Unsupervised Intra-domain Adaptation

专知会员服务

71+阅读 · 2020年4月20日

【CVPR2020-Facebook AI】单样本自适应域脸生成，One-Shot Domain Adaptation

专知会员服务

29+阅读 · 2020年4月6日

ACL’22 | 为大模型定制的数据增强方法FlipDA，屠榜六大NLU 数据集！

夕小瑶的卖萌屋

1+阅读 · 2022年4月13日

ACL 2022 | 清华大学、DeepMind等指出现有小样本学习方法并不稳定有效，提出评价框架

PaperWeekly

1+阅读 · 2022年4月2日

ACL2022 | 清华大学、DeepMind等指出现有小样本学习方法并不稳定有效，提出评价框架

机器之心

1+阅读 · 2022年4月1日

达摩院文档级关系抽取新SOTA和零样本关系抽取新任务

PaperWeekly

2+阅读 · 2022年3月31日

有效且稳健的数据增强小样本学习 | 论文荐读

学术头条

6+阅读 · 2022年3月25日

WWW2022 | 迷途知返：分布迁移下的图神经网络自训练方法

专知

0+阅读 · 2022年2月19日

AllenAI | 用GPT-3帮助增建数据，NLI任务直接提升十个点！？

夕小瑶的卖萌屋

0+阅读 · 2022年1月19日

哈工大｜NLP数据增强方法？我有15种

哈工大SCIR

1+阅读 · 2021年10月13日

赛尔原创@ACL 2021 | 基于一致性正则的跨语言微调方法

哈工大SCIR

0+阅读 · 2021年6月22日

赛尔原创 | ACL 2019 机器阅读理解中不可答问题的数据增广

哈工大SCIR

15+阅读 · 2019年6月21日

面向大规模动态异构网络的支持多用户并发任务的物联网应用构建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

基于潜在语义对偶空间的新词翻译自动识别方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

大规模分布式系统中服务失效的自动诊断方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

机器翻译中大规模异类特征的迁移学习

国家自然科学基金

2+阅读 · 2013年12月31日

服务过程中分类数据的监控及诊断方法的研究

国家自然科学基金

0+阅读 · 2012年12月31日

规则驱动的自适应多代理系统研究

国家自然科学基金

3+阅读 · 2012年12月31日

舰船声学故障识别中的样本扩容机理与容量控制研究

国家自然科学基金

0+阅读 · 2012年12月31日

面向开放式网络的动态博弈访问控制模型与方法

国家自然科学基金

0+阅读 · 2012年12月31日

基于跨域迁移学习的网络视频检索技术研究

国家自然科学基金

0+阅读 · 2011年12月31日

ELEVATER: A Benchmark and Toolkit for Evaluating Language-Augmented Visual Models

Arxiv

0+阅读 · 2022年4月20日

Unsupervised Contrastive Domain Adaptation for Semantic Segmentation

Arxiv

0+阅读 · 2022年4月18日

A Study on Prompt-based Few-Shot Learning Methods for Belief State Tracking in Task-oriented Dialog Systems

Arxiv

0+阅读 · 2022年4月18日

Deep Learning for UAV-based Object Detection and Tracking: A Survey

Arxiv

64+阅读 · 2021年10月25日

Cross-Domain Adaptive Clustering for Semi-Supervised Domain Adaptation

Arxiv

19+阅读 · 2021年4月19日

Open Domain Generalization with Domain-Augmented Meta-Learning

Arxiv

21+阅读 · 2021年4月8日

Adaptive Methods for Real-World Domain Generalization

Arxiv

13+阅读 · 2021年3月29日

Generalizing to Unseen Domains: A Survey on Domain Generalization

Arxiv

30+阅读 · 2021年3月10日

AdarGCN: Adaptive Aggregation GCN for Few-Shot Learning

Arxiv

64+阅读 · 2020年2月28日

Few-Shot Knowledge Graph Completion

Arxiv

15+阅读 · 2019年11月26日

VIP会员