【ICLR2022】序列生成的目标侧数据增强 - 专知VIP

会员服务 ·

4

数据增强 · 序列生成 · 论文 ·

2022 年 2 月 14 日

【ICLR2022】序列生成的目标侧数据增强

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

论文概述：自回归序列生成是机器学习和自然语言处理中的一个重要方法。每个元素在生成的时候，它同时基于输入条件和已经生成的元素。之前的数据增强方法，虽然已经在各种任务上取得的显著的效果，却只是被运用在了输入条件上。例如在输入的序列中增加噪声，或进行随机替换，打乱，掩码等操作。这些方法都忽视了对已生成元素的增强。本文提出了一种生成端的数据增强方法。在训练阶段，我们使用解码器的输出作为软标签，与真实数据一起生成增强的数据。这些增强数据则进一步用来训练解码器。我们在多个序列生成任务上进行了实验，包括对话生成，机器翻译，和摘要生成。在不使用额外数据和额外的模型参数的情况下，我们的方法在所有指标上显著的高于许多强力的基线模型，充分证明了我们的算法的有效性。

https://openreview.net/forum?id=pz1euXohm4H

成为VIP会员查看完整内容

23

相关内容

数据增强

数据增强在机器学习领域多指采用一些方法（比如数据蒸馏，正负样本均衡等）来提高模型数据集的质量，增强数据。

[ICLR2022]PU learning（Positive and Unlabeled learning）任务的mixup方法

[ICLR2022]PU learning（Positive and Unlabeled learning）任务的mixup方法

专知会员服务

19+阅读 · 2022年2月2日

【AAAI 2022】用于文本摘要任务的序列级对比学习模型

【AAAI 2022】用于文本摘要任务的序列级对比学习模型

专知会员服务

25+阅读 · 2022年1月11日

EMNLP 2021 | 学习改写非自回归机器翻译的翻译结果

EMNLP 2021 | 学习改写非自回归机器翻译的翻译结果

专知会员服务

15+阅读 · 2021年12月25日

【CIKM2021】通过数据增强的序列用户行为建模的对比课程学习

【CIKM2021】通过数据增强的序列用户行为建模的对比课程学习

专知会员服务

20+阅读 · 2021年11月21日

文本分类数据增强综述

专知会员服务

66+阅读 · 2021年7月11日

SiT: 自监督视觉Transformer

专知会员服务

65+阅读 · 2021年4月11日

【ICLR2021】面向词替换攻击的对抗训练方法

专知会员服务

21+阅读 · 2021年2月7日

【AAAI2021】数据增强图神经网络

专知会员服务

108+阅读 · 2020年12月21日

【EMNLP2020】开放领域对话的数据增广的方法：“对话蒸馏”

【EMNLP2020】开放领域对话的数据增广的方法：“对话蒸馏”

专知会员服务

30+阅读 · 2020年9月29日

【Amazon】使用预先训练的Transformer模型进行数据增强

【Amazon】使用预先训练的Transformer模型进行数据增强

专知会员服务

57+阅读 · 2020年3月6日

AAAI2022@腾讯 | 多任务推荐系统中的跨任务知识蒸馏

AAAI2022@腾讯 | 多任务推荐系统中的跨任务知识蒸馏

机器学习与推荐算法

1+阅读 · 2022年3月29日

有效且稳健的数据增强小样本学习 | 论文荐读

有效且稳健的数据增强小样本学习 | 论文荐读

学术头条

6+阅读 · 2022年3月25日

【ICLR2022】时序对齐预测的监督表示学习与少样本序列分类

【ICLR2022】时序对齐预测的监督表示学习与少样本序列分类

专知

4+阅读 · 2022年2月5日

【AAAI 2022】用于文本摘要任务的序列级对比学习模型

【AAAI 2022】用于文本摘要任务的序列级对比学习模型

专知

8+阅读 · 2022年1月11日

EMNLP 2021 | 学习改写非自回归机器翻译的翻译结果

EMNLP 2021 | 学习改写非自回归机器翻译的翻译结果

专知

0+阅读 · 2021年12月25日

赛尔原创@EMNLP 2021 | 学习改写非自回归机器翻译的翻译结果

赛尔原创@EMNLP 2021 | 学习改写非自回归机器翻译的翻译结果

哈工大SCIR

0+阅读 · 2021年12月21日

【CIKM2021】通过数据增强的序列用户行为建模的对比课程学习

【CIKM2021】通过数据增强的序列用户行为建模的对比课程学习

专知

0+阅读 · 2021年11月21日

哈工大｜NLP数据增强方法？我有15种

哈工大｜NLP数据增强方法？我有15种

哈工大SCIR

1+阅读 · 2021年10月13日

数据增强：数据有限时如何使用深度学习？（续）

数据增强：数据有限时如何使用深度学习？（续）

AI研习社

14+阅读 · 2018年5月6日

基于对偶两步模型的图像放大问题

国家自然科学基金

0+阅读 · 2014年12月31日

机器翻译中大规模异类特征的迁移学习

国家自然科学基金

2+阅读 · 2013年12月31日

多约束条件下的目标超分辨检测方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于句子语义结构的统计机器翻译研究

国家自然科学基金

1+阅读 · 2013年12月31日

大规模概率数据的管理与查询优化

国家自然科学基金

0+阅读 · 2012年12月31日

面向进化多目标优化的局部自适应学习模型与算法研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于稀疏表示技术的大规模医学图像检索新方法研究

国家自然科学基金

1+阅读 · 2012年12月31日

知识驱动的多目标决策数据挖掘理论框架及应用实验系统研究

国家自然科学基金

1+阅读 · 2009年12月31日

基于认知规律几何化的流形学习

国家自然科学基金

1+阅读 · 2009年12月31日

几何计算与表示中的约束优化方法研究

国家自然科学基金

2+阅读 · 2009年12月31日

Open-Vocabulary Instance Segmentation via Robust Cross-Modal Pseudo-Labeling

Arxiv

0+阅读 · 2022年4月19日

PaLM: Scaling Language Modeling with Pathways

Arxiv

0+阅读 · 2022年4月19日

Active Learning with Weak Labels for Gaussian Processes

Arxiv

2+阅读 · 2022年4月18日

A Comprehensive Survey on Data-Efficient GANs in Image Generation

Arxiv

0+阅读 · 2022年4月18日

UMass PCL at SemEval-2022 Task 4: Pre-trained Language Model Ensembles for Detecting Patronizing and Condescending Language

Arxiv

0+阅读 · 2022年4月18日

End-to-end Dense Video Captioning as Sequence Generation

Arxiv

1+阅读 · 2022年4月18日

Multimodal Few-Shot Object Detection with Meta-Learning Based Cross-Modal Prompting

Arxiv

0+阅读 · 2022年4月16日

Detection of Small Holes by the Scale-Invariant Robust Density-Aware Distance (RDAD) Filtration

Arxiv

0+阅读 · 2022年4月16日

Image/Video Deep Anomaly Detection: A Survey

Arxiv

16+阅读 · 2021年3月2日

Deep Learning in Video Multi-Object Tracking: A Survey

Deep Learning in Video Multi-Object Tracking: A Survey

Arxiv

58+阅读 · 2019年7月31日

VIP会员

相关主题

相关VIP内容

[ICLR2022]PU learning（Positive and Unlabeled learning）任务的mixup方法

[ICLR2022]PU learning（Positive and Unlabeled learning）任务的mixup方法

专知会员服务

19+阅读 · 2022年2月2日

【AAAI 2022】用于文本摘要任务的序列级对比学习模型

【AAAI 2022】用于文本摘要任务的序列级对比学习模型

专知会员服务

25+阅读 · 2022年1月11日

EMNLP 2021 | 学习改写非自回归机器翻译的翻译结果

EMNLP 2021 | 学习改写非自回归机器翻译的翻译结果

专知会员服务

15+阅读 · 2021年12月25日

【CIKM2021】通过数据增强的序列用户行为建模的对比课程学习

【CIKM2021】通过数据增强的序列用户行为建模的对比课程学习

专知会员服务

20+阅读 · 2021年11月21日

文本分类数据增强综述

专知会员服务

66+阅读 · 2021年7月11日

SiT: 自监督视觉Transformer

专知会员服务

65+阅读 · 2021年4月11日

【ICLR2021】面向词替换攻击的对抗训练方法

专知会员服务

21+阅读 · 2021年2月7日

【AAAI2021】数据增强图神经网络

专知会员服务

108+阅读 · 2020年12月21日

【EMNLP2020】开放领域对话的数据增广的方法：“对话蒸馏”

【EMNLP2020】开放领域对话的数据增广的方法：“对话蒸馏”

专知会员服务

30+阅读 · 2020年9月29日

【Amazon】使用预先训练的Transformer模型进行数据增强

【Amazon】使用预先训练的Transformer模型进行数据增强

专知会员服务

57+阅读 · 2020年3月6日

热门VIP内容

开通专知VIP会员享更多权益服务

《战区安全决策课程体系》最新244页

《"无人机航母"原型平台》

任务规划与地形分析：现代复杂环境作战导航体系

《攻击场景描述形式化模型研究》

相关资讯

AAAI2022@腾讯 | 多任务推荐系统中的跨任务知识蒸馏

AAAI2022@腾讯 | 多任务推荐系统中的跨任务知识蒸馏

机器学习与推荐算法

1+阅读 · 2022年3月29日

有效且稳健的数据增强小样本学习 | 论文荐读

有效且稳健的数据增强小样本学习 | 论文荐读

学术头条

6+阅读 · 2022年3月25日

【ICLR2022】时序对齐预测的监督表示学习与少样本序列分类

【ICLR2022】时序对齐预测的监督表示学习与少样本序列分类

专知

4+阅读 · 2022年2月5日

【AAAI 2022】用于文本摘要任务的序列级对比学习模型

【AAAI 2022】用于文本摘要任务的序列级对比学习模型

专知

8+阅读 · 2022年1月11日

EMNLP 2021 | 学习改写非自回归机器翻译的翻译结果

EMNLP 2021 | 学习改写非自回归机器翻译的翻译结果

专知

0+阅读 · 2021年12月25日

赛尔原创@EMNLP 2021 | 学习改写非自回归机器翻译的翻译结果

赛尔原创@EMNLP 2021 | 学习改写非自回归机器翻译的翻译结果

哈工大SCIR

0+阅读 · 2021年12月21日

【CIKM2021】通过数据增强的序列用户行为建模的对比课程学习

【CIKM2021】通过数据增强的序列用户行为建模的对比课程学习

专知

0+阅读 · 2021年11月21日

哈工大｜NLP数据增强方法？我有15种

哈工大｜NLP数据增强方法？我有15种

哈工大SCIR

1+阅读 · 2021年10月13日

数据增强：数据有限时如何使用深度学习？（续）

数据增强：数据有限时如何使用深度学习？（续）

AI研习社

14+阅读 · 2018年5月6日

相关基金

基于对偶两步模型的图像放大问题

国家自然科学基金

0+阅读 · 2014年12月31日

机器翻译中大规模异类特征的迁移学习

国家自然科学基金

2+阅读 · 2013年12月31日

多约束条件下的目标超分辨检测方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于句子语义结构的统计机器翻译研究

国家自然科学基金

1+阅读 · 2013年12月31日

大规模概率数据的管理与查询优化

国家自然科学基金

0+阅读 · 2012年12月31日

面向进化多目标优化的局部自适应学习模型与算法研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于稀疏表示技术的大规模医学图像检索新方法研究

国家自然科学基金

1+阅读 · 2012年12月31日

知识驱动的多目标决策数据挖掘理论框架及应用实验系统研究

国家自然科学基金

1+阅读 · 2009年12月31日

基于认知规律几何化的流形学习

国家自然科学基金

1+阅读 · 2009年12月31日

几何计算与表示中的约束优化方法研究

国家自然科学基金

2+阅读 · 2009年12月31日

相关论文

Open-Vocabulary Instance Segmentation via Robust Cross-Modal Pseudo-Labeling

Arxiv

0+阅读 · 2022年4月19日

PaLM: Scaling Language Modeling with Pathways

Arxiv

0+阅读 · 2022年4月19日

Active Learning with Weak Labels for Gaussian Processes

Arxiv

2+阅读 · 2022年4月18日

A Comprehensive Survey on Data-Efficient GANs in Image Generation

Arxiv

0+阅读 · 2022年4月18日

UMass PCL at SemEval-2022 Task 4: Pre-trained Language Model Ensembles for Detecting Patronizing and Condescending Language

Arxiv

0+阅读 · 2022年4月18日

End-to-end Dense Video Captioning as Sequence Generation

Arxiv

1+阅读 · 2022年4月18日

Multimodal Few-Shot Object Detection with Meta-Learning Based Cross-Modal Prompting

Arxiv

0+阅读 · 2022年4月16日

Detection of Small Holes by the Scale-Invariant Robust Density-Aware Distance (RDAD) Filtration

Arxiv

0+阅读 · 2022年4月16日

Image/Video Deep Anomaly Detection: A Survey

Arxiv

16+阅读 · 2021年3月2日

Deep Learning in Video Multi-Object Tracking: A Survey

Deep Learning in Video Multi-Object Tracking: A Survey

Arxiv

58+阅读 · 2019年7月31日

微信扫码咨询专知VIP会员