为了追求精度,深度学习模型框架的结构越来越复杂,网络越来越深。参数量的增加意味着训练模型需要更多的数据。然而人工标注数据的成本是高昂的,且受客观原因所限,实际应用时可能难以获得特定领域的数据,数据不足问题非常常见。数据增强通过人为地生成新的数据增加数据量来缓解这一问题。数据增强方法在计算机视觉领域大放异彩,让人们开始关注类似方法能否应用在序列数据上。除了翻转、裁剪等在时间域进行增强的方法外,也描述了在频率域实现数据增强的方法;除了人们基于经验或知识而设计的方法以外,对一系列基于GAN的通过机器学习模型自动生成数据的方法也进行了详细的论述。介绍了应用在自然语言文本、音频信号和时间序列等多种序列数据上的数据增强方法,亦有涉及它们在医疗诊断、情绪判断等问题上的表现。尽管数据类型不同,但总结了应用在这些类型上的数据增强方法背后的相似的设计思路。以这一思路为线索,梳理应用在各类序列数据类型上的多种数据增强方法,并进行了一定的讨论和展望。

http://fcst.ceaj.org/CN/abstract/abstract2790.shtml

成为VIP会员查看完整内容
70

相关内容

专知会员服务
48+阅读 · 2021年8月28日
专知会员服务
36+阅读 · 2021年8月27日
专知会员服务
35+阅读 · 2021年8月19日
专知会员服务
51+阅读 · 2021年8月13日
专知会员服务
66+阅读 · 2021年7月11日
专知会员服务
65+阅读 · 2021年5月29日
专知会员服务
124+阅读 · 2021年4月29日
专知会员服务
46+阅读 · 2021年3月19日
专知会员服务
109+阅读 · 2020年10月27日
专知会员服务
115+阅读 · 2020年8月22日
多模态视觉语言表征学习研究综述
专知
27+阅读 · 2020年12月3日
时空序列预测方法综述
专知
21+阅读 · 2020年10月19日
最新《多任务学习》综述,39页pdf
专知
28+阅读 · 2020年7月10日
多模态深度学习综述,18页pdf
专知
48+阅读 · 2020年3月29日
数据增强文献综述
极市平台
20+阅读 · 2019年8月4日
【综述】生成式对抗网络GAN最新进展综述
专知
57+阅读 · 2019年6月5日
清华大学图神经网络综述:模型与应用
机器之心
74+阅读 · 2018年12月26日
Arxiv
35+阅读 · 2021年8月2日
One-Class Classification: A Survey
Arxiv
8+阅读 · 2021年1月8日
S4Net: Single Stage Salient-Instance Segmentation
Arxiv
10+阅读 · 2019年4月10日
Arxiv
3+阅读 · 2018年12月18日
Arxiv
3+阅读 · 2017年11月21日
VIP会员
相关VIP内容
专知会员服务
48+阅读 · 2021年8月28日
专知会员服务
36+阅读 · 2021年8月27日
专知会员服务
35+阅读 · 2021年8月19日
专知会员服务
51+阅读 · 2021年8月13日
专知会员服务
66+阅读 · 2021年7月11日
专知会员服务
65+阅读 · 2021年5月29日
专知会员服务
124+阅读 · 2021年4月29日
专知会员服务
46+阅读 · 2021年3月19日
专知会员服务
109+阅读 · 2020年10月27日
专知会员服务
115+阅读 · 2020年8月22日
相关资讯
多模态视觉语言表征学习研究综述
专知
27+阅读 · 2020年12月3日
时空序列预测方法综述
专知
21+阅读 · 2020年10月19日
最新《多任务学习》综述,39页pdf
专知
28+阅读 · 2020年7月10日
多模态深度学习综述,18页pdf
专知
48+阅读 · 2020年3月29日
数据增强文献综述
极市平台
20+阅读 · 2019年8月4日
【综述】生成式对抗网络GAN最新进展综述
专知
57+阅读 · 2019年6月5日
清华大学图神经网络综述:模型与应用
机器之心
74+阅读 · 2018年12月26日
微信扫码咨询专知VIP会员