数据作为深度学习的驱动力,对于模型的训练至关重要。充足的训练数据不仅可以缓解模型在训练时的过拟合问题,而且可以进一步扩大参数搜索空间,帮助模型进一步朝着全局最优解优化。然而,在许多领域或任务中,获取到充足训练样本的难度和代价非常高。因此,数据增广成为一种常用的增加训练样本的手段。本文对目前深度学习中的图像数据增广方法进行研究综述,梳理了目前深度学习领域为缓解模型过拟合问题而提出的各类数据增广方法,按照方法本质原理的不同,将其分为单数据变形、多数据混合、学习数据分布和学习增广策略等4类方法,并以图像数据为主要研究对象,对各类算法进一步按照核心思想进行细分,并对方法的原理、适用场景和优缺点进行比较和分析,帮助研究者根据数据的特点选用合适的数据增广方法,为后续国内外研究者应用和发展研究数据增广方法提供基础。针对图像的数据增广方法,单数据变形方法主要可以分为几何变换、色域变换、清晰度变换、噪声注入和局部擦除等5种;多数据混合可按照图像维度的混合和特征空间下的混合进行划分;学习数据分布的方法主要基于生成对抗网络和图像风格迁移的应用进行划分;学习增广策略的典型方法则可以按照基于元学习和基于强化学习进行分类。目前,数据增广已然成为推进深度学习在各领域应用的一项重要技术,可以很有效地缓解训练数据不足带来的深度学习模型过拟合的问题,进一步提高模型的精度。在实际应用中可根据数据和任务的特点选择和组合最合适的方法,形成一套有效的数据增广方案,进而为深度学习方法的应用提供更强的动力。在未来,根据数据和任务基于强化学习探索最优的组合策略,基于元学习自适应地学习最优数据变形和混合方式,基于生成对抗网络进一步拟合真实数据分布以采样高质量的未知数据,基于风格迁移探索多模态数据互相转换的应用,这些研究方向十分值得探索并且具有广阔的发展前景。

成为VIP会员查看完整内容
52

相关内容

机器学习的一个分支,它基于试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
专知会员服务
50+阅读 · 2021年5月15日
领域自适应研究综述
专知会员服务
54+阅读 · 2021年5月5日
专知会员服务
72+阅读 · 2021年4月8日
基于小样本学习的图像分类技术综述(中文版),19页pdf
专知会员服务
87+阅读 · 2021年3月15日
专知会员服务
187+阅读 · 2021年2月4日
专知会员服务
32+阅读 · 2020年12月25日
多模态视觉语言表征学习研究综述
专知会员服务
191+阅读 · 2020年12月3日
专知会员服务
114+阅读 · 2020年8月22日
基于小样本学习的图像分类技术综述
专知会员服务
148+阅读 · 2020年5月6日
【天津大学】风格线条画生成技术综述
专知会员服务
31+阅读 · 2020年4月26日
图像修复研究进展综述
专知
19+阅读 · 2021年3月9日
多模态视觉语言表征学习研究综述
专知
27+阅读 · 2020年12月3日
最新《多任务学习》综述,39页pdf
专知
28+阅读 · 2020年7月10日
综述:基于GAN的图像翻译模型盘点
PaperWeekly
13+阅读 · 2019年9月2日
数据增强文献综述
极市平台
20+阅读 · 2019年8月4日
最全综述 | 图像分割算法
计算机视觉life
14+阅读 · 2019年6月20日
“弄假成真”:基于对抗学习的数据增广方法
科技导报
5+阅读 · 2018年10月8日
Arxiv
32+阅读 · 2021年3月8日
Arxiv
19+阅读 · 2021年1月14日
Learning from Few Samples: A Survey
Arxiv
77+阅读 · 2020年7月30日
Arxiv
7+阅读 · 2019年10月6日
Risk-Aware Active Inverse Reinforcement Learning
Arxiv
7+阅读 · 2019年1月8日
Arxiv
5+阅读 · 2018年9月11日
VIP会员
相关VIP内容
专知会员服务
50+阅读 · 2021年5月15日
领域自适应研究综述
专知会员服务
54+阅读 · 2021年5月5日
专知会员服务
72+阅读 · 2021年4月8日
基于小样本学习的图像分类技术综述(中文版),19页pdf
专知会员服务
87+阅读 · 2021年3月15日
专知会员服务
187+阅读 · 2021年2月4日
专知会员服务
32+阅读 · 2020年12月25日
多模态视觉语言表征学习研究综述
专知会员服务
191+阅读 · 2020年12月3日
专知会员服务
114+阅读 · 2020年8月22日
基于小样本学习的图像分类技术综述
专知会员服务
148+阅读 · 2020年5月6日
【天津大学】风格线条画生成技术综述
专知会员服务
31+阅读 · 2020年4月26日
相关资讯
图像修复研究进展综述
专知
19+阅读 · 2021年3月9日
多模态视觉语言表征学习研究综述
专知
27+阅读 · 2020年12月3日
最新《多任务学习》综述,39页pdf
专知
28+阅读 · 2020年7月10日
综述:基于GAN的图像翻译模型盘点
PaperWeekly
13+阅读 · 2019年9月2日
数据增强文献综述
极市平台
20+阅读 · 2019年8月4日
最全综述 | 图像分割算法
计算机视觉life
14+阅读 · 2019年6月20日
“弄假成真”:基于对抗学习的数据增广方法
科技导报
5+阅读 · 2018年10月8日
微信扫码咨询专知VIP会员