点击上方“CVer”,选择加"星标"置顶
重磅干货,第一时间送达
作者:AgaMiko | 编辑:Amusi
前言
CVer 陆续分享了GitHub上优质的AI/CV资料集锦,如图像分类、目标检测等,之前的分享详见文末。很多同学反映这个系列很棒,因此系列将继续更新。
本文将分享的内容是:数据增广(Data Augmentation)。该方向的研究一直都很热门,特别是现在仍十分依赖于数据,而且数据增广对各个应用方向的涨点都是简单粗暴的!
数据扩充可以简单地描述为使我们的数据集更大的任何方法。例如,要创建更多图像,我们可以放大并保存结果,我们可以更改图像的亮度或旋转它。为了获得更大的声音数据集,我们可以尝试提高或降低音频样本的音调或放慢/加快速度。下图提供了示例数据增强技术。
Amusi 在本文要分享的就是目前最全,最新的数据增广开源项目、论文等合集。主要涉及图像、音频、自然语言处理和时序的数据增广。
数据增广
项目作者:AgaMiko
https://github.com/AgaMiko/data-augmentation-review
目录
Adversarial noise
Neural Style Transfer
Generative Adversarial Networks
Random erasing
Adding rain effects, sun flare...
Image blending
Contrast shift
Brightness shift
Blurring
Channel shuffle
Rotation
Scaling
Random cropping
Reflection
Affine transformations
Elastic transformations
Advanced transformations
Neural-based transformations
Noise injection
Time shift
Time stretching
Random cropping
Pitch scaling
Dynamic range compression
Simple gain
Equalization
Thesaurus
Text Generation
Back Translation
Word Embeddings
Contextualized Word Embeddings
Voice conversion
Embedding space
GAN/Adversarial
RL/Meta-Learning
Warping
Jittering
Perturbing
Basic approaches
Advanced approches
计算机视觉(CV)数据增广的开源项目
1. albumentations:一个Python库,其中包含一组有用的,大型的和多样化的数据增广方法。它提供了30多种不同类型的增广功能,易于使用。而且,正如作者证明的那样,在大多数转换中,该库比其他库要快。
https://github.com/albu/albumentations
2. imgaug:另一个非常有用且广泛使用的Python库。如作者所述:它可以帮助您为机器学习项目扩充图像。它将一组输入图像转换为一组稍有变化的新的,更大的图像。它提供了许多增广技术,例如仿射变换,透视图变换,对比度变化,高斯噪声,区域丢失,色相/饱和度变化,裁剪/填充,模糊。
https://github.com/aleju/imgaug
UDA:用于图像文件的简单数据增广工具,旨在与机器学习数据集一起使用。该工具将扫描包含图像文件的目录,并通过对找到的每个文件执行一组指定的扩充操作来生成新图像。此过程使开发神经网络时可以使用的训练示例数量成倍增加,并且应显著提高所得网络的性能,尤其是当训练示例数量相对较少时。
https://github.com/google-research/uda
https://github.com/Paperspace/DataAugmentationForObjectDetection
https://github.com/ecs-vlc/FMix
Super-AND
https://github.com/super-AND/super-AND
vidaug:这个Python库可帮助您为深度学习架构扩充视频。它将输入的视频转换为一组稍有变化的新视频。
https://github.com/okankop/vidaug
Image augmentor
https://github.com/codebox/image_augmentor
torchsample:该Python软件包为Pytorch提供了高级训练,数据增广和实用程序。该工具箱提供了数据扩充方法,正则化器和其他实用功能。
https://github.com/ncullen93/torchsample
Compose()
AddChannel()
SwapDims()
RangeNormalize()
StdNormalize()
Slice2D()
RandomCrop()
SpecialCrop()
Pad()
RandomFlip()
Random erasing
https://github.com/zhunzhong07/Random-Erasing
data augmentation in C++:简单的图像增广程序可通过旋转,滑动,模糊和噪点转换输入图像,以创建图像识别的训练数据。
https://github.com/takmin/DataAugmentation
https://github.com/NVlabs/DG-Net
White-Balance Emulator for Color Augmentation
https://github.com/mahmoudnafifi/WB_color_augmenter
DocCreator
https://github.com/DocCreator/DocCreator
OnlineAugment
https://github.com/zhiqiangdon/online-augment
自然语言处理(NLP)数据增广的开源项目
Contextual data augmentation:上下文扩充是用于文本分类任务的独立于域的数据扩充。通过用标签条件的双向语言模型预测的其他单词替换单词,可以增广监督数据集中的文本。
https://github.com/pfnet-research/contextual_augmentation
nlpaug
https://github.com/makcedward/nlpaug
EDA NLP
https://github.com/jasonwei20/eda_nlp
侃侃
因为本数据增广项目涵盖的内容较多,这里不再一一介绍,比如还有CV、NLP的数据增广论文合集,语音、时序方向的项目和论文可以详见此项目。相信对你的项目会有所帮助或者有所启发。
资料下载
在CVer公众号后台回复:数据增广,即可下载访问最全的数据增广论文、开源项目等资料。
另外强烈推荐阅读,Amusi 整理过的最全资料系列如下:
下载2
后台回复:CVPR2020,即可下载代码开源的论文合集
后台回复:ECCV2020,即可下载代码开源的论文合集
重磅!CVer-目标检测 微信交流群已成立
扫码添加CVer助手,可申请加入CVer-目标检测 微信交流群,目前已汇集4100人!涵盖2D/3D目标检测、小目标检测、遥感目标检测等。互相交流,一起进步!
同时也可申请加入CVer大群和细分方向技术群,细分方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch和TensorFlow等群。
一定要备注:研究方向+地点+学校/公司+昵称(如目标检测+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群
▲长按加群
▲长按关注我们
整理不易,请给CVer点赞和在看!