GitHub:数据增广最全资料集锦

2020 年 10 月 10 日 CVer

点击上方“CVer”,选择加"星标"置顶

重磅干货,第一时间送达

作者:AgaMiko  |  编辑:Amusi

前言


CVer 陆续分享了GitHub上优质的AI/CV资料集锦,如图像分类、目标检测等,之前的分享详见文末。很多同学反映这个系列很棒,因此系列将继续更新。


本文将分享的内容是:数据增广(Data Augmentation)。该方向的研究一直都很热门,特别是现在仍十分依赖于数据,而且数据增广对各个应用方向的涨点都是简单粗暴的!


数据扩充可以简单地描述为使我们的数据集更大的任何方法。例如,要创建更多图像,我们可以放大并保存结果,我们可以更改图像的亮度或旋转它。为了获得更大的声音数据集,我们可以尝试提高或降低音频样本的音调或放慢/加快速度。下图提供了示例数据增强技术。



Amusi 在本文要分享的就是目前最全,最新的数据增广开源项目、论文等合集。主要涉及图像、音频、自然语言处理和时序的数据增广。


数据增广


项目作者:AgaMiko


https://github.com/AgaMiko/data-augmentation-review


目录

  • Images

    • Adversarial noise

    • Neural Style Transfer

    • Generative Adversarial Networks

    • Random erasing

    • Adding rain effects, sun flare...

    • Image blending

    • Contrast shift

    • Brightness shift

    • Blurring

    • Channel shuffle

    • Rotation

    • Scaling

    • Random cropping

    • Reflection

    • Affine transformations

    • Elastic transformations

    • Advanced transformations

    • Neural-based transformations

  • Audio

    • Noise injection

    • Time shift

    • Time stretching

    • Random cropping

    • Pitch scaling

    • Dynamic range compression

    • Simple gain

    • Equalization

  • Natural Language Processing

    • Thesaurus

    • Text Generation

    • Back Translation

    • Word Embeddings

    • Contextualized Word Embeddings

    • Voice conversion

  • Time Series Data Augmentation

    • Embedding space

    • GAN/Adversarial

    • RL/Meta-Learning

    • Warping

    • Jittering

    • Perturbing

    • Basic approaches

    • Advanced approches


计算机视觉(CV)数据增广的开源项目


1. albumentations:一个Python库,其中包含一组有用的,大型的和多样化的数据增广方法。它提供了30多种不同类型的增广功能,易于使用。而且,正如作者证明的那样,在大多数转换中,该库比其他库要快。


https://github.com/albu/albumentations


2. imgaug:另一个非常有用且广泛使用的Python库。如作者所述:它可以帮助您为机器学习项目扩充图像。它将一组输入图像转换为一组稍有变化的新的,更大的图像。它提供了许多增广技术,例如仿射变换,透视图变换,对比度变化,高斯噪声,区域丢失,色相/饱和度变化,裁剪/填充,模糊。


https://github.com/aleju/imgaug



UDA:用于图像文件的简单数据增广工具,旨在与机器学习数据集一起使用。该工具将扫描包含图像文件的目录,并通过对找到的每个文件执行一组指定的扩充操作来生成新图像。此过程使开发神经网络时可以使用的训练示例数量成倍增加,并且应显著提高所得网络的性能,尤其是当训练示例数量相对较少时。


https://github.com/google-research/uda


Data augmentation for object detection:该项目介绍了如何将数据增广方法用于目标检测任务。它们支持许多数据增广,例如水平翻转,缩放,平移,旋转,剪切,调整大小。


https://github.com/Paperspace/DataAugmentationForObjectDetection



FMix - Understanding and Enhancing Mixed Sample Data Augmentation 


https://github.com/ecs-vlc/FMix


Super-AND


https://github.com/super-AND/super-AND



vidaug:这个Python库可帮助您为深度学习架构扩充视频。它将输入的视频转换为一组稍有变化的新视频。


https://github.com/okankop/vidaug


Image augmentor


https://github.com/codebox/image_augmentor


torchsample:该Python软件包为Pytorch提供了高级训练,数据增广和实用程序。该工具箱提供了数据扩充方法,正则化器和其他实用功能。


https://github.com/ncullen93/torchsample


  • Compose()

  • AddChannel()

  • SwapDims()

  • RangeNormalize()

  • StdNormalize()

  • Slice2D()

  • RandomCrop()

  • SpecialCrop()

  • Pad()

  • RandomFlip()

Random erasing


https://github.com/zhunzhong07/Random-Erasing



data augmentation in C++:简单的图像增广程序可通过旋转,滑动,模糊和噪点转换输入图像,以创建图像识别的训练数据。


https://github.com/takmin/DataAugmentation


Data augmentation with GANs


https://github.com/AntreasAntoniou/DAGAN


Joint Discriminative and Generative Learning


https://github.com/NVlabs/DG-Net



White-Balance Emulator for Color Augmentation 


https://github.com/mahmoudnafifi/WB_color_augmenter



DocCreator 


https://github.com/DocCreator/DocCreator



OnlineAugment 


https://github.com/zhiqiangdon/online-augment



自然语言处理(NLP)数据增广的开源项目


Contextual data augmentation:上下文扩充是用于文本分类任务的独立于域的数据扩充。通过用标签条件的双向语言模型预测的其他单词替换单词,可以增广监督数据集中的文本。


https://github.com/pfnet-research/contextual_augmentation



nlpaug



https://github.com/makcedward/nlpaug


EDA NLP


https://github.com/jasonwei20/eda_nlp


侃侃


因为本数据增广项目涵盖的内容较多,这里不再一一介绍,比如还有CV、NLP的数据增广论文合集,语音、时序方向的项目和论文可以详见此项目。相信对你的项目会有所帮助或者有所启发。


资料下载


在CVer公众号后台回复:数据增广,即可下载访问最全的数据增广论文、开源项目等资料。


另外强烈推荐阅读,Amusi 整理过的最全资料系列如下:



下载2


后台回复:CVPR2020,即可下载代码开源的论文合集

后台回复:ECCV2020,即可下载代码开源的论文合集


重磅!CVer-目标检测 微信交流群已成立


扫码添加CVer助手,可申请加入CVer-目标检测 微信交流群,目前已汇集4100人!涵盖2D/3D目标检测、小目标检测、遥感目标检测等。互相交流,一起进步!


同时也可申请加入CVer大群和细分方向技术群,细分方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch和TensorFlow等群。


一定要备注:研究方向+地点+学校/公司+昵称(如目标检测+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群

▲长按加群


▲长按关注我们

整理不易,请给CVer点赞和在看

登录查看更多
7

相关内容

还在修改博士论文?这份《博士论文写作技巧》为你指南
【ACL2020-密歇根州立大学】语言和视觉推理的跨模态关联
抢鲜看!13篇CVPR2020论文链接/开源代码/解读
专知会员服务
49+阅读 · 2020年2月26日
必读的10篇 CVPR 2019【生成对抗网络】相关论文和代码
专知会员服务
31+阅读 · 2020年1月10日
【干货】用BRET进行多标签文本分类(附代码)
专知会员服务
84+阅读 · 2019年12月27日
【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换
专知会员服务
35+阅读 · 2019年12月15日
GitHub:超分辨率最全资料集锦
CVer
9+阅读 · 2020年10月17日
【资源】语音增强资源集锦
专知
8+阅读 · 2020年7月4日
图像/视频去噪算法资源集锦
专知
18+阅读 · 2019年12月14日
一份超全的PyTorch资源列表(Github 2.2K星)
黑龙江大学自然语言处理实验室
25+阅读 · 2018年10月26日
Arxiv
4+阅读 · 2019年2月18日
Panoptic Feature Pyramid Networks
Arxiv
3+阅读 · 2019年1月8日
Arxiv
4+阅读 · 2018年10月31日
Arxiv
10+阅读 · 2018年3月23日
VIP会员
相关VIP内容
还在修改博士论文?这份《博士论文写作技巧》为你指南
【ACL2020-密歇根州立大学】语言和视觉推理的跨模态关联
抢鲜看!13篇CVPR2020论文链接/开源代码/解读
专知会员服务
49+阅读 · 2020年2月26日
必读的10篇 CVPR 2019【生成对抗网络】相关论文和代码
专知会员服务
31+阅读 · 2020年1月10日
【干货】用BRET进行多标签文本分类(附代码)
专知会员服务
84+阅读 · 2019年12月27日
【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换
专知会员服务
35+阅读 · 2019年12月15日
相关论文
Arxiv
4+阅读 · 2019年2月18日
Panoptic Feature Pyramid Networks
Arxiv
3+阅读 · 2019年1月8日
Arxiv
4+阅读 · 2018年10月31日
Arxiv
10+阅读 · 2018年3月23日
Top
微信扫码咨询专知VIP会员