干货 | 自从学了这个方法，深度学习再也不愁没钱买数据集了 - 专知

会员服务 ·

0

干货 | 自从学了这个方法，深度学习再也不愁没钱买数据集了

2017 年 10 月 1 日 AI科技评论 camel

深度学习大牛吴恩达曾经说过：做AI研究就像造宇宙飞船，除了充足的燃料之外，强劲的引擎也是必不可少的。假如燃料不足，则飞船就无法进入预定轨道。而引擎不够强劲，飞船甚至不能升空。类比于AI，深度学习模型就好像引擎，海量的训练数据就好像燃料，这两者对于AI而言同样缺一不可。

在深度学习中，当数据量不大时可能会导致过拟合，使得训练误差很小，但测试误差却特别大。怎么办呢，你又没钱买数据？显然最好的办法（之一）就是自己“造”数据——人工增加训练集的大小，也就是Data Augmentation Transformation。

不同的任务背景下，通常我们可以通过图像的几何变换，使用例如剪切、旋转/反射/翻转变换、缩放变换、平移变换、尺度变换、对比度变换、噪声扰动、颜色变换等一种或多种组合数据增强变换的方式来增加数据集的大小。例如假如你的数据集只有10张256*256的图片，那么通过剪切你可以在每张图片上得到32*32=1024张224*224的图片，然后再做一次水平翻转，那么你的数据集就扩大了2048倍，也就是说你现在有了一个20480张图片的数据集。看起来很诱人。那么它的效果如何呢？

AI科技评论注: 几何变换不改变像素值, 而是改变像素所在的位置. 通过Data Augmentation方法扩张了数据集的范围, 作为输入时, 以期待网络学习到更多的图像不变性特征。

近期加拿大多伦多大学的Salehinejad等人在论文（arXiv:1708.04347v1）中提出了另外一种不同于上面几种的数据增强变换——极坐标变换，方法极为简单，完全可以作为数据增强变换一个案例来介绍。

方法

所谓极坐标变换，就是像素由原来（x, y）的表示通过极坐标变换得到（r, θ）的表示，然后把它表示成一个二维图片。数学知识只涉及这两个高中的数学公式：

用图来表示就是：

例如在一张256*256的图片上，选择圆心任意、半径为256且等分为256条像素辐条（角度变化为2*pi/256）的圆盘来覆盖图片，那么覆盖到像素都将对应一个（r, θ）对，放到二维直角坐标系中就生成了一幅新图。由于极坐标在靠近圆心位置像素粒度较大，而远离圆心位置的像素粒度较小，所以改变圆心位置，将得到不同的图片。

实验

作者选择了两个数据集来进行试验。其中一个是MNIST数据集，共10个类，每个类分别为0-9的手写体数字。（RT为极坐标变换后的对应图片）

另一个是多模医学影像数据集（Multimodal medical dataset），作者共选了9个类。

在实验中作者每个类只有20张图片。也即在数据增强变换之前（original）MNIST-OR数据集有200张图片，MMD-OR有180张图片。作者通过极坐标变换把数据增大了100倍，MNIST-RT有20000张图片，MMD-RT有18000张图片。

随后作者分别选用AlexNet和GoogLeNet两个深度学习模型对以上四个数据集进行训练，其结果则非常喜人。

结果

对比有四：

1、在数据量较小时，AlexNet的表现要比GoogLeNet好；

2、通过数据增强变换后的数据集能够更迅速地收敛，且精度较高；

3、通过数据增强变换后的数据集收敛时涨落较小。

4、对比MNIST数据和多模医学影像数据集，MNIST的两个数据集（OR和RT）精度之间的差别更明显。这可能是因为多模医学影像数据集的图像之间有关联，例如横向腹部磁共振成像和矢状面腹部磁共振成像之间有一定的关联性。

很明显喽，极坐标变换的数据增强变换方式也是很有效的。所以吧，没钱买数据了，不妨试试各种数据增强的变换方法，也可以将各种变换组合使用，那你的数据量将成n次方地增加。

————— 给爱学习的你的福利 —————

3个月，从无人问津到年薪30万的秘密究竟是什么？答案在这里——崔立明授课【推荐系统算法工程师-从入门到就业】3个月算法水平得到快速提升，让你的职业生涯更有竞争力！长按识别下方二维码（或阅读原文戳开链接）抵达课程详细介绍~

————————————————————

登录查看更多

4

相关内容

基于深度神经网络的少样本学习综述

基于深度神经网络的少样本学习综述

专知会员服务

173+阅读 · 2020年4月22日

【Snapchat-谷歌-微软】最新《深度学习文本分类》2020综述论文大全，150+DL分类模型，42页pdf215篇参考文献

【Snapchat-谷歌-微软】最新《深度学习文本分类》2020综述论文大全，150+DL分类模型，42页pdf215篇参考文献

专知会员服务

84+阅读 · 2020年4月9日

Google 发布图片配对基准及挑战：从系列图像重建三维物体和建筑物

Google 发布图片配对基准及挑战：从系列图像重建三维物体和建筑物

专知会员服务

40+阅读 · 2020年4月4日

CVPR 2020 | MetaFuse：用于人体姿态估计的预训练信息融合模型

CVPR 2020 | MetaFuse：用于人体姿态估计的预训练信息融合模型

专知会员服务

25+阅读 · 2020年4月2日

【康奈尔大学-Facebook】特征归一化与数据增强，Feature Normalization

【康奈尔大学-Facebook】特征归一化与数据增强，Feature Normalization

专知会员服务

57+阅读 · 2020年3月9日

最新必读的8篇「小样本学习（few-shot learning）」2020顶会论文和代码

最新必读的8篇「小样本学习（few-shot learning）」2020顶会论文和代码

专知会员服务

240+阅读 · 2020年3月2日

【Google AI】开源NoisyStudent：自监督图像分类

【Google AI】开源NoisyStudent：自监督图像分类

专知会员服务

55+阅读 · 2020年2月18日

【浙江大学】对抗样本生成技术综述

【浙江大学】对抗样本生成技术综述

专知会员服务

92+阅读 · 2020年1月6日

【论文】深度卷积神经网络的ImageNet分类（ImageNet Classification with Deep Convolutional Neural Networks）

【论文】深度卷积神经网络的ImageNet分类（ImageNet Classification with Deep Convolutional Neural Networks）

专知会员服务

14+阅读 · 2020年1月1日

【斯坦福&Google】面向机器人的机器学习，63页PPT

【斯坦福&Google】面向机器人的机器学习，63页PPT

专知会员服务

26+阅读 · 2019年11月19日

特征方程的物理意义

特征方程的物理意义

算法与数学之美

6+阅读 · 2019年5月13日

FAIR&MIT提出知识蒸馏新方法：数据集蒸馏

FAIR&MIT提出知识蒸馏新方法：数据集蒸馏

机器之心

7+阅读 · 2019年2月7日

干货——图像分类（上）

干货——图像分类（上）

计算机视觉战队

27+阅读 · 2018年8月28日

干货——图像分类（下）

干货——图像分类（下）

计算机视觉战队

14+阅读 · 2018年8月28日

什么是深度学习的卷积？

什么是深度学习的卷积？

论智

18+阅读 · 2018年8月14日

N维图像的数据增强方法概览

N维图像的数据增强方法概览

论智

5+阅读 · 2018年5月21日

干货 | 深度学习时代的目标检测算法

干货 | 深度学习时代的目标检测算法

AI科技评论

6+阅读 · 2018年3月6日

【计算机视觉必读干货】图像分类、定位、检测，语义分割和实例分割方法梳理

【计算机视觉必读干货】图像分类、定位、检测，语义分割和实例分割方法梳理

GAN生成式对抗网络

5+阅读 · 2018年1月31日

【286页干货】一天搞懂深度学习

【286页干货】一天搞懂深度学习

七月在线实验室

9+阅读 · 2018年1月30日

Reddit热点 | 想看被打码的羞羞图片怎么办？CNN帮你解决

Reddit热点 | 想看被打码的羞羞图片怎么办？CNN帮你解决

AI100

5+阅读 · 2017年12月3日

S$^\mathbf{4}$L: Self-Supervised Semi-Supervised Learning

Arxiv

5+阅读 · 2019年5月9日

Data augmentation using learned transforms for one-shot medical image segmentation

Arxiv

5+阅读 · 2019年2月25日

Augmentation for small object detection

Augmentation for small object detection

Arxiv

13+阅读 · 2019年2月19日

PointRCNN: 3D Object Proposal Generation and Detection from Point Cloud

Arxiv

7+阅读 · 2018年12月11日

A New Ensemble Learning Framework for 3D Biomedical Image Segmentation

A New Ensemble Learning Framework for 3D Biomedical Image Segmentation

Arxiv

5+阅读 · 2018年12月10日

Mobile big data analysis with machine learning

Mobile big data analysis with machine learning

Arxiv

6+阅读 · 2018年8月2日

Test-time augmentation with uncertainty estimation for deep learning-based medical image segmentation

Test-time augmentation with uncertainty estimation for deep learning-based medical image segmentation

Arxiv

4+阅读 · 2018年7月19日

End-to-end learning of keypoint detector and descriptor for pose invariant 3D matching

Arxiv

8+阅读 · 2018年5月9日

Cross-Domain Weakly-Supervised Object Detection through Progressive Domain Adaptation

Arxiv

6+阅读 · 2018年3月30日

Fluorescence Microscopy Image Segmentation Using Convolutional Neural Network With Generative Adversarial Networks

Arxiv

18+阅读 · 2018年1月22日

VIP会员

相关主题

相关VIP内容

基于深度神经网络的少样本学习综述

基于深度神经网络的少样本学习综述

专知会员服务

173+阅读 · 2020年4月22日

【Snapchat-谷歌-微软】最新《深度学习文本分类》2020综述论文大全，150+DL分类模型，42页pdf215篇参考文献

【Snapchat-谷歌-微软】最新《深度学习文本分类》2020综述论文大全，150+DL分类模型，42页pdf215篇参考文献

专知会员服务

84+阅读 · 2020年4月9日

Google 发布图片配对基准及挑战：从系列图像重建三维物体和建筑物

Google 发布图片配对基准及挑战：从系列图像重建三维物体和建筑物

专知会员服务

40+阅读 · 2020年4月4日

CVPR 2020 | MetaFuse：用于人体姿态估计的预训练信息融合模型

CVPR 2020 | MetaFuse：用于人体姿态估计的预训练信息融合模型

专知会员服务

25+阅读 · 2020年4月2日

【康奈尔大学-Facebook】特征归一化与数据增强，Feature Normalization

【康奈尔大学-Facebook】特征归一化与数据增强，Feature Normalization

专知会员服务

57+阅读 · 2020年3月9日

最新必读的8篇「小样本学习（few-shot learning）」2020顶会论文和代码

最新必读的8篇「小样本学习（few-shot learning）」2020顶会论文和代码

专知会员服务

240+阅读 · 2020年3月2日

【Google AI】开源NoisyStudent：自监督图像分类

【Google AI】开源NoisyStudent：自监督图像分类

专知会员服务

55+阅读 · 2020年2月18日

【浙江大学】对抗样本生成技术综述

【浙江大学】对抗样本生成技术综述

专知会员服务

92+阅读 · 2020年1月6日

【论文】深度卷积神经网络的ImageNet分类（ImageNet Classification with Deep Convolutional Neural Networks）

【论文】深度卷积神经网络的ImageNet分类（ImageNet Classification with Deep Convolutional Neural Networks）

专知会员服务

14+阅读 · 2020年1月1日

【斯坦福&Google】面向机器人的机器学习，63页PPT

【斯坦福&Google】面向机器人的机器学习，63页PPT

专知会员服务

26+阅读 · 2019年11月19日

热门VIP内容

开通专知VIP会员享更多权益服务

《俄乌战争背景下俄罗斯的战略性海军分析（2022-2025年）》最新100页报告

【斯坦福博士论文】数据、决策与依赖：构建可信人工智能的挑战

人工智能时代背景下的未来海战

接触战中的无人机优势：美军旅级部队面临的小型无人机系统挑战与调整

相关资讯

特征方程的物理意义

特征方程的物理意义

算法与数学之美

6+阅读 · 2019年5月13日

FAIR&MIT提出知识蒸馏新方法：数据集蒸馏

FAIR&MIT提出知识蒸馏新方法：数据集蒸馏

机器之心

7+阅读 · 2019年2月7日

干货——图像分类（上）

干货——图像分类（上）

计算机视觉战队

27+阅读 · 2018年8月28日

干货——图像分类（下）

干货——图像分类（下）

计算机视觉战队

14+阅读 · 2018年8月28日

什么是深度学习的卷积？

什么是深度学习的卷积？

论智

18+阅读 · 2018年8月14日

N维图像的数据增强方法概览

N维图像的数据增强方法概览

论智

5+阅读 · 2018年5月21日

干货 | 深度学习时代的目标检测算法

干货 | 深度学习时代的目标检测算法

AI科技评论

6+阅读 · 2018年3月6日

【计算机视觉必读干货】图像分类、定位、检测，语义分割和实例分割方法梳理

【计算机视觉必读干货】图像分类、定位、检测，语义分割和实例分割方法梳理

GAN生成式对抗网络

5+阅读 · 2018年1月31日

【286页干货】一天搞懂深度学习

【286页干货】一天搞懂深度学习

七月在线实验室

9+阅读 · 2018年1月30日

Reddit热点 | 想看被打码的羞羞图片怎么办？CNN帮你解决

Reddit热点 | 想看被打码的羞羞图片怎么办？CNN帮你解决

AI100

5+阅读 · 2017年12月3日

相关论文

S$^\mathbf{4}$L: Self-Supervised Semi-Supervised Learning

Arxiv

5+阅读 · 2019年5月9日

Data augmentation using learned transforms for one-shot medical image segmentation

Arxiv

5+阅读 · 2019年2月25日

Augmentation for small object detection

Augmentation for small object detection

Arxiv

13+阅读 · 2019年2月19日

PointRCNN: 3D Object Proposal Generation and Detection from Point Cloud

Arxiv

7+阅读 · 2018年12月11日

A New Ensemble Learning Framework for 3D Biomedical Image Segmentation

A New Ensemble Learning Framework for 3D Biomedical Image Segmentation

Arxiv

5+阅读 · 2018年12月10日

Mobile big data analysis with machine learning

Mobile big data analysis with machine learning

Arxiv

6+阅读 · 2018年8月2日

Test-time augmentation with uncertainty estimation for deep learning-based medical image segmentation

Test-time augmentation with uncertainty estimation for deep learning-based medical image segmentation

Arxiv

4+阅读 · 2018年7月19日

End-to-end learning of keypoint detector and descriptor for pose invariant 3D matching

Arxiv

8+阅读 · 2018年5月9日

Cross-Domain Weakly-Supervised Object Detection through Progressive Domain Adaptation

Arxiv

6+阅读 · 2018年3月30日

Fluorescence Microscopy Image Segmentation Using Convolutional Neural Network With Generative Adversarial Networks

Arxiv

18+阅读 · 2018年1月22日

大家都在搜

大型语言模型

蓝牙安全攻防

朱克爱德华兹家族

滴滴司机调度系统实践

微信扫码咨询专知VIP会员