成熟的目标检测，也该自己学习数据增强策略达到SOTA了

2019 年 6 月 28 日 机器之心

机器之心报道

参与：思源、一鸣、李亚洲

只要数据增强就能在 COCO 数据集上达到当前最优，谷歌大脑 Quoc Le 等研究者表明，目标检测中各种高大上的正则化方法，都不如自动数据增强来的实在。

2018 年，谷歌大脑的研究者在 arXiv 上发表论文，提出一种自动搜索合适数据增强策略的方法 AutoAugment。该方法创建一个数据增强策略的搜索空间，利用搜索算法选取适合特定数据集的数据增强策略，从而在 ImageNet、CIFAR 等分类任务上取得了极好的表现。

今日，这支团队再次宣布开源面向目标检测的数据增强策略。

本文作者之一，谷歌大脑的创始成员、AutoML 的缔造者之一 Quoc Le 在 Twitter 上表示，该策略能够极大的已经检测模型在他们基准上的表现。

论文链接：https://arxiv.org/abs/1906.11172
Github 链接：https://github.com/tensorflow/tpu/tree/master/models/official/detection

Quoc Le 等研究者表示，尽管数据增强能极大的改进图像分类表现，但它在目标检测任务上的效果还未被透彻研究过。此外，目标检测所用图像的注释会造成大量的成本，所以数据增强对此计算机视觉任务的影响可能会更大。在此研究中，作者们研究了数据增强在目标检测上的影响。

在 COCO 数据集上的实验结果说明，优化后的数据增强策略将检测准确率提升了超过 2.3 mAP，使单推理模型能够达到最佳效果——50.7 mAP。重要的是，COCO 数据集上发现的这种最佳策略可以直接迁移到其他目标检测数据集上，同样可以提升预测准确率。

左图为 COCO 数据增强示例，右图为带（红色）或不带（黑色）学习的数据增强策略效果。

研究结果说明，在目标检测方面，学习数据增强策略比最好的模型结构正则化更有效，即使在基线模型本身就很强的情况下也是如此。

目标检测中的自动数据增强

最近的研究显示，与其手动设计数据增强策略，不如让模型从数据中学习优化策略。这样可以显著提升模型在图像分类中的泛化表现。那么，是否可以直接将图像分类中的数据增强方法迁移到目标检测中？或者说找到一种新的学习方案让模型自己决定该怎样做数据增强？

在这项研究中，研究人员建立了一些可以用在目标检测数据集上的数据变换策略，并将这些策略迁移到其他检测数据集和模型结构上。研究人员使用的变换策略包括一些可以在整张图像中使用，但是不会影响边界框位置的方法（例如，从图像分类中借鉴的色彩变换策略）、也有通过改变边界框位置从而影响整个图像的策略（例如，翻转或裁剪图像），以及一些只对边界框内的目标产生影响的变换策略。

当变换策略的数量变得较大时，人为地结合不同的策略变得难以追踪。因此，研究人员只搜索针对目标检测数据集的策略。实验说明，这种策略在不同的数据集、不同的数据集大小、不同的模型结构和检测算法上都达到了非常好的效果。另外，研究人员探究了搜索空间中操作数量不同时，数据增强策略的表现，以及在不同数据集大小下增强技术的效果。

方法概要

研究人员将增强搜索视为视为离散的最优化问题，它的优化目标主要是增强策略的泛化性能。

他们定义一个增强策略为一个无序的、有 K 个子策略的集合。在训练中随机选择子策略中的一个，并在当前图像中使用。每个子策略都有 N 个图像变换过程，它们依次应用到不同的图像上。通过创建搜索空间，研究人员将搜索一个学习增强策略的问题转换为离散的最优化问题。

在这篇论文中，搜索空间由 K = 5 个子策略构成，每个子策略有 N = 2 个操作，依照顺序对单一图像进行处理。此外，每个操作都和两个超参数有关，这两个超参数定义了采用操作的概率，以及操作的大小。如下所示，图 2 展示了 5 个学习到的子策略。

学习数据增强子策略的例子。一张样本图像使用 5 个学习子策略，每列是对应不同子策略的随机样本。每个增强子策略都由三元组构成，包括操作、应用概率以及大小度量。为了确保边界框与增强策略保持一致，可以调整边界框位置。

在一些基本实验中，研究人员发现了在搜索空间中发现了 22 种对目标检测有收益的操作。这些操作可以简要总结为：

颜色操作：扭曲颜色通道，不改变边界框位置（例如，均衡化、对比化、改变亮度）。
几何操作：几何扭曲图像，相对的也改变边界框标注的位置和大小（例如，旋转、剪切 X、转换 Y 等）。
边界框操作：只改变边界框标注内的像素内容（例如，只在 BBox 内均衡化、只在 BBox 内旋转、只在 BBox 内翻转）。

实验结果

研究者将自动增强方法应用到 COCO 数据集上，他们希望能找到一种可以泛化到其它目标检测数据集上的增强策略，且模型只需要使用普通的 ResNet-50 和 RetinaNet 就行。研究者使用 COCO 数据集上搜索到的最优策略，并迁移到不同的数据集大小和架构配置以检验其泛化性。

在如下表 1 中，学习到的自动增强策略在不同的骨架网络上都能获得对应的性能提升，后续的实验都使用 ResNet-50 作为检测器的骨架网络。

表 1：所有结果和性能增益都是在 RetinaNet 检测器和 COCO 数据集上测试获得的。

如下表 2 所示，为了更好地理解性能增益都来自哪些方面，研究者将数据增强策略拆为三部分：色彩操作、几何操作和 bbox-only 操作。

表 2：通过学习到的增强策略提升目标检测的性能，所有结果都是在 COCO 数据集上应用 RetinaNet 检测器和 ResNet-50 骨干网络获得的。注意其中 DropBlock 为应用了当前最优的正则化方法，从而获得比较不错的性能提升。

如下图 3 所示，正如研究者所预期的，学习的数据增强策略在训练集非常小时，它获得的性能增益会非常大。

图 3：根据不同的目标样本数量，数据增强策略在 mAP 上的提升百分比。

如下表 4 所示，当使用数据增强策略训练时，研究人员不改变任何训练参数，只将从 COCO 数据集上发现的策略在数据预处理中使用。这使得 mAP50 提升了 2.7 个百分点。

表 4：将学习到的增强策略迁移到其他目标检测数据集上。其中 mAP 都是在 PASCAL VOC 2007 数据集上，使用 Faster R-CNN 检测器的 ResNet-101 模型进行训练和评价获得的。

深度Pro

理论详解 | 工程实践 | 产业分析 | 行研报告

机器之心最新上线深度内容栏目，汇总AI深度好文，详解理论、工程、产业与应用。这里的每一篇文章，都需要深度阅读15分钟。

今日深度推荐

CVPR 2019提前看：少样本学习专题

ICLR 2019论文解读：量化神经网络

万字长文带你解读NLP深度学习的各类模型

点击图片，进入小程序深度Pro栏目

PC点击阅读原文，访问官网

更适合深度阅读

www.jiqizhixin.com/insight

每日重要论文、教程、资讯、报告也不想错过？

点击订阅每日精选

登录查看更多

相关内容

数据增强

关注 31

数据增强在机器学习领域多指采用一些方法（比如数据蒸馏，正负样本均衡等）来提高模型数据集的质量，增强数据。

最新《多任务学习》综述，39页pdf

专知会员服务

266+阅读 · 2020年7月10日

近期必读的六篇计算机视觉顶会ECCV 2020【目标检测】相关论文

专知会员服务

59+阅读 · 2020年7月7日

【CVPR2020】通过获取高质量的关键点对来提升目标检测性能

专知会员服务

44+阅读 · 2020年6月30日

1750亿参数！GPT-3来了！31位作者，OpenAI发布小样本学习器语言模型

专知会员服务

73+阅读 · 2020年5月30日

【CVPR2020】我们能用强化学习来学习图模型推断的启发规则吗?

专知会员服务

43+阅读 · 2020年5月5日

【Google 大脑】使用上千个优化任务学习超参数搜索策略，Using a thousand optimization tasks to learn hyperparameter search strategies

专知会员服务

18+阅读 · 2020年3月14日

【Google AI-Luong】无标记数据学习, 83ppt, learning from Unlabeled Data

专知会员服务

90+阅读 · 2020年3月5日

图像分类最新技术综述论文: 21种半监督、自监督和无监督学习方法一较高低

专知会员服务

185+阅读 · 2020年2月22日

重磅！Geoffrey Hinton新论文「视觉表示对比学习简单框架」自监督学习建立新SOTA-ImageNet准确率76.5%

专知会员服务

33+阅读 · 2020年2月15日

【何恺明团队新论文】PointRend:将图像分割视作渲染问题，性能显著提升！

专知会员服务

28+阅读 · 2019年12月19日

刷新COCO目标检测纪录！谷歌只靠AI扩增数据，就把一个模型变成SOTA，已开源

极市平台

5+阅读 · 2019年7月2日

已删除

将门创投

12+阅读 · 2019年7月1日

伯克利提出数据增强新方法，计算速度提升1000倍

AI前线

12+阅读 · 2019年6月21日

已删除

将门创投

6+阅读 · 2019年6月10日

一种小目标检测中有效的数据增强方法

极市平台

119+阅读 · 2019年3月23日

简单到出人意料的CNN图像分类策略

机器学习算法与Python学习

4+阅读 · 2019年2月14日

谷歌推出新型数据增强算法：AutoAugment

论智

20+阅读 · 2018年6月6日

【学界】谷歌大脑提出自动数据增强方法AutoAugment：可迁移至不同数据集

GAN生成式对抗网络

11+阅读 · 2018年6月5日

谷歌放大招！数据增强实现自动化

新智元

8+阅读 · 2018年6月4日

学界 | 谷歌大脑提出自动数据增强方法AutoAugment：可迁移至不同数据集

机器之心

3+阅读 · 2018年6月2日

Self-Supervised Learning For Few-Shot Image Classification

Arxiv

19+阅读 · 2019年11月14日

Self-training with Noisy Student improves ImageNet classification

Arxiv

15+阅读 · 2019年11月11日

NAS-FPN: Learning Scalable Feature Pyramid Architecture for Object Detection

Arxiv

7+阅读 · 2019年4月16日

Prime Sample Attention in Object Detection

Arxiv

13+阅读 · 2019年4月9日

Libra R-CNN: Towards Balanced Learning for Object Detection

Arxiv

7+阅读 · 2019年4月4日

Pooling Pyramid Network for Object Detection

Arxiv

6+阅读 · 2018年7月9日

Learning Rich Features for Image Manipulation Detection

Arxiv

9+阅读 · 2018年5月13日

Single-Shot Object Detection with Enriched Semantics

Arxiv

11+阅读 · 2018年4月8日

End-to-End Multi-Task Learning with Attention

Arxiv

19+阅读 · 2018年3月28日

Collaborative Learning for Weakly Supervised Object Detection

Arxiv

9+阅读 · 2018年2月10日

VIP会员