刷新ImageNet纪录，GAN不只会造假！DeepMind用它做图像分类，秒杀职业分类AI

会员服务 ·

刷新ImageNet纪录，GAN不只会造假！DeepMind用它做图像分类，秒杀职业分类AI

2019 年 7 月 9 日 量子位

栗子边策发自凹非寺
量子位报道 | 公众号 QbitAI

往日，GAN的光芒几乎全部集中在生成的图像上。

生成不存在的妹子。

△ 来自英伟达StyleGAN

生成不存在的老婆。

△ 来自英伟达StyleGAN

甚至进化到帮妹子脱衣服的程度。

但现在不同了。

DeepMind的两位大佬，改造了“史上最强”的BigGAN，让新的算法去做图像分类，刷新了ImageNet无监督表征学习的纪录。

换句话说，半路出家的BigBiGAN，秒杀了一众专注分类20年的AI选手。

△我有主角光环

同时，它生成的图像质量依然优秀。

不过，如果你只当它是BigGAN的升级版，就太单纯了。

我不叫BigBigGAN

GAN之父Ian Goodfellow帮团队划了波重点：

它叫BigBiGAN，不是BigBigGAN。

Bi是双向 (Bidirectional) 的意思，是说它又有编码器，又有生成器。

我开始也看成BigBig了。

那么，就从这里开始讲原理吧。

给GAN加上编码器的想法，是从自家前辈BiGAN那里继承的：

在原始的GAN架构里，生成器是个前馈映射，从随机取样的潜变量 (也叫噪音) ，映射到生成的数据 (假图) 上面。

而编码器把真实数据 (真图) 映射到潜变量上。这样就有了两种不同方向的映射，成了双向GAN。

其实，从前BiGAN也在ImageNet上做过图像分类。但团队说，BiGAN的生成器是DCGAN里面的那种，生成不了高质量的图像，这样编码器学到的语义就会受影响。

所以，研究人员便决定让BiGAN的编码器，和BigGAN的生成器相爱了。

但如果只是这样，并不会幸福的。

别忘了，判别器也是GAN的重要部分，它不断看穿生成器的作品，才让对方生产的假图越来越逼真。

而判别器自身就是一个强大的神经网络，团队希望它可以在“语义 (Semantic) ”层面强调图像的重构误差，而不要太在意底层细节。

照这个目标出发，团队开发了一个“联合判别器” (Joint Discriminator) 。

和普通的判别器不同，它的输入不只是图像数据 (真图与假图) ，而是图像数据+潜变量的成对数据。

那么，它要区分的不是真图和假图，而是真图与潜变量组成的对子 (来自编码器) ，和假图与潜变量组成的对子 (来自生成器) 。

虽然，新算法的名字BigBiGAN，并没有体现出生成器的独特，但有了它才是完整的BigBiGAN：

那么，现在来看一下成绩吧。

打破ImageNet纪录

在ImageNet图像分类任务上，BigBiGAN成为了无监督算法中的地表最强。

与现有的监督逻辑回归分类器相比，BigBiGAN将ImageNet的top-1准确率提高到了61.3%。

作为一只合格的GAN，BigBiGAN当然有制造“假照片”的功能。

从无监督的BigBiGAN模型中选择的图像重建的结果。第一行是真实图像；第二行是根据上面图像x的重建图像。

不同于大多数GAN，比如BigGAN那样像素级的图像重建，BigBiGAN更重视高层的表征学习，也就更适合图像分类任务。

论文还写到，消融实验证明了：强大的生成模型有助于学习表征，而强大的推理能力，反过来也能提升大规模生成模型的表现。

瞻仰BigBiGAN，论文在此：

https://arxiv.org/abs/1907.02544

前辈BigGAN：
https://arxiv.org/abs/1809.11096

前辈BiGAN：
https://arxiv.org/abs/1605.09782

p.s.全都来自一个团队哟。

— 完 —

AI社群 | 与优秀的人交流

小程序 | 全类别AI学习教程

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「在看」吧 !

登录查看更多

相关内容

GAN

关注 91

GAN：生成性对抗网，深度学习模型的一种，在神经网络模型中引入竞争机制，非常流行。

【伯克利】最新《生成式对抗网络》技术综述课程，257页ppt带你学习GAN进展

专知会员服务

194+阅读 · 2020年5月3日

【CVPR2020-Facebook AI】前置不变表示的自监督学习

专知会员服务

47+阅读 · 2020年4月19日

图像分类最新技术综述论文: 21种半监督、自监督和无监督学习方法一较高低

专知会员服务

185+阅读 · 2020年2月22日

【Google AI】开源NoisyStudent：自监督图像分类

专知会员服务

55+阅读 · 2020年2月18日

重磅！Geoffrey Hinton新论文「视觉表示对比学习简单框架」自监督学习建立新SOTA-ImageNet准确率76.5%

专知会员服务

33+阅读 · 2020年2月15日

【斯坦福大学】场景图谱表示在计算机视觉中的应用，41页ppt

专知会员服务

52+阅读 · 2020年1月8日

【GAN】生成式对抗网络GAN在语音自然语言处理中的应用，台大李宏毅老师，附247页ppt下载

专知会员服务

115+阅读 · 2019年11月26日

【论文】自训练噪声student模型提高ImageNet分类准确率（Self-training with Noisy Student improves ImageNet classification），谷歌研究科学家Quoc V. Le等

专知会员服务

24+阅读 · 2019年11月20日

【CCL 2019】特邀报告，语言与视觉多模态智能的进展，京东AI研究院常务副院长何晓冬

专知会员服务

49+阅读 · 2019年11月11日

GANs最新综述论文: 生成式对抗网络及其变种如何有用

专知会员服务

72+阅读 · 2019年10月19日

OpenAI科学家一文详解自监督学习

新智元

18+阅读 · 2019年11月20日

GAN用于无监督表征学习，效果依然惊人……

机器之心

12+阅读 · 2019年7月9日

DeepMind爆出无监督表示学习模型BigBiGAN，GAN之父点赞！

新智元

13+阅读 · 2019年7月9日

刷新COCO目标检测纪录！谷歌只靠AI扩增数据，就把一个模型变成SOTA，已开源

极市平台

5+阅读 · 2019年7月2日

生成逼真3D人偶，居然不用3D形状建模，还能学会你的舞步 | 三星CVPR Oral

量子位

9+阅读 · 2019年6月10日

能生成逼真图像的不只有 GAN

机器学习算法与Python学习

8+阅读 · 2019年6月6日

刷新三项COCO纪录！姿态估计模型HRNet开源了，中科大微软出品 | CVPR

量子位

11+阅读 · 2019年2月28日

用英伟达StyleGAN生成老婆吧，他生成了一百多只明日香 | 开源代码

量子位

7+阅读 · 2019年2月13日

GAN做图像翻译的一点总结

PaperWeekly

4+阅读 · 2017年12月26日

【Ian Goodfellow盛赞】一个GAN生成ImageNet全部1000类物体

GAN生成式对抗网络

11+阅读 · 2017年11月22日

Self-training with Noisy Student improves ImageNet classification

Arxiv

15+阅读 · 2019年11月11日

Revisiting CycleGAN for semi-supervised segmentation

Arxiv

3+阅读 · 2019年8月30日

Integrating Semantic Knowledge to Tackle Zero-shot Text Classification

Arxiv

6+阅读 · 2019年3月29日

Pixel Level Data Augmentation for Semantic Image Segmentation using Generative Adversarial Networks

Arxiv

5+阅读 · 2019年2月8日

Rethinking ImageNet Pre-training

Arxiv

8+阅读 · 2018年11月21日

Hypernetwork Knowledge Graph Embeddings

Arxiv

9+阅读 · 2018年10月18日

Sem-GAN: Semantically-Consistent Image-to-Image Translation

Arxiv

4+阅读 · 2018年7月12日

HyperDense-Net: A hyper-densely connected CNN for multi-modal image segmentation

Arxiv

6+阅读 · 2018年4月9日

Learning Inverse Mappings with Adversarial Criterion

Arxiv

3+阅读 · 2018年3月21日

Big Data: Understanding Big Data

Arxiv

6+阅读 · 2016年1月15日

VIP会员