【导读】生成式对抗网络模型(GANs)是基于深度学习的一种强大的生成模型,是一类机器学习技术,它由两个同时训练的模型组成:一个(生成器)训练生成假数据,另一个(鉴别器)训练从真实例子中辨别假数据,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。牛津大学Jakub Langr 撰写了《GANs in Action Deep learning with Generative Adversarial Networks》的著作,囊括了关于GAN的定义、训练、变体等,全面叙述关于当下AI最重要的技术之一GAN的著作,是学习生成式对抗网络非常好的学习图书,是关于GAN的最好的书籍之一。
在线网址查看:
https://www.manning.com/books/gans-in-action
实战GAN
深度学习系统在识别文本、图像和视频中的模式方面做得非常好。但事实证明,创建逼真的图像、自然的句子和段落,或翻译成地道英语的应用程序是难以实现的。生成式对抗网络(GANs)通过将两个相互对抗的神经网络(一个生成内容,另一个拒绝质量较差的样本)配对,为这些挑战提供了一个有希望的解决方案。
GAN
GANs已经取得了被认为是人工系统不可能取得的显著成果,例如能够生成逼真的人脸、将涂鸦变成类似照片的图像、将马的视频片段变成奔跑的斑马。最重要的是,GANs学得很快,不需要费力地标注大量训练数据。
2014年由谷歌的Ian Goodfellow发明的生成式对抗网络(GANs)是深度学习中最重要的创新之一。在GANs中,一个神经网络(生成器)生成内容(图像、句子等等),另一个神经网络(识别器)确定它们是否来自生成器,因此是“假的”,还是来自训练数据集,因此是“真实的”。在这两个系统之间的相互作用中,当生成器试图欺骗鉴别器相信“赝品”是真实的时,它会产生更真实的输出。其结果是一个可以生成逼真图像或自然文本和语音的生成器,以及一个训练有素的识别器,可以精确地识别和分类这类内容。
本书简介
实战GAN:用生成对抗式网络进行深度学习可以教会你如何构建和训练自己的生成对抗式网络。首先,您将了解生成模型以及GAN的工作原理,并概述它们的潜在用途。然后,随着您探索GAN体系结构的基础:生成器和鉴别器网络,您将开始构建自己的简单的对抗系统。
通过本书迷人的示例和详细的插图,您将学习为不同的场景培训不同的GAN体系结构。您将探索生成高分辨率图像、图像到图像的转换、对抗性学习以及目标数据生成,从而使您的系统变得智能、有效和快速。
GANs介绍
机器能否思考的概念比计算机本身还要古老。1950年,著名的数学家、逻辑学家和计算机科学家艾伦·图灵(Alan turing)撰写了一篇论文,题为《计算机器与智能》(Computing Machinery and Intelligence),这篇论文将使他的名字永世留名。
图灵在论文中提出了一种被他称为“模仿游戏”的测试方法,这种测试现在被称为“图灵测试”。在这个假想的场景中,一个不知情的观察者在一扇紧闭的门后与两个同伴交谈:一个是人类同伴;另一个是电脑。图灵认为,如果观察者不能分辨出哪个是人,哪个是机器,那么这台计算机就通过了测试,必须被认为是智能的。
任何试图与自动化聊天机器人或语音智能助手进行对话的人都知道,要通过这个看似简单的测试,计算机还有很长的路要走。然而,在其他任务中,计算机不仅能与人类的表现相媲美,而且还超越了人类——即使是在一些直到最近才被认为是最聪明的算法也无法企及的领域,比如般精确的人脸识别或围棋,计算机也可以胜任了。
机器学习算法非常擅长识别现有数据中的模式,并将这种洞察力用于分类(为示例分配正确的类别)和回归(根据各种输入估计数值)等任务。然而,当被要求生成新数据时,计算机却表现不佳。一种算法可以打败国际象棋大师,估计股票价格走势,并对信用卡交易是否可能存在欺诈行为进行分类。相比之下,任何试图与亚马逊(Amazon)的Alexa或苹果(Apple)的Siri闲聊的尝试都是注定要失败的。的确,人类最基本、最基本的能力——包括愉快的交谈或原创的制作——可以让最复杂的超级计算机陷入数字痉挛。
这一切都在2014年发生了改变,当时在蒙特利尔大学读博士的Ian Goodfellow发明了生成式对抗网络(GANs)。这项技术使计算机能够通过使用两个而不是一个单独的神经网络来生成真实的数据。GANs并不是第一个用来生成数据的计算机程序,但它们的结果和通用性使它们有别于其他所有程序。GANs取得了明显的成效,长期以来一直被认为是几乎不可能的人工系统,如生成与real-world-like假图像质量的能力,将一个潦草变成photograph-like形象,或把视频的一匹马变成一个运行zebra-all不需要——大批煞费苦心地标记的训练数据。
在GANs的帮助下,机器数据生成技术已经取得了很大的进步,一个生动的例子就是人脸的合成,如图所示。就在2014年,当GANs被发明出来的时候,机器所能产生的最好的效果就是模糊的面部表情——甚至连这都被视为突破性的成功。仅仅三年后的2017年,GANs成像技术的进步使计算机能够合成质量堪比高分辨率人像照片的假面。在这本书中,我们探究了使这一切成为可能的算法的底层。
生成式对抗网络(GANs)是一类机器学习技术,它由两个同时训练的模型组成:一个(生成器)训练生成假数据,另一个(鉴别器)训练从真实例子中辨别假数据。
目录:
2 AUTOENCODERS AS A PATH TO GANS
3 YOUR FIRST GAN: GENERATING HANDWRITTEN DIGITS
4 DEEP CONVOLUTIONAL GAN (DCGAN)
5 TRAINING & COMMON CHALLENGES: GANING FOR SUCCESS
5.2.5 Summary of game setups
6 PROGRESSING WITH GANS
6.1 Latent space interpolation
7 SEMI-SUPERVISED GAN
8 CONDITIONAL GAN
8.3.3 The Generator
8.3.4 Build the Model
8.3.5 Training
8.3.6 Outputting Sample Images
8.3.7 Train the Model
8.4 Inspecting the Output: Targeted Data Generation
8.5 Conclusion
8.6 Summary
9 CYCLEGAN
9.1 Introduction
9.2 Image-to-Image Translation
9.3 Cycle Consistent Loss: there and back aGAN
9.4 Adversarial Loss
9.7 CycleGAN architecture: building the network
9.15 Applications
9.16 Summary
10 ADVERSARIAL EXAMPLES
10.1 Introduction
10.2 Context of Adversarial Examples
10.3 Lies, Damned Lies and Distributions
10.4 Use and abuse of training
10.5 Signal and the noise
10.6 Not all hope is lost
10.7 Conclusion
10.8 Summary
11 PRACTICAL APPLICATIONS OF GANS
11.1 Introduction
11.2 GANs in Medicine
11.2.1 Using GANs to Improve Diagnostic Accuracy
11.3 GANs in Fashion
11.3.1 Using GANs to Design Fashion
11.4 Conclusion
11.5 Summary
12 LOOKING AHEAD
12.1 Introduction
12.2 Ethics
12.3 GAN Innovations
12.4 Relativistic GAN (RGAN)
12.4.1 Application
12.5 Self-Attention GAN (SAGAN)
12.5.1 Application
12.6 BigGAN
12.6.1 Application
12.7 Further reading
12.8 Looking Back & Closing Thoughts
12.9 Conclusion
12.10 Summary
APPENDIXES
GANs in Action 代码
地址:
https://github.com/GANs-in-Action/gans-in-action
便捷下载,请关注专知公众号(点击上方蓝色专知关注)
后台回复“GANs” 就可以获取《GANs in Action Deep learning with Generative Adversarial Networks》电子书下载链接索引~