程序员书库(ID:OpenSourceTop)编译
编译自:https://medium.com/applied-data-science/generative-deep-learning-the-parrot-has-landed-b291e6c254e
生成模型是人工智能中最热门的话题之一。
该领域的最新研究表明,该领域的最新进展表明,通过了解机器的行为如何影响其环境,可以让机器在绘画、作曲和完成任务等人类活动方面表现的更加出色。
50年前,尼尔·阿姆斯特朗和巴兹·奥尔德林驾驶驾驶的登月舱“鹰”号降落在月球上。
这是一个充满这坚定的勇气和决心的壮举
50年后,曾经将人类带到月球的阿波罗制导计算机(AGC)的处理能力已经被用于日常生活,事实上,如今的iphone 6的计算能力足以引导1.2亿阿波罗11号飞船飞向月球。
根据摩尔定律,你任意选择一台机器,50年后,将存在一台机器运行速度比他快2²⁵以上,编写AGCdiamante的团队负责人Margaret Hamilton,她把当时的硬件限制当成一项挑战,完成了一件本不可能实现的目标
459天钱,O 'Reilly 邀请David Foster写一本关于生成模型的最新指南,他答应了,他希望自己的这本书能够让读者对生成式深度学习有一个深入的了解,并且在不耗费大量昂贵的计算机资源的条件下,构建出令人惊叹的模型,如今这本书已经出版,并且可以在O 'Reilly 网站上免费阅读
《Generative Deep Learning》
这本书是关于生成模型的实用指南。
它将带你了解构建生成模型的基本原理,然后逐渐深入主题,构建更加复杂的模型,全书充满许多实际示例、架构图和示例代码
这本书适合任何想要深入了解当前热门的生成模型的人。
你不需要具备深度学习的基础,所有的示例代码都是用Python编写的
作者几乎涵盖了过去5年里所有重要的生成模型,特别重点的都显示在下图的时间轴上:
本书前四章主要介绍构建可生成的深度学习模型所需要的核心技术。
作者在生成模型领域进行了大量的研究,并试图从概率角度解决问题,然后探索了基本概率生成模型的例子,并分析了为什么随着生成任务的增加,可能需要部署深度学习技术
本章介绍了构建更复杂的生成模型所需的深度学习工具和技术,介绍了Keras,这是一个用于构建神经网络的框架,可用于构建和训练一些在文献中发表的最前沿的深度神经网络架构。
在本章中,将介绍第一个生成式深度学习模型——变分自编码器。
这一强大的技术将允许我们从头开始生成逼真的面孔,并改变现有的图像——例如,添加一个微笑或改变某人头发的颜色。
本章探讨了近年来最流行的生成模型技术之一的生成对抗网络。
这个用于构建生成模型问题的优雅框架是许多先进生成模型的底层引擎。
第二部分提供了一组案例研究,展示了生成建模技术如何应用于特定的任务。
在本章中,研究了两种与机器绘画有关的技术。
首先我们来看看CycleGAN,顾名思义,它是GAN架构的一种,允许模型学习如何将照片转换成特定风格的绘画。
同时还探索了包含在许多照片编辑应用程序中的神经风格转换技术,它允许你将一幅画的风格转换到一张照片上,给人一种这是出自同一位艺术家的错觉。
在本章中,作者将注意力转向机器写作,介绍了递归神经网络(RNN)结构,它允许我们处理涉及序列数据的问题。
我们还将了解encoder–decoder体系结构是如何工作的,并构建一个问答生成器。
本章着眼于音乐生成,这也是一个序列生成问题,但有更高的挑战,如建模音乐的音高和节奏。
我们将了解如何将许多用于文本生成的技术应用到这个领域,同时还将探索一个称为MuseGAN的深度学习结构,它将第4章(关于GAN)中的思想应用于音乐数据。
本章展示了生成模型如何应用于其他机器学习领域,比如强化学习。
这是对当前生成模型的概述,并回顾了在本书中介绍的技术。
同时还将放眼未来,探索今天可用的最顶级技术如GPT-2和BigGAN会如何改变我们创作方式,我们是否能创造一个机器人,它可以创造出可与先人媲美的艺术作品、文学和音乐等。
本章总结了为什么生成式深度学习在未来5-10年可能成为机器学习最重要和最有影响力的领域。
在这个现实和虚幻不那么容易区分的世界里,难能可贵的是有一些工程师依然能够深入理解生成模型的工作原理,并且不会因为技术限制而退却。
本书可以帮助你了解当下最先进的技术,同时让你享受阅读的乐趣,最后附上本书相关地址:
在线阅读地址:
https://github.com/davidADSP/GDL_code
本书完整代码:
https://www.oreilly.com/library/view/generative-deep-learning/9781492041931
编号872,输入编号直达本文
●输入m获取到文章目录
程序员书库