【业界】Ian Goodfellow专访:我为什么可以在一夜之间创建GAN

2018 年 10 月 16 日 GAN生成式对抗网络

选自hackernoon

编译:机器之心

作者:Sanyam Bhutani

参与:张倩、刘晓坤


本文是关于 GAN 之父——Ian Goodfellow 的采访。在访谈中。Goodfellow 分享了自己创建 GAN 的历程、学习和研究的心得、对机器学习现状的看法以及在谷歌工作的经历,还给深度学习的入门者提出了一些建议。


Sanyam Bhutani:您好,GAN 之父,感谢您接受此次采访。


Ian Goodfellow:不客气!非常感谢您来采访我,也感谢您撰写采访博客为其他学生提供帮助。


Sanyam Bhutani:您现在是谷歌的研究科学家,还发明了深度学习领域最令人振奋的工具——GAN。您能不能谈谈您是怎么开始的?是什么激发了您对深度学习的兴趣?


Ian Goodfellow:那时候我还是一名人工智能专业的本科生,当时机器学习主要是支持向量机(SVM)、增强树等。此外,我还是一名业余游戏程序员,用 OpenGL 着色器语言制作一些业余项目。我在 Zoox 工作的朋友 Ethan Dreyfuss 告诉我两件事情,一是 Geoff Hinton 在谷歌关于深度信念网络的科技演讲,二是当时新出的 CUDA GPU。


显然,当时的深度学习可以在很大程度上消除我对 SVM 的抱怨。用 SVM 设计模型自由度很低。扔给 SVM 更多资源也无法轻易让它变得很聪明。但深度神经网络却有越大越好用的发展趋势。同时,CUDA GPU 可以帮助我们训练更大的神经网络,而且由于做游戏编程,我已经学会了写 GPU 代码。


寒假期间,我和 Ethan 在斯坦福创建了第一个 CUDA 机(据我所知是第一个),那时我开始训练玻尔兹曼机。


Sanyam Bhutani:您刚刚提到,您在一夜之间就编写了第一个 GAN 模型,但取得研究突破通常需要耗费数年,或至少几个月的时间。您能否谈谈是什么帮助您在那么短的时间就实现那么大的突破呢?


Ian Goodfellow:如果你有良好的相关编程基础,那么快速实现自己的想法将变得非常简单。几年来,我和我的同事一直在致力于软件库的开发,我曾用这些软件库来创建第一个 GAN、Theano 和 Pylearn2。第一个 GAN 几乎是复制-粘贴我们早先的一篇论文《Maxout Networks》中的 MNIST 分类器。即使是 Maxout 论文中的超参数对 GAN 也相当有效,所以我不需要做太多的新工作。而且,MNIST 模型训练非常快。我记得第一个 MNIST GAN 只花了我一个小时左右的时间。


Sanyam Bhutani:自创建以来,GAN 已经取得了显著进展,您对哪个最感兴趣?


Ian Goodfellow:很难选。Emily Denton 和 Soumith Chintala 的 LAPGAN 让我第一次知道 GAN 在往「大」的方向发展。当然,LAPGAN 只走出了一小步。


Sanyam Bhutani:除了 GAN,您认为深度学习研究还有哪个领域比较有前景?


Ian Goodfellow:我多数时间都在研究对抗样本的鲁棒性。我认为这点对于在安全性要求比较高的场景中使用深度学习非常重要。我还希望它能够帮助我们更好地理解深度学习。


Sanyam Bhutani:对于那些希望有一天在谷歌工作并且对深度学习研究感兴趣的读者和初学者,您有什么建议吗?


Ian Goodfellow:开始阶段要扎实地打好基础:编程、调试、线性代数、概率论。与了解非常前沿的工作相比,大多数前沿研究项目更需要扎实的基础知识和技能。例如,今天我正在解决一个妨碍我运行一个实验的内存泄露问题,同时试图加速一个软件库的单元测试,以更快地尝试更多的研究 idea。我在本科和博士早期阶段曾经多次向吴恩达寻求建议,他经常告诉我要彻底精通这些基础知识和技能。我曾经觉得这实在很无聊,并希望他能建议我去学习超实数或类似的东西。但几年以后,我发现当初那些建议实在太正确了。


Sanyam Bhutani:您能告诉我们在谷歌研究所的一天是什么样子的吗?


Ian Goodfellow:这因人而异,甚至对于同一个人而言在生涯的不同时刻也是不同的。我有一段时间几乎只在写代码,跑实验,读文献。还有一段时间几乎只在写《深度学习》这本书。我有一段时间几乎只是每天跑几个会议,办理登记手续,这些会议都是关于很多不同的项目。如今,我正尝试按 6:4 的比例分配时间,即 6 成的时间用于监督其它的项目,4 成的时间用于直接开发我自己的项目。


Sanyam Bhutani:人们普遍认为需要大量的资源才能在深度学习中得到效果显著的结果。您认为某个不能拥有和在谷歌工作的人一样的资源条件的人,是否能对这个领域做出杰出的贡献?


Ian Goodfellow:无疑可以的,但你需要恰当地选择你的研究项目。例如,证明一个有趣的理论结果可能不需要任何计算资源。设计一个可以从极端小量数据泛化得很好的新算法可能需要一些资源,但不会像在大规模数据集上训练那么多。尽管如此,如果没有大量的并行计算资源,尝试开发全世界最快的 ImageNet 分类器可能不是个好主意。


Sanyam Bhutani:在深度学习的学术领域突飞猛进的今天,您如何保持不落后于研究前沿?


Ian Goodfellow:不久之前,我总是紧跟深度学习研究的任何新进展,尤其是在我写那本《深度学习》的时候。如今看来似乎已经不可行了,我基本上只关注那些和我自己的研究相关的课题。我甚至不知道 GAN 领域发生的 everything。


Sanyam Bhutani:您是否认为机器学习已经被过度炒作?


Ian Goodfellow:从 ML 的长期潜力来看,实际上我认为机器学习仍然没被过度炒作。因为从某个角度看来,在技术行业之外的人们谈论机器学习的热度并没有我想象的那么高。但我也认为机器学习经常被「错误炒作」:人们经常夸大如今已有的技术水平,或夸大某个项目的进步意义,等等。


Sanyam Bhutani:您认为博士或硕士学位对做深度学习研究是否有必要,或者非专业人员是否可能在这个领域做出成绩?


Ian Goodfellow:我确实认为发展专业技能是很重要的,但我不认为博士学位是获得这种专业技能的唯一方式。最优秀的 PhD 学生通常是非常自我导向型的学习者,只要有足够的学习时间和自由,就能在任何工作中进行这种学习。


Sanyam Bhutani:在我们结束之前,您能给那些对如何入门深度学习感到不知所措的初学者提一些建议吗?


Ian Goodfellow:从简单的项目开始,并且只复现那些你已经知道应该可行的项目,例如 CIFAR-10 分类器。很多人想在一开始就直接做出新的东西来,但这样其实很难弄清楚导致项目不可行的原因究竟是你的 idea,还是对某些已知东西的错误理解。我确实认为动手做一个项目很重要,尽管深度学习有点像开飞机。你做大量的阅读,但你也需要获得动手实践的经验,以学习深度学习更加直观的层面。


原文链接:https://hackernoon.com/interview-with-deep-learning-researcher-and-the-ganfather-dr-ian-goodfellow-cd300863ecff


高质量延伸阅读

☞ OpenPV平台发布在线的ParallelEye视觉任务挑战赛

【学界】第1届“智能车辆中的平行视觉”研讨会成功举行

【学界】生成式对抗网络:从生成数据到创造智能

【学界】OpenPV:中科院研究人员建立开源的平行视觉研究平台

【学界】基于平行视觉的特定场景下行人检测

【学界】ParallelEye:面向交通视觉研究构建的大规模虚拟图像集

【CFP】Virtual Images for Visual Artificial Intelligence

【最详尽的GAN介绍】王飞跃等:生成式对抗网络 GAN 的研究进展与展望

【智能自动化学科前沿讲习班第1期】王飞跃教授:生成式对抗网络GAN的研究进展与展望

【智能自动化学科前沿讲习班第1期】王坤峰副研究员:GAN与平行视觉

【重磅】平行将成为一种常态:从SimGAN获得CVPR 2017最佳论文奖说起

【平行讲坛】平行图像:图像生成的一个新型理论框架

【学界】基于生成对抗网络的低秩图像生成方法

【学界】Ian Goodfellow等人提出对抗重编程,让神经网络执行其他任务

【学界】六种GAN评估指标的综合评估实验,迈向定量评估GAN的重要一步

【资源】T2T:利用StackGAN和ProGAN从文本生成人脸

【学界】 CVPR 2018最佳论文作者亲笔解读:研究视觉任务关联性的Taskonomy

【业界】英特尔OpenVINO™工具包为创新智能视觉提供更多可能

【学界】ECCV 2018: 对抗深度学习: 鱼 (模型准确性) 与熊掌 (模型鲁棒性) 能否兼得 

登录查看更多
0

相关内容

GAN:生成性对抗网,深度学习模型的一种,在神经网络模型中引入竞争机制,非常流行。
Yann Lecun 纽约大学《深度学习(PyTorch)》课程(2020)PPT
专知会员服务
179+阅读 · 2020年3月16日
GANs最新综述论文: 生成式对抗网络及其变种如何有用
专知会员服务
70+阅读 · 2019年10月19日
生成式对抗网络GAN异常检测
专知会员服务
114+阅读 · 2019年10月13日
GAN新书《生成式深度学习》,Generative Deep Learning,379页pdf
专知会员服务
202+阅读 · 2019年9月30日
为什么说GAN很快就要替代现有摄影技术了?
GAN生成式对抗网络
5+阅读 · 2019年3月12日
【GAN】2018最佳生成性对抗网络GAN论文回顾与挑战
产业智能官
11+阅读 · 2019年1月21日
2018 年最棒的三篇 GAN 论文
AI科技评论
4+阅读 · 2019年1月14日
生成式对抗网络(GAN)如何快速理解?
全球人工智能
8+阅读 · 2018年1月14日
【GAN】生成式对抗网络GAN的研究进展与展望
产业智能官
12+阅读 · 2017年8月31日
GAN猫的脸
机械鸡
11+阅读 · 2017年7月8日
Optimization for deep learning: theory and algorithms
Arxiv
104+阅读 · 2019年12月19日
Arxiv
4+阅读 · 2018年9月25日
Arxiv
4+阅读 · 2018年5月21日
Arxiv
10+阅读 · 2018年3月23日
Arxiv
12+阅读 · 2018年1月12日
VIP会员
相关资讯
为什么说GAN很快就要替代现有摄影技术了?
GAN生成式对抗网络
5+阅读 · 2019年3月12日
【GAN】2018最佳生成性对抗网络GAN论文回顾与挑战
产业智能官
11+阅读 · 2019年1月21日
2018 年最棒的三篇 GAN 论文
AI科技评论
4+阅读 · 2019年1月14日
生成式对抗网络(GAN)如何快速理解?
全球人工智能
8+阅读 · 2018年1月14日
【GAN】生成式对抗网络GAN的研究进展与展望
产业智能官
12+阅读 · 2017年8月31日
GAN猫的脸
机械鸡
11+阅读 · 2017年7月8日
Top
微信扫码咨询专知VIP会员