问答Goodfellow：没有样例能不能训练机器学习算法？

会员服务 ·

问答Goodfellow：没有样例能不能训练机器学习算法？

2017 年 10 月 18 日 量子位 专注报道AI

李杉编译整理
量子位出品 | 公众号 QbitAI

从图像和语音识别到自然语言分析，神经网络已经在很多领域大展身手。过去几年，它们的精确度已经几乎可以与人类媲美。但仍有很多神经网络无法完成的任务——例如，这种技术还无法取代人类的创造力。

2014年，Ian Goodfellow提出了生成式对抗网络（GAN），可以在无人监督的情况下自行训练，还能对过去的错误和不足进行分析，从而改进效果。

多数深度学习算法都需要数千或数百万添加标签的样例才能获得想要的结果，而对抗网络的出现有助于减少数据需求。从本质上讲，人工智能可以通过模仿“专家”——也就是GAN中的辨别者——来学习复杂的任务。

GAN可以训练两个目标相互竞争的独立网络，还可以用于绘制和归类图像，以及识别情绪、规则和指令。Facebook和Google等现在都在深度学习模型中高度依赖GAN。

近日一篇问答Goodfellow的报道发布，透露了他目前在Google Brain的工作以及GAN的进度。

Goodfellow目前带领一个研究团队研究机器学习中的对抗技术，他在Google Brain的任务是探索如何能够“在对抗者故意想让算法失效时，还能让算法正常运转。”

他解释了他们如何应对现实场景，例如，有垃圾信息试图逃过过滤器发送邮件，他们还研究了如何用成像对抗者让机器学习算法多加练习，并迫使其改进。

例如，GAN可以“学着通过玩游戏生成现实图像，在这个游戏中，生成网络必须产生一些图片，让物体识别网络把假图片错认成真图片。”

Goodfellow拥有计算机科学本科学位，他在美国国家卫生研究院的神经科学实验室当实习生时开始从事人工智能方面的工作。

以下为采访概要：

问：深度学习最近有什么重要进步？具体是怎么实现的？

答：截至2017年7月，我认为最新的进步就是2017年5月宣布的新一代谷歌TPU。机器学习始终受制于计算能力的局限。新的谷歌TPU有助于填补我们可以在深度学习实验中使用的计算量，与生物神经系统中使用的计算量之间的差距。

之前的TPU仅能提供给谷歌工程师使用，但新的TPU还可以提供给云计算用户。研究人员甚至可以申请免费使用。

这种新的TPU还支持机器学习模型训练，这较上一代实现了重大进步，之前的TPU可以运行经过训练的模型，但不能用于训练。这些进步来自持续多年的研发，这都得益于谷歌领导层对这一领域展开的先期投资。

问：你的工作在神经网络/GAN领域都有哪些实际应用？哪些领域最有可能受到影响？

答：生成式对抗网络的一个实际应用是半监督式学习。当今的多数深度学习算法都需要使用数千或数百万的标记样例——这种样例会显示具体的输入信息，以及在模型再次看到这个输入信息时所应生成的具体的输出信息。半监督式学习算法可以同时利用标记的样例和未标记的样例——也就是只包含输入信息的样例。

因此，只要还有几千个未标记的样例，它们就能通过少量标记的样例（可能是100个左右）进行学习。GAN和其他半监督式学习方法有可能把机器学习带入很多不同的长尾领域，这些领域没有展开大规模投资，无法收集像物体识别领域那么多的标记数据。

问：深度学习未来五年有望看到哪些进展？

答：我想强调一些别人可能忽视的进展：

我认为在如何提升机器学习算法公平新这个问题上，我们开始看到了一些最佳实践建议，毕竟这类技术已经开始对我们的生活产生重大影响。
我认为我们会开始看到更加强大的隐私保障措施，包括差别隐私、联合学习，以及同态加密。
我认为我们将看到很难被攻击者欺骗的机器学习算法，但我不认为能够看到在数学证明可证明的严密安全保证。

问：有哪些潜在的机器学习进步最令你振奋？

答：我很高兴看到医药机器学习技术发展势头越来越强。

具体而言，我很高兴看到不同的私有GAN被用于证明一套可以共享临床数据，但又不会侵犯病人隐私的系统。当我本科研究神经科学的时候，我对智能的运作方式很感兴趣，希望了解如何治疗大脑疾病。

我之所以希望学习人工智能，部分原因在于我意识到，如果我能够开发更强大的人工智能算法，别人就可以利用这些算法解决生理学和其他学科领域的疑难问题。

— 完 —

加入社群

量子位AI社群10群开始招募啦，欢迎对AI感兴趣的同学，加小助手微信qbitbot3入群；

此外，量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募，面向正在从事相关领域的工程师及研究人员。

进群请加小助手微信号qbitbot3，并务必备注相应群的关键词~通过审核后我们将邀请进群。（专业群审核较严，敬请谅解）

诚挚招聘

量子位正在招募编辑/记者，工作地点在北京中关村。期待有才气、有热情的同学加入我们！相关细节，请在量子位公众号(QbitAI)对话界面，回复“招聘”两个字。

量子位 QbitAI

վ'ᴗ' ի 追踪AI技术和产品新动态

登录查看更多

相关内容

样例

关注 0

【Google】平滑对抗训练，Smooth Adversarial Training

专知会员服务

49+阅读 · 2020年7月4日

谷歌推出量子机器学习框架TFQ-TensorFlow Quantum，一个可训练量子模型的机器学习框架

专知会员服务

34+阅读 · 2020年3月10日

【2020新书】简明机器学习导论，电子书与500页PPT

专知会员服务

205+阅读 · 2020年2月7日

完整版！《GAN实战：生成对抗网络深度学习》在线书与代码，牛津大学Jakub著作 (附下载)

专知会员服务

354+阅读 · 2019年12月25日

【CCL 2019】ATT-第19期：生成对抗网络（邱锡鹏）

专知会员服务

50+阅读 · 2019年11月12日

资源 | 《GAN实战：生成对抗网络深度学习》牛津大学Jakub著作（附下载）

THU数据派

59+阅读 · 2019年4月12日

【学界】Google用更少标签生成图像，还提出一个用于训练评估GAN的库

GAN生成式对抗网络

23+阅读 · 2019年4月10日

吴恩达最新问答：深度学习泡沫何时会破？

德先生

19+阅读 · 2017年11月22日

大咖 | GAN之父Ian Goodfellow在Quora：机器学习十问十答

大数据文摘

3+阅读 · 2017年7月31日

【Ian Goodfellow 五问】GAN、深度学习，如何与谷歌竞争

新智元

5+阅读 · 2017年7月18日

Deflecting Adversarial Attacks

Arxiv

8+阅读 · 2020年2月18日

Attributed Network Embedding for Incomplete Structure Information

Arxiv

3+阅读 · 2018年11月28日

Compositional GAN: Learning Conditional Image Composition

Arxiv

31+阅读 · 2018年7月19日

GANE: A Generative Adversarial Network Embedding

Arxiv

5+阅读 · 2018年5月21日

DeblurGAN: Blind Motion Deblurring Using Conditional Adversarial Networks

Arxiv

4+阅读 · 2018年4月3日

VIP会员