深度学习基础——激活函数以及什么时候使用它们？（附代码）

会员服务 ·

深度学习基础——激活函数以及什么时候使用它们？（附代码）

2020 年 3 月 4 日 THU数据派

作者：Dishashree Gupta

翻译：王紫岳

校对：王琦

本文约5200字，建议阅读20分钟

本文简要介绍了作者在初次进行机器学习的操作时所遇到的情况与得到的教训。

摘要

激活函数是神经网络的组成部分之一。
学习深度学习中不同的激活函数。
在python中编写激活函数并在实时编码窗口中将结果可视化。

本文最初发表于2017年10月，并于2020年1月进行了更新，增加了三个新的激活函数和python代码。

引言

今天，因特网提供了获取大量信息的途径。无论我们需要什么，只需要谷歌搜索一下即可。然而，当我们获取了这么多的信息时，我们又面临着如何区分相关和无关的信息的挑战。

当我们的大脑被同时灌输大量信息时，它会努力去理解这些信息并将其分为“有用的”和“不那么有用的”。对于神经网络而言，我们需要类似的机制来将输入的信息分为“有用的”或“不太有用的”。

这是网络学习的重要方式，因为并不是所有的信息都同样有用。它们中的一些仅仅是噪音，而这就是激活函数的用武之地了。激活函数帮助神经网络使用重要信息，并抑制不相关的数据点。

接下来让我们来看看这些激活函数，了解它们是如何工作的，并找出哪些激活函数适合于什么样的问题情景。

对于分类器，Sigmoid函数及其组合通常工作得更好。
由于有梯度消失的问题，有时会避免使用sigmoid和tanh函数。
ReLU函数是一种通用的激活函数，目前被广泛使用。
如果在我们的网络中遇到神经元未激活的情况，Leaky ReLU函数是最好的选择。
始终记住，ReLU函数应该只在隐藏层中使用。
根据经验，您可以从使用ReLU函数开始，然后在ReLU不能提供最佳结果的情况下转移到其他激活函数。

项目

现在，是时候冒险尝试一下其他真实的数据集了。那么你准备好接受挑战了吗?通过以下实践问题加速你的深度学习之旅:

l Practice Problem: Identify the Apparels(见下面链接)

https://datahack.analyticsvidhya.com/contest/practice-problem-identify-the-apparels/?utm_source=fundamentals-deep-learning-activation-functions-when-to-use-them&utm_medium=blog

l Practice Problem: Identify the Digits（见下面链接）

https://datahack.analyticsvidhya.com/contest/practice-problem-identify-the-digits/?utm_source=fundamentals-deep-learning-activation-functions-when-to-use-them&utm_medium=blog

结语： 在本文中，我讨论了各种类型的激活函数，以及在使用它们时可能遇到的问题类型。我建议你先从ReLU函数开始，并随着你慢慢深入时，探索其他函数。你还可以设计自己的激活函数，为你的神经网络提供一个非线性组件。如果您使用了自己的激活函数并且效果非常好，请与我们分享，我们将很乐意将其纳入列表。

原文链接：

https://www.analyticsvidhya.com/blog/2020/01/fundamentals-deep-learning-activation-functions-when-to-use-them/

原文标题：

Fundamentals of Deep Learning – Activation Functions and When to Use Them?

编辑：王菁

校对：林亦霖

译者简介

王紫岳，悉尼大学Data Science在读研究生，在数据科学界努力奋斗的求知者。喜欢有挑战性的工作与生活，喜欢与朋友们热切交谈，喜欢在独处的时候读书品茶。张弛有度，才能够以最饱满的热情迎接有点忙碌的生活。

——END——

登录查看更多

相关内容

激活函数

关注 44

在人工神经网络中，给定一个输入或一组输入，节点的激活函数定义该节点的输出。一个标准集成电路可以看作是一个由激活函数组成的数字网络，根据输入的不同，激活函数可以是开(1)或关(0)。这类似于神经网络中的线性感知器的行为。然而，只有非线性激活函数允许这样的网络只使用少量的节点来计算重要问题，并且这样的激活函数被称为非线性。

最新《自动微分手册》77页pdf

专知会员服务

103+阅读 · 2020年6月6日

来自Fariz Darari博士的一份简明《神经网络与深度学习》的讲义，64页ppt

专知会员服务

93+阅读 · 2020年5月5日

Yann Lecun 纽约大学《深度学习》2020课程笔记中文版，带你学习基础知识与最新进展

专知会员服务

154+阅读 · 2020年5月2日

干货书《数据科学数学系基础》2020最新版，266页pdf

专知会员服务

322+阅读 · 2020年3月23日