大白话深度学习中的Sigmoid函数 - 专知

会员服务 ·

0

大白话深度学习中的Sigmoid函数

2021 年 10 月 28 日 极市平台

↑ 点击蓝字关注极市平台

作者丨小马

来源丨FightingCV

编辑丨极市平台

极市导读

Sigmoid函数是理解神经网络如何学习复杂问题的关键。这个函数也是学习其他函数的基础，这些函数可以为深度学习架构中的监督学习提供高效的解决方案。 >>加入极市CV技术交流群，走在计算机视觉的最前沿

无论是自己实现一个神经网络，还是使用一个内置的库来学习神经网络，了解 Sigmoid函数的意义是至关重要的。Sigmoid函数是理解神经网络如何学习复杂问题的关键。这个函数也是学习其他函数的基础，这些函数可以为深度学习架构中的监督学习提供高效的解决方案。本文分为三个部分：

Sigmoid函数
线性与非线性可分性
为什么神经网络可以通过使用Sigmoid函数，作出复杂的决策边界

1. Sigmoid Function

1.1 Sigmoid函数的性质和恒等式

Sigmoid函数是 Logistic函数的一种特殊形式，通常用 σ (x)或 sig (x)来表示。如下所示：

Sigmoid 函数是一条 s 形曲线，如下图中的绿线所示。该图还显示了粉红色的导数图形：

1.2 Sigmoid——压缩函数

Sigmoid函数也可以作为压缩函数，因为它的域是所有实数的集合，它的范围是(0,1)。因此，如果函数的输入是一个非常大的负数或非常大的正数，则输出总是介于0和1之间。在-∞和 + ∞之间的任何数字也是如此。

1.3 Sigmoid——激活函数

Sigmoid函数被用作神经网络中的激活函数。为了回顾什么是激活函数神经元，下面的图显示了激活函数神经元在神经网络的一个层中所起的作用。输入的加权和通过一个激活函数，这个输出作为下一层的输入。

当一个神经元的激活函数是一个 Sigmoid函数时，这个单元的输出保证总是介于0和1之间。此外，由于 Sigmoid是一个非线性函数，这个单元的输出将是一个非线性函数的加权和的输入。这种以Sigmoid函数为激活函数的神经元被称为sigmoid unit 。

2. 线性与非线性可分性?

假设我们有一个典型的分类问题，我们在空间中有一组点，每个点被分配一个类标签。如果一条直线（或 n 维空间中的一个超平面）可以将这两类分开，那么我们就有一个线性可分问题。另一方面，如果一条直线不足以划分这两类，那么我们就有一个非线性可分问题。下图显示了二维空间中的数据。每个点被分配一个红色或蓝色的类标签。左图显示了一个线性可分问题，该问题需要一个线性边界来区分两类问题。右图显示了一个非线性可分问题，需要一个非线性决策边界。

对于三维空间，线性决策边界可以用平面方程来描述。对于 n 维空间，线性决策边界由超平面方程描述。

3. 为什么 Sigmoid函数在神经网络中很重要？

如果我们在神经网络中使用线性激活函数，那么这个模型只能学习线性可分问题。然而，只要在隐藏层中增加一个隐藏层和一个 Sigmoid激活函数，神经网络就可以很容易地学习一个非线性可分问题 。使用非线性函数产生非线性边界，因此，Sigmoid函数可以用于神经网络学习复杂的决策函数。

在神经网络中，可以用作激活函数的非线性函数必须是一个单调递增 的函数。例如，sin (x)或 cos (x)不能用作激活函数。另外，激活函数应该定义为任意处 ，并且在实数空间中任意处都是连续的 。这个函数还要求在整个实数空间上是可微的。

通常，反向传播算法使用梯度下降法学习神经网络的权重。为了得到这个算法，需要对激活函数进行求导数。而由于Sigmoid函数是单调的，连续的，到处可微的 ，再加上它的导数可以用它自己来表示 的特性，使得当使用反向传播算法时，很容易推导出学习神经网络中的权重的更新方程。

如果觉得有用，就请分享到朋友圈吧！

△点击卡片关注极市平台，获取最新CV干货

公众号后台回复“CVPR21检测”获取CVPR2021目标检测论文下载～

极市干货

项目/比赛：珠港澳人工智能算法大赛｜算法打榜

算法trick ：目标检测比赛中的tricks集锦｜从39个kaggle竞赛中总结出来的图像分割的Tips和Tricks

技术综述：一文弄懂各种loss function ｜工业图像异常检测最新研究总结（2019-2020）

# CV技术社群邀请函 #

△长按添加极市小助手

添加极市小助手微信（ID : cvmart4）

备注：姓名-学校/公司-研究方向-城市（如：小极-北大-目标检测-深圳）

即可申请加入极市目标检测/图像分割/工业检测/人脸/医学影像/3D/SLAM/自动驾驶/超分辨率/姿态估计/ReID/GAN/图像增强/OCR/视频理解等技术交流群

每月大咖直播分享、真实项目需求对接、求职内推、算法竞赛、干货资讯汇总、与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企视觉开发者互动交流~

觉得有用麻烦给个在看啦~

登录查看更多

1

相关内容

Sigmoid函数

如何用latext画神经网络？这个PlotNeuralNet能帮到你

如何用latext画神经网络？这个PlotNeuralNet能帮到你

专知会员服务

26+阅读 · 2022年1月15日

深度学习激活函数全面综述论文

深度学习激活函数全面综述论文

专知会员服务

72+阅读 · 2021年10月1日

【深度学习中的隐式正则化】从矩阵和张量分解中得到的教训，141页ppt

【深度学习中的隐式正则化】从矩阵和张量分解中得到的教训，141页ppt

专知会员服务

58+阅读 · 2021年4月5日

【NeurIPS 2020】学习神经网络中的不变性

专知会员服务

29+阅读 · 2020年10月24日

李航等最新《搜索与推荐中的深度学习匹配》新书，190页pdf

李航等最新《搜索与推荐中的深度学习匹配》新书，190页pdf

专知会员服务

208+阅读 · 2020年9月6日

1小时学习Pytorch！最新《深度学习Pytorch》简明视频教程，45页ppt

1小时学习Pytorch！最新《深度学习Pytorch》简明视频教程，45页ppt

专知会员服务

187+阅读 · 2020年8月10日

贝叶斯与深度学习如何结合？看这份256页《贝叶斯深度学习原理》SPCOM2020硬核教程

贝叶斯与深度学习如何结合？看这份256页《贝叶斯深度学习原理》SPCOM2020硬核教程

专知会员服务

111+阅读 · 2020年7月22日

Yann Lecun 纽约大学《深度学习》2020课程笔记中文版，带你学习基础知识与最新进展

Yann Lecun 纽约大学《深度学习》2020课程笔记中文版，带你学习基础知识与最新进展

专知会员服务

154+阅读 · 2020年5月2日

【模型泛化教程】标签平滑与Keras, TensorFlow，和深度学习

【模型泛化教程】标签平滑与Keras, TensorFlow，和深度学习

专知会员服务

21+阅读 · 2019年12月31日

【经典】深度学习数学宝典《深度学习所需要的矩阵微积分》

【经典】深度学习数学宝典《深度学习所需要的矩阵微积分》

专知会员服务

285+阅读 · 2019年12月2日

为什么深度学习是非参数的？

为什么深度学习是非参数的？

THU数据派

1+阅读 · 2022年3月29日

深度学习&计算机视觉常见的29道面试题及解析

深度学习&计算机视觉常见的29道面试题及解析

极市平台

0+阅读 · 2022年3月27日

Softmax 函数和它的误解

Softmax 函数和它的误解

极市平台

0+阅读 · 2021年10月15日

激活函数还是有一点意思的！

激活函数还是有一点意思的！

计算机视觉战队

12+阅读 · 2019年6月28日

从泰勒展开来看梯度下降算法

从泰勒展开来看梯度下降算法

深度学习每日摘要

13+阅读 · 2019年4月9日

详解常见的损失函数

详解常见的损失函数

七月在线实验室

20+阅读 · 2018年7月12日

【干货】深度学习中的线性代数

【干货】深度学习中的线性代数

专知

21+阅读 · 2018年3月30日

【干货】Batch Normalization: 如何更快地训练深度神经网络

【干货】Batch Normalization: 如何更快地训练深度神经网络

专知

13+阅读 · 2018年3月6日

干货 | 深度学习之卷积神经网络(CNN)的模型结构

干货 | 深度学习之卷积神经网络(CNN)的模型结构

机器学习算法与Python学习

12+阅读 · 2017年11月1日

干货 | 深度学习之损失函数与激活函数的选择

干货 | 深度学习之损失函数与激活函数的选择

机器学习算法与Python学习

15+阅读 · 2017年9月18日

基于近似动态规划的数据驱动非线性多输入多输出在线优化与控制算法

国家自然科学基金

1+阅读 · 2013年12月31日

前馈神经网络容错学习算法的设计与确定型收敛性研究

国家自然科学基金

0+阅读 · 2013年12月31日

椭圆方程组中的向量分析

国家自然科学基金

0+阅读 · 2013年12月31日

调和分析及其应用

国家自然科学基金

0+阅读 · 2013年12月31日

右端不连续时滞神经网络的多稳定性与分岔控制

国家自然科学基金

0+阅读 · 2012年12月31日

交集上变分不等式的神经网络模型及应用研究

国家自然科学基金

1+阅读 · 2012年12月31日

CPU/GPU异构平台下并行保结构算法的研究

国家自然科学基金

2+阅读 · 2012年12月31日

神经网络的代数构造特征和可算性

国家自然科学基金

3+阅读 · 2011年12月31日

前馈神经网络学习算法的设计与分析

国家自然科学基金

3+阅读 · 2011年12月31日

三维网格模型的自适应重要性采样及高质量网格重建

国家自然科学基金

1+阅读 · 2009年12月31日

Near-optimal Policy Optimization Algorithms for Learning Adversarial Linear Mixture MDPs

Arxiv

0+阅读 · 2022年4月20日

Factual Error Correction for Abstractive Summaries Using Entity Retrieval

Arxiv

0+阅读 · 2022年4月18日

Deep Graphic FBSDEs for Opinion Dynamics Stochastic Control

Arxiv

1+阅读 · 2022年4月18日

Effective numerical computation of $p(x)-$Laplace equations in 2D

Arxiv

0+阅读 · 2022年4月17日

Unsupervised Attention-based Sentence-Level Meta-Embeddings from Contextualised Language Models

Arxiv

0+阅读 · 2022年4月16日

Minimal Absent Words on Run-Length Encoded Strings

Arxiv

0+阅读 · 2022年4月14日

Non-Crossing Shortest Paths in Undirected Unweighted Planar Graphs in Linear Time

Arxiv

0+阅读 · 2022年4月14日

Diagnosing and Fixing Manifold Overfitting in Deep Generative Models

Arxiv

0+阅读 · 2022年4月14日

Sequence Level Contrastive Learning for Text Summarization

Sequence Level Contrastive Learning for Text Summarization

Arxiv

14+阅读 · 2021年9月24日

Hierarchical Graph Capsule Network

Hierarchical Graph Capsule Network

Arxiv

20+阅读 · 2020年12月16日

VIP会员

相关主题

Sigmoid（一种激活函数）

深度学习架构

相关VIP内容

如何用latext画神经网络？这个PlotNeuralNet能帮到你

如何用latext画神经网络？这个PlotNeuralNet能帮到你

专知会员服务

26+阅读 · 2022年1月15日

深度学习激活函数全面综述论文

深度学习激活函数全面综述论文

专知会员服务

72+阅读 · 2021年10月1日

【深度学习中的隐式正则化】从矩阵和张量分解中得到的教训，141页ppt

【深度学习中的隐式正则化】从矩阵和张量分解中得到的教训，141页ppt

专知会员服务

58+阅读 · 2021年4月5日

【NeurIPS 2020】学习神经网络中的不变性

专知会员服务

29+阅读 · 2020年10月24日

李航等最新《搜索与推荐中的深度学习匹配》新书，190页pdf

李航等最新《搜索与推荐中的深度学习匹配》新书，190页pdf

专知会员服务

208+阅读 · 2020年9月6日

1小时学习Pytorch！最新《深度学习Pytorch》简明视频教程，45页ppt

1小时学习Pytorch！最新《深度学习Pytorch》简明视频教程，45页ppt

专知会员服务

187+阅读 · 2020年8月10日

贝叶斯与深度学习如何结合？看这份256页《贝叶斯深度学习原理》SPCOM2020硬核教程

贝叶斯与深度学习如何结合？看这份256页《贝叶斯深度学习原理》SPCOM2020硬核教程

专知会员服务

111+阅读 · 2020年7月22日

Yann Lecun 纽约大学《深度学习》2020课程笔记中文版，带你学习基础知识与最新进展

Yann Lecun 纽约大学《深度学习》2020课程笔记中文版，带你学习基础知识与最新进展

专知会员服务

154+阅读 · 2020年5月2日

【模型泛化教程】标签平滑与Keras, TensorFlow，和深度学习

【模型泛化教程】标签平滑与Keras, TensorFlow，和深度学习

专知会员服务

21+阅读 · 2019年12月31日

【经典】深度学习数学宝典《深度学习所需要的矩阵微积分》

【经典】深度学习数学宝典《深度学习所需要的矩阵微积分》

专知会员服务

285+阅读 · 2019年12月2日

热门VIP内容

开通专知VIP会员享更多权益服务

【博士论文】扩展可扩展会话推荐的边界

别想太多：高效 R1 风格大型推理模型综述

【ACMMM2025】EvoVLMA: 进化式视觉-语言模型自适应

智能体网络：用AI智能体编织下一代网络

相关资讯

为什么深度学习是非参数的？

为什么深度学习是非参数的？

THU数据派

1+阅读 · 2022年3月29日

深度学习&计算机视觉常见的29道面试题及解析

深度学习&计算机视觉常见的29道面试题及解析

极市平台

0+阅读 · 2022年3月27日

Softmax 函数和它的误解

Softmax 函数和它的误解

极市平台

0+阅读 · 2021年10月15日

激活函数还是有一点意思的！

激活函数还是有一点意思的！

计算机视觉战队

12+阅读 · 2019年6月28日

从泰勒展开来看梯度下降算法

从泰勒展开来看梯度下降算法

深度学习每日摘要

13+阅读 · 2019年4月9日

详解常见的损失函数

详解常见的损失函数

七月在线实验室

20+阅读 · 2018年7月12日

【干货】深度学习中的线性代数

【干货】深度学习中的线性代数

专知

21+阅读 · 2018年3月30日

【干货】Batch Normalization: 如何更快地训练深度神经网络

【干货】Batch Normalization: 如何更快地训练深度神经网络

专知

13+阅读 · 2018年3月6日

干货 | 深度学习之卷积神经网络(CNN)的模型结构

干货 | 深度学习之卷积神经网络(CNN)的模型结构

机器学习算法与Python学习

12+阅读 · 2017年11月1日

干货 | 深度学习之损失函数与激活函数的选择

干货 | 深度学习之损失函数与激活函数的选择

机器学习算法与Python学习

15+阅读 · 2017年9月18日

相关基金

基于近似动态规划的数据驱动非线性多输入多输出在线优化与控制算法

国家自然科学基金

1+阅读 · 2013年12月31日

前馈神经网络容错学习算法的设计与确定型收敛性研究

国家自然科学基金

0+阅读 · 2013年12月31日

椭圆方程组中的向量分析

国家自然科学基金

0+阅读 · 2013年12月31日

调和分析及其应用

国家自然科学基金

0+阅读 · 2013年12月31日

右端不连续时滞神经网络的多稳定性与分岔控制

国家自然科学基金

0+阅读 · 2012年12月31日

交集上变分不等式的神经网络模型及应用研究

国家自然科学基金

1+阅读 · 2012年12月31日

CPU/GPU异构平台下并行保结构算法的研究

国家自然科学基金

2+阅读 · 2012年12月31日

神经网络的代数构造特征和可算性

国家自然科学基金

3+阅读 · 2011年12月31日

前馈神经网络学习算法的设计与分析

国家自然科学基金

3+阅读 · 2011年12月31日

三维网格模型的自适应重要性采样及高质量网格重建

国家自然科学基金

1+阅读 · 2009年12月31日

相关论文

Near-optimal Policy Optimization Algorithms for Learning Adversarial Linear Mixture MDPs

Arxiv

0+阅读 · 2022年4月20日

Factual Error Correction for Abstractive Summaries Using Entity Retrieval

Arxiv

0+阅读 · 2022年4月18日

Deep Graphic FBSDEs for Opinion Dynamics Stochastic Control

Arxiv

1+阅读 · 2022年4月18日

Effective numerical computation of $p(x)-$Laplace equations in 2D

Arxiv

0+阅读 · 2022年4月17日

Unsupervised Attention-based Sentence-Level Meta-Embeddings from Contextualised Language Models

Arxiv

0+阅读 · 2022年4月16日

Minimal Absent Words on Run-Length Encoded Strings

Arxiv

0+阅读 · 2022年4月14日

Non-Crossing Shortest Paths in Undirected Unweighted Planar Graphs in Linear Time

Arxiv

0+阅读 · 2022年4月14日

Diagnosing and Fixing Manifold Overfitting in Deep Generative Models

Arxiv

0+阅读 · 2022年4月14日

Sequence Level Contrastive Learning for Text Summarization

Sequence Level Contrastive Learning for Text Summarization

Arxiv

14+阅读 · 2021年9月24日

Hierarchical Graph Capsule Network

Hierarchical Graph Capsule Network

Arxiv

20+阅读 · 2020年12月16日

大家都在搜

久别重逢话双塔

大型语言模型

国防科技创新

无人机航拍交通事故现场勘查处置系统——行业第一的警用事故处理软件

微信扫码咨询专知VIP会员