推荐｜斯坦福大学机器学习：神经网络的表示！ - 专知

会员服务 ·

0

推荐｜斯坦福大学机器学习：神经网络的表示！

2017 年 9 月 20 日 全球人工智能

“全球人工智能”拥有十多万AI产业用户，10000多名AI技术专家。主要来自：北大，清华，中科院，麻省理工，卡内基梅隆，斯坦福，哈佛，牛津，剑桥...以及谷歌，腾讯，百度，脸谱，微软，阿里，海康威视，英伟达......等全球名校和名企。

－免费加入AI高管投资群>>

－免费加入AI技术专家群>>

今天主要分享斯坦福大学机器学习“神经网络的表示“学习笔记，主要包括7部分：

一、非线性hypotheses：非线性分类器：之前谈过线性回归，逻辑回归，当我们遇到一些比较复杂的分类问题时，是否还有其他选择？例如，对于多项式回归：

得到如下的非线性分类器：

假设这是一个房价预测问题，不过这一次不再是预测房价（回归问题），而是预测未来6个月是否能售出（分类问题）。如果有100个独立特征，例如：

那么，任取两个特征作为组合特征时，大约可以得到5000个特征(

所以，对于汽车检测问题，我们需要一堆汽车图片：

和一堆非汽车图片作为训练集：

训练一个用于汽车检测的分类器，对于一个测试图片，判断是否是汽车：

一种方法是从每辆汽车是取两个像素点作为样本的特征，然后通过学习算法来训练分类器：

那么这些正负例（汽车 or 非汽车）训练样本可以用图形表示如下：

假设每幅图片有50 * 50 = 2500个像素，那么每个样本有2500个像素点可以选择，如果是是二次项组合特征，大约有3百万个特征组合：

对于这样的有着大量特征的分类问题，除了逻辑回归，是否还有其他的学习算法？

二、神经元和大脑

1）神经网络：

起源于尝试让机器模仿大脑的算法；
在80年代和90年代早期非常流行，慢慢在90年代后期衰落；
最近得益于计算机硬件能力，又开始流行起来：对于很多应用，神经网络算法是一种“时髦”的技术；

大脑很神奇，可以让我们去听，去看，去触，也可以做数学题，做微积分，做很多神奇的事情，要模仿大脑，似乎需要我们写很多程序来做不同的事情？但是恰恰与此相反，做这些事情仅仅需要一个学习算法。

2）听觉皮层实验：

上图是大脑的一部分，红色的部分是听觉皮层，用来处理耳朵收集的声音信号并让大脑理解。神经科学家做了一个实验，切断耳朵和听觉皮层的联系，并且连接眼睛和听觉皮层，这样从眼睛采集的信号不再传送到视神经而是听觉皮层，这样做得最终结果是听觉皮层将会学习“看"。

3）体感皮层实验：

上图的红色区域是体感皮层，主要身体的触觉，与听觉皮层实验相似，如果我们做相似的实验，那么体感皮层也将学会”看“。

上述两个实验统称为神经重布线实验(neuro-rewiring experiments), 这些实验给我们的感觉就是同样的一块儿脑组织既可以处理视觉，也可以处理听觉，还可以处理触觉，也许就存在一种学习算法来处理视觉信号，听觉信号和触觉信号。如果我们能近似模拟或实现大脑的这种学习算法，我们就能获得绝大部分大脑可以完成的功能，因为大脑可以自己去处理不同类型的数据。以下是一些模拟大脑传感器的例子：

包括：用舌头去“看”；回声定位或者声纳定位；触觉皮带-方向感（向小鸟一样感知方向）；给青蛙植入第三只眼。这些都是很酷的例子，也许人类的AI之梦并不遥远了！

三、模型表示二：前馈网络：向量化实现

前向网络，这种网络只在训练过程会有反馈信号，而在分类过程中数据只能向前传送，直到到达输出层，层间没有向后的反馈信号，因此被称为前馈网络。感知机( perceptron)与BP神经网络就属于前馈网络。我们已经给出了这个神经网络的模型表示，但是不够简洁，下面我们来向量化这个模型（具体的过程推荐看视频，以下仅给出总结）：

其他的网络结构：除了上述的前馈网络外，神经网络还有其他的一些网络结构，譬如：

其中第一层仍是输入层，最后一层第四层数输出层，中间两层是隐藏层。

四、模型表示一：大脑中的神经元

神经网络的目标就是模拟大脑中的神经元或网络，因此在介绍hypotheses的表示之前，先让我们来看一看大脑中神经元：

注意对于我们的这幅图来说，比较关键的是树突(dendrite)是输入(input wires)，轴突(axon)是输出(output wires).现在我们模拟大脑中的神经元结构建立一个简单的模型-Logistic unit：

可以将其对应到一个非线性分类器，如下图所示：

同或逻辑和异或逻辑互补：

同或运算和异或运算是逻辑代数中的复合运算，因此下面我们先介绍三种最基本的逻辑运算(与逻辑运算、或逻辑运算、非逻辑运算)，同时分别介绍其对应的神经网络实现，最后将这几种基本的逻辑运算组合，形成最终的同或逻辑运算的神经网络。

与(AND)逻辑运算示例：

相信大家对于与(AND)运算很熟悉，其基本的表达式如下：

我们可以用一个简单的神经网络（一个神经元）表示与逻辑运算：

六、例子和直观解释二

下面第三个基本的逻辑运算：非(NOT)逻辑运算：用一个简单的神经网络模型来模拟非(NOT)逻辑运算：

得到的对应表如下：

非逻辑运算仅针对一个输入值，我们来表示一个略微复杂的逻辑表达式：

这个表达式等于1的前提是”当且仅当x1=x2=0".可以用神经网络模拟如下：

有了上述三个基本逻辑运算的基础和相关的神经网络模型表示，可以将其组合为一个略微复杂的”同或(XNOR)逻辑运算的神经网络“：

对于这个神经网络，这里稍作一点解释，同或运算的表达式如下：

上图中第二层隐藏网络a1和a2分别代表了A And B和Not A And Not B，a1和a2又做了一次或逻辑运算就得到了同或逻辑运算。该神经网络对应的输出与同或运算的真值表相同：

七、多类分类问题：在逻辑回归的笔记中，我们谈到了多类分类问题，而神经网络同样可以应用于多类分类问题，只不过在表达上略有区别。首先来看一个机器视觉中分类的例子：

对于一个输入图片，需要识别其属于行人、轿车、摩托车或者卡车中的一个类型，这是一个多类分类的问题。用神经网络表示如下：

AI专家问答平台

热门文章推荐

华裔女科学家钱璐璐，发明仅20纳米的DNA机器人！

Geoffrey Hinton提出capsule 概念，推翻反向传播！

2017年7大最受欢迎的AI编程语言：Python第一!

重磅｜中国首家人工智能技术学院在京揭牌开学！

厉害 | 南京大学周志华教授当选欧洲科学院外籍院士！

5个月市值涨了1200亿，首次突破3100亿市值！

华为扔下这枚“AI芯弹”，全世界的智能手机都卡（慢）死了！

用57行代码搞定花8000万美元采购车牌识别项目

厉害｜百度28位离职技术大牛和他们创建的AI公司！

一AI工程师下载200万GB色情内容，只为学习Python！

相关内容

线性分类器

线性分类器

在机器学习领域，分类的目标是指将具有相似特征的对象聚集。而一个线性分类器则透过特征的线性组合来做出分类决定，以达到此种目的。对象的特征通常被描述为特征值，而在向量中则描述为特征向量。

【斯坦福大学博士论文】机器学习中的凸优化问题,108页pdf

【斯坦福大学博士论文】机器学习中的凸优化问题,108页pdf

专知会员服务

162+阅读 · 2020年6月14日

机器学习如何用于芯片系统设计？Jeff Dean推荐Google最新《机器学习系统芯片设计》70页ppt为你讲解

机器学习如何用于芯片系统设计？Jeff Dean推荐Google最新《机器学习系统芯片设计》70页ppt为你讲解

专知会员服务

61+阅读 · 2020年5月31日

来自Fariz Darari博士的一份简明《神经网络与深度学习》的讲义，64页ppt

来自Fariz Darari博士的一份简明《神经网络与深度学习》的讲义，64页ppt

专知会员服务

92+阅读 · 2020年5月5日

Capsule Networks，胶囊网络，57页ppt，布法罗大学

Capsule Networks，胶囊网络，57页ppt，布法罗大学

专知会员服务

69+阅读 · 2020年2月29日

麻省理工学院MIT-ICLR2020《神经网络能推断出什么?》

麻省理工学院MIT-ICLR2020《神经网络能推断出什么?》

专知会员服务

51+阅读 · 2020年2月19日

【斯坦福大学】场景图谱表示在计算机视觉中的应用，41页ppt

【斯坦福大学】场景图谱表示在计算机视觉中的应用，41页ppt

专知会员服务

52+阅读 · 2020年1月8日

【金融机器学习课程资料】Financial Machine Learning

专知会员服务

118+阅读 · 2019年12月24日

【斯坦福大学Chelsea Finn-NeurIPS 2019】贝叶斯元学习

【斯坦福大学Chelsea Finn-NeurIPS 2019】贝叶斯元学习

专知会员服务

38+阅读 · 2019年12月17日

【机器学习课程】Google机器学习速成课程

【机器学习课程】Google机器学习速成课程

专知会员服务

169+阅读 · 2019年12月2日

【图灵奖得主Judea Pearl推荐新书】图模型(Graphical Models), 571页pdf，带你学习GM和因果推断

【图灵奖得主Judea Pearl推荐新书】图模型(Graphical Models), 571页pdf，带你学习GM和因果推断

专知会员服务

71+阅读 · 2019年10月25日

免费中文书籍-《神经网络与深度学习》中文版推荐

免费中文书籍-《神经网络与深度学习》中文版推荐

深度学习与NLP

20+阅读 · 2019年4月2日

博客 | 斯坦福大学—自然语言处理中的深度学习（CS 224D notes-1）

博客 | 斯坦福大学—自然语言处理中的深度学习（CS 224D notes-1）

AI研习社

5+阅读 · 2018年11月19日

机器学习必知的8大神经网络架构

机器学习必知的8大神经网络架构

七月在线实验室

7+阅读 · 2018年4月26日

推荐｜斯坦福大学面向Tensorflow深度学习研究课程(2018)

推荐｜斯坦福大学面向Tensorflow深度学习研究课程(2018)

全球人工智能

4+阅读 · 2018年1月14日

【深度学习】这里有一份神经网络入门指导，请收下！

【深度学习】这里有一份神经网络入门指导，请收下！

产业智能官

4+阅读 · 2017年12月11日

深度学习和普通机器学习之间有何区别？

深度学习和普通机器学习之间有何区别？

36大数据

7+阅读 · 2017年12月4日

推荐｜一份不错的机器学习笔记！

推荐｜一份不错的机器学习笔记！

全球人工智能

22+阅读 · 2017年11月20日

推荐｜台大陈蕴侬、李宏毅“应用深度学习”课程(7-9)

推荐｜台大陈蕴侬、李宏毅“应用深度学习”课程(7-9)

全球人工智能

6+阅读 · 2017年10月25日

10分钟搞懂Tensorflow 逻辑回归实现手写识别

10分钟搞懂Tensorflow 逻辑回归实现手写识别

全球人工智能

5+阅读 · 2017年10月19日

【机器学习】推荐13个机器学习框架

【机器学习】推荐13个机器学习框架

产业智能官

8+阅读 · 2017年9月10日

Financial Time Series Representation Learning

Financial Time Series Representation Learning

Arxiv

10+阅读 · 2020年3月27日

A Comprehensive Survey on Graph Neural Networks

A Comprehensive Survey on Graph Neural Networks

Arxiv

21+阅读 · 2019年1月3日

How Powerful are Graph Neural Networks?

Arxiv

23+阅读 · 2018年10月1日

Adversarial Reprogramming of Neural Networks

Adversarial Reprogramming of Neural Networks

Arxiv

3+阅读 · 2018年6月28日

Relational recurrent neural networks

Relational recurrent neural networks

Arxiv

8+阅读 · 2018年6月28日

Relational inductive biases, deep learning, and graph networks

Arxiv

4+阅读 · 2018年6月4日

Discovering Discrete Latent Topics with Neural Variational Inference

Arxiv

9+阅读 · 2018年5月21日

Neural-Brane: Neural Bayesian Personalized Ranking for Attributed Network Embedding

Arxiv

4+阅读 · 2018年4月23日

Online Representation Learning with Single and Multi-layer Hebbian Networks for Image Classification

Arxiv

5+阅读 · 2018年1月29日

Arxiv

8+阅读 · 2018年1月25日

VIP会员

相关主题

线性分类器

斯坦福大学 (Stanford University)

相关VIP内容

【斯坦福大学博士论文】机器学习中的凸优化问题,108页pdf

【斯坦福大学博士论文】机器学习中的凸优化问题,108页pdf

专知会员服务

162+阅读 · 2020年6月14日

机器学习如何用于芯片系统设计？Jeff Dean推荐Google最新《机器学习系统芯片设计》70页ppt为你讲解

机器学习如何用于芯片系统设计？Jeff Dean推荐Google最新《机器学习系统芯片设计》70页ppt为你讲解

专知会员服务

61+阅读 · 2020年5月31日

来自Fariz Darari博士的一份简明《神经网络与深度学习》的讲义，64页ppt

来自Fariz Darari博士的一份简明《神经网络与深度学习》的讲义，64页ppt

专知会员服务

92+阅读 · 2020年5月5日

Capsule Networks，胶囊网络，57页ppt，布法罗大学

Capsule Networks，胶囊网络，57页ppt，布法罗大学

专知会员服务

69+阅读 · 2020年2月29日

麻省理工学院MIT-ICLR2020《神经网络能推断出什么?》

麻省理工学院MIT-ICLR2020《神经网络能推断出什么?》

专知会员服务

51+阅读 · 2020年2月19日

【斯坦福大学】场景图谱表示在计算机视觉中的应用，41页ppt

【斯坦福大学】场景图谱表示在计算机视觉中的应用，41页ppt

专知会员服务

52+阅读 · 2020年1月8日

【金融机器学习课程资料】Financial Machine Learning

专知会员服务

118+阅读 · 2019年12月24日

【斯坦福大学Chelsea Finn-NeurIPS 2019】贝叶斯元学习

【斯坦福大学Chelsea Finn-NeurIPS 2019】贝叶斯元学习

专知会员服务

38+阅读 · 2019年12月17日

【机器学习课程】Google机器学习速成课程

【机器学习课程】Google机器学习速成课程

专知会员服务

169+阅读 · 2019年12月2日

【图灵奖得主Judea Pearl推荐新书】图模型(Graphical Models), 571页pdf，带你学习GM和因果推断

【图灵奖得主Judea Pearl推荐新书】图模型(Graphical Models), 571页pdf，带你学习GM和因果推断

专知会员服务

71+阅读 · 2019年10月25日

热门VIP内容

开通专知VIP会员享更多权益服务

操作系统智能体：基于多模态大模型（MLLM）的通用计算设备智能体综述

《美国太空军系统全生命周期建模、仿真与分析效能提升方案》最新84页报告

【博士论文】推进数据高效的深度学习：非参数 Transformer、主动测试与上下文学习

自主人工智能：未来战争是否将是自主化的？

相关资讯

免费中文书籍-《神经网络与深度学习》中文版推荐

免费中文书籍-《神经网络与深度学习》中文版推荐

深度学习与NLP

20+阅读 · 2019年4月2日

博客 | 斯坦福大学—自然语言处理中的深度学习（CS 224D notes-1）

博客 | 斯坦福大学—自然语言处理中的深度学习（CS 224D notes-1）

AI研习社

5+阅读 · 2018年11月19日

机器学习必知的8大神经网络架构

机器学习必知的8大神经网络架构

七月在线实验室

7+阅读 · 2018年4月26日

推荐｜斯坦福大学面向Tensorflow深度学习研究课程(2018)

推荐｜斯坦福大学面向Tensorflow深度学习研究课程(2018)

全球人工智能

4+阅读 · 2018年1月14日

【深度学习】这里有一份神经网络入门指导，请收下！

【深度学习】这里有一份神经网络入门指导，请收下！

产业智能官

4+阅读 · 2017年12月11日

深度学习和普通机器学习之间有何区别？

深度学习和普通机器学习之间有何区别？

36大数据

7+阅读 · 2017年12月4日

推荐｜一份不错的机器学习笔记！

推荐｜一份不错的机器学习笔记！

全球人工智能

22+阅读 · 2017年11月20日

推荐｜台大陈蕴侬、李宏毅“应用深度学习”课程(7-9)

推荐｜台大陈蕴侬、李宏毅“应用深度学习”课程(7-9)

全球人工智能

6+阅读 · 2017年10月25日

10分钟搞懂Tensorflow 逻辑回归实现手写识别

10分钟搞懂Tensorflow 逻辑回归实现手写识别

全球人工智能

5+阅读 · 2017年10月19日

【机器学习】推荐13个机器学习框架

【机器学习】推荐13个机器学习框架

产业智能官

8+阅读 · 2017年9月10日

相关论文

Financial Time Series Representation Learning

Financial Time Series Representation Learning

Arxiv

10+阅读 · 2020年3月27日

A Comprehensive Survey on Graph Neural Networks

A Comprehensive Survey on Graph Neural Networks

Arxiv

21+阅读 · 2019年1月3日

How Powerful are Graph Neural Networks?

Arxiv

23+阅读 · 2018年10月1日

Adversarial Reprogramming of Neural Networks

Adversarial Reprogramming of Neural Networks

Arxiv

3+阅读 · 2018年6月28日

Relational recurrent neural networks

Relational recurrent neural networks

Arxiv

8+阅读 · 2018年6月28日

Relational inductive biases, deep learning, and graph networks

Arxiv

4+阅读 · 2018年6月4日

Discovering Discrete Latent Topics with Neural Variational Inference

Arxiv

9+阅读 · 2018年5月21日

Neural-Brane: Neural Bayesian Personalized Ranking for Attributed Network Embedding

Arxiv

4+阅读 · 2018年4月23日

Online Representation Learning with Single and Multi-layer Hebbian Networks for Image Classification

Arxiv

5+阅读 · 2018年1月29日

Arxiv

8+阅读 · 2018年1月25日

大家都在搜

大型语言模型

CMU博士论文

久别重逢话双塔

再见，TD-SCDMA！