人工神经网络如何模拟人类大脑？实例分析ANN到底如何应用？

会员服务 ·

人工神经网络如何模拟人类大脑？实例分析ANN到底如何应用？

2017 年 7 月 27 日 深度学习世界 机器人圈

本文经公众号“机器人圈”授权转载（微信号：jiqirenchanye）

图：pixabay

原文来源：kdnuggets

作者：Jahnavi Mahanta

「机器人圈」编译：嗯~阿童木呀、多啦A亮

Jahnavi Mahanta是Deeplearningtrack的联合创始人，Deeplearningtrack是一个在线导师的数据科学培训平台。

人工神经网络（ANN）算法能够模拟人类大脑处理信息。接下来我们将为大家解释人脑和ANN如何进行工作的。

人工神经网络（ANN）使用大脑处理信息的方式为基础，以此进行开发可用于建模复杂模式和预测问题的算法。

首先，我们需要了解的是我们的大脑是如何进行信息处理的：

在我们的大脑中，有数十亿个称为神经元的细胞，它们以电信号的形式处理信息。神经元的树突接收来自外部的信息或刺激，并在神经元细胞体进行处理，将其转化为输出并通过轴突传到下一个神经元。下一个神经元可以选择接受或拒绝它，这主要取决于信号的强度。

第一步：树突接触外部信号。

第二步：神经元处理外部信号。

第三步：处理的信号转化为输出信号并通过轴突传送。

第四步：输出信号通过突触由下一个神经的树突接收。

以上就是人类大脑进行信息处理的过程，接下来，我们试着了解一下ANN如何工作的：

现在，w1，w2，w3分别给出输入信号的强度。

正如你从上面可以看到的那样，ANN是一个非常简单的大脑神经元工作方式的表征。

为了使事情变得简单明了，让我们可以用一个简单的示例来帮助理解ANN：一家银行想评估是否批准一个客户的贷款申请，所以，它想要预测这个客户是否可能违约贷款。现在，它有如下数据：

所以，我们必须预测第X列。预测结果越接近1就表明客户违约的机会越大。

我们可以使用这个示例，创建一个简单的基于神经元结构的人工神经网络结构：

通常而言，针对上述示例的简单ANN架构可以是这样的：

与架构有关的要点：

1.网络架构有一个输入层，隐藏层（可以是1层以上）和输出层。由于层数较多，因此也称之为MLP（多层感知器）。

2.隐藏层可以被看作是一个“蒸馏层”，从输入中抽出一些重要的模式，并将其传递到下一层上。它通过从输入中识别出重要的信息而排除冗余信息，从而使网络更加快速和高效。

3.激活函数有两个显著的目的：

它可以捕获输入之间的非线性关系。

它可以有助于将输入转换为更为有用的输出。

在上面的例子中，所使用的激活函数是sigmoid：

O1 = 1/1 + e-F

其中F = W1 * X1 + W2 * X2 + W3 * X3

Sigmoid激活函数创建一个值在0和1之间的输出。当然，其他激活函数，如Tanh，softmax和RELU也是可以用的。

4.类似地，隐藏层引起输出层的最终预测：

O3 = 1/1 + e-F 1

其中F 1 = W7 * H1 + W8 * H2

这里，输出值（O3）的范围在0和1之间。接近1（例如0.75）的值表示存在客户默认值较高。

5.权重W是与输入相关联的重要点。如果W1是0.56，W2是0.92，那么在预测H1时，X2：债务比率比X1：Age更重要。

6.上述网络架构称为“前馈网络”，你可以看到输入信号只在一个方向（从输入到输出）流动。我们还可以创建信号在两个方向上流动的“反馈网络”。

7.具有高精度的良好模型提供了非常接近实际值的预测。因此，在上表中，列X值应该非常接近于列W值。预测误差是列W和列X之间的差异：

8.获得具有准确预测的良好模型的关键是找到最小化预测误差的“W权重的最优值”。这是使用“反向传播算法”实现的，这使ANN成为一种学习算法，因为通过从错误中学习，模型得到了改进。

9.最常见的优化方法称为“梯度下降”，其中使用了迭代不同的W值，并对预测误差进行了评估。因此，为了得到最优的W值，W值的变化很小，对预测误差的影响进行了评估。最后，W的这些值被选为最优的，随着W的进一步变化，误差不会进一步降低。要了解梯度下降的更详细的信息，请参考http://www.kdnuggets.com/2017/04/simple-understand-gradient-descent-algorithm.html

神经网络的主要优点：

1.ANN有一些关键优势，使它们更适合适用于某些问题和情况：

2.ANN有能力去学习和建模非线性和复杂的关系，这非常重要，因为在现实生活中，输入和输出之间的许多关系是非线性的，也是复杂的。

3.ANN可以通用化—在从初始输入及其关系学习之后，它可以推断出看不见的数据之间的看不见的关系，从而使得模型能够概括和预测未知数据。

与许多其他预测技术不同，ANN不会对输入变量施加任何限制（例如，如何分配）。此外，许多研究已经表明，ANN可以更好地模拟异方差性，即具有高易变性和非常数方差的数据，因为它具有在数据中学习隐藏关系的能力，而不在数据中强加任何固定的关系。这在数据波动率很高的金融时间序列预测（例如股票价格）中非常有用。

几个应用：

由于其一些奇妙的特性，ANN在很多领域中都会产生作用：

1.图像处理和字符识别：ANN具有很多输入的能力，可以处理它们来推断隐藏以及复杂的非线性关系，ANN在图像和字符识别中起着重要的作用。手写字符识别在欺诈检测（例如银行欺诈）甚至国家安全评估中有很多应用。图像识别是一个不断增长的领域，广泛应用于社会媒体的面部识别，医学中的癌症滞留以及农业和国防用途的卫星图像处理。目前，对神经网络的研究为深层神经网络铺平了道路，形成了“深度学习”的基础，现已开创了计算机视觉、语音识别、自然语言处理等一系列令人兴奋的转型创新，尤其是在自动驾驶汽车领域。

2.预测：在日常业务决策（例如销售、产品之间的财务分配、产能利用率）、经济和货币政策、金融和股票市场中广泛需要预测。更常见的是，预测问题是复杂的，例如，预测股价是一个复杂的问题，有许多潜在因素（一些是已知的，一些是未知的）。传统的预测模型考虑到这些复杂的非线性关系，引起了局限性。鉴于其能够建模和提取不可见的特征和关系，ANN以正确的方式应用，可以提供强大的替代方案。此外，与这些传统模型不同，ANN不对输入和剩余分布施加任何限制。

例如，在该领域进行的研究非常热——最近在使用LSTM和循环神经网络进行预测方面取得了进展。

ANN是具有广泛应用的强大的模型。以上，我列举了几个突出的例子，但它们在医药、安全、银行/金融以及政府、农业和国防等领域有着广泛的应用。

点击下方“阅读原文”了解同声译APP

↓↓↓

登录查看更多

相关内容

人工神经网络

关注 131

人工神经网络（Artificial Neural Network，即ANN），它从信息处理角度对人脑神经元网络进行抽象，建立某种简单模型，按不同的连接方式组成不同的网络。在工程与学术界也常直接简称为神经网络或类神经网络。神经网络是一种运算模型，由大量的节点（或称神经元）之间相互联接构成。每个节点代表一种特定的输出函数，称为激励函数（activation function）。每两个节点间的连接都代表一个对于通过该连接信号的加权值，称之为权重，这相当于人工神经网络的记忆。网络的输出则依网络的连接方式，权重值和激励函数的不同而不同。而网络自身通常都是对自然界某种算法或者函数的逼近，也可能是对一种逻辑策略的表达。

【2020新书】从Excel中学习数据挖掘，223页pdf

专知会员服务

93+阅读 · 2020年6月28日

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

专知会员服务

134+阅读 · 2020年6月7日

【PNAS2020-斯坦福】自监督训练的人工神经网络中的涌现语言结构

专知会员服务

20+阅读 · 2020年6月5日

【图神经网络(GNN)结构化数据分析】

专知会员服务

117+阅读 · 2020年3月22日