人工神经网络（梯度下降算法）介绍-电子发烧友网

在实际问题中，已知量是数据和数据标签，决策函数是未知的，即神经网络的结构未知。

因此，在使用人工神经网络结构解决实际问题时，需先假设人工神经网络结构，再将训练数据输入到该结构中，最后求解待求参数。

一、假设人工神经网络结构

假设人工神经网络结构主要需要确定两个问题：

（1）人工神经网络结构共有多少层？

（2）每层神经元的数量是多少？

目前，上述两个问题没有标准答案，开发人员需根据经验解决上述两个问题。解决上述两个问题时，开发人员可根据以下准则：

（1）若问题是简单的，两个类别的分界曲线是不复杂的，则可选用较简单的人工神经网络结构，即人工神经网络层数和每层神经数量均可较少。

图片来源：中国慕课大学《机器学习概论》

（2）若问题是复杂的，例如：人脸识别问题，则可选用较复杂的人工神经网络结构，即人工神经网络层数和每层神经数量均可较多。

（3）若训练数据较少，则可选用较简单的人工神经网络结构。

（4）若训练数据较多，则可选用较复杂的人工神经网络结构。

二、求解人工神经网络待求参数

以两层神经网络模型为例，如图一所示，输入为(X,Y)，其中，X=[x1,x2]T，Y是标签值（label），问题为通过改变ω和b的值，使得标签值Y与实际的人工神经网络输出值y最接近。

图一，图片来源：中国慕课大学《机器学习概论》

根据前篇文章，y的表达式为： y=ω1φ(ω11x1+ω12x2+b1)+ω2φ(ω21x1+ω22x2+b1)+b3

使得y和Y最接近可表达为： Minimize:E(ω,b)=E(X,Y)[(Y-y)2]

其中，E(X,Y)为训练样本和标签的数学期望（平均值）。因为y是(ω,b)的非凸函数，所以该问题无法求得唯一最小值。

因此，采用梯度下降法(Gradient Descent Method)求解局部极小值。梯度下降法的步骤如下：

（1）随机选取ω和b的初始值(ω(0),b(0))

（2）应用迭代算法求目标函数的局部极值，在第n步迭代中，ω和b的迭代公式为： ω(n+1)=ω(n)-α·∂E/∂ω b(n+1)=b(n)-α·∂E/∂b

其中，α为学习率（Learning rate），α由开发人员设定，开发人员需选取合适的α值，若α值被设定得过大，则容易错过局部极值点，若α值被设定得过小，则可能较长时间不能找到局部极值点，只有当α值被设定得合适时，才能快速收敛至局部极值点。但因为人工神经网络对应的决策函数未知，所以没有一种可求解α值的方法，开发人员需根据经验设定α值。

图片来源：中国慕课大学《机器学习概论》

梯度下降法的含义：如图二所示，通过迭代的方式逐步遍历x1，x2，x3，…，xn，最终找到函数的局部极小值，此值即为y和Y最接近的值。

图片来源：中国慕课大学《机器学习概论》

审核编辑：刘清

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

人工神经网络

人工神经网络

+关注

关注
1

文章
119

浏览量
14623
机器学习

机器学习

+关注

关注
66

文章
8414

浏览量
132612

原文标题：机器学习相关介绍（27）——人工神经网络（梯度下降算法）

文章出处：【微信号：行业学习与研究，微信公众号：行业学习与研究】欢迎添加关注！文章转载请注明出处。

人工神经网络原理及下载

人工神经网络是根据人的认识过程而开发出的一种算法。假如我们现在只有一些输入和相应的输出，而对如何由输入得到输出的机理并不清楚，那么我们可以把输入与输出之间的未知过程看成是一个“网络”，

发表于 06-19 14:40

MATLAB神经网络工具箱函数

MATLAB神经网络工具箱函数说明：本文档中所列出的函数适用于MATLAB5.3以上版本，为了简明起见，只列出了函数名，若需要进一步的说明，请参阅MATLAB的帮助文档。1. 网络创建函数newp

发表于 09-22 16:10

神经网络教程（李亚非）

　　第1章概述　　1.1 人工神经网络研究与发展　　1.2 生物神经元　　1.3 人工神经网络的构成　　第2章

发表于 03-20 11:32

人工神经网络课件

人工神经网络课件

发表于 06-19 10:15

【专辑精选】人工智能之神经网络教程与资料

电子发烧友总结了以“神经网络”为主题的精选干货，今后每天一个主题为一期，希望对各位有所帮助！（点击标题即可进入页面下载相关资料）人工神经网络算法的学习方法与应用实例（pdf彩版）卷积

发表于 05-07 19:18

【案例分享】基于BP算法的前馈神经网络

传播的，不会回流），区别于循环神经网络RNN。BP算法（Back Propagation）：误差反向传播算法，用于更新网络中的权重。BP神经网络

发表于 07-21 04:00

人工神经网络实现方法有哪些？

人工神经网络(Artificial Neural Network，ANN)是一种类似生物神经网络的信息处理结构，它的提出是为了解决一些非线性，非平稳，复杂的实际问题。那有哪些办法能实现人工

发表于 08-01 08:06

【AI学习】第3篇--人工神经网络

`本篇主要介绍：人工神经网络的起源、简单神经网络模型、更多神经网络模型、机器学习的步骤：训练与预测、训练的两阶段：正向推演与反向传播、以Te

发表于 11-05 17:48

卷积神经网络模型发展及应用

5]、自然语言处理[6- 7]等领域已被广泛应用。在卷积神经网络兴起之前，主要依靠人工针对特定的问题设计算法，比如采用 Sobel、LoG（Laplacian of Gaussian）、Canny

发表于 08-02 10:39

长短时记忆神经网络的算法

通过上一篇文章［人工智能之循环神经网络（RNN）］介绍，我们知道，RNN是一类功能强大的人工神经网络算

发表于 06-29 14:44 •4745次阅读

深度神经网络的困扰梯度爆炸与梯度消失

，LSTM）正是为了解决梯度消失问题而设计的一种特殊的RNN结构。深度神经网络的困扰：梯度爆炸与梯度消失在此前的普通深度神经网络和深度卷

发表于 08-23 09:12 •4554次阅读

详解神经网络中反向传播和梯度下降

摘要：反向传播指的是计算神经网络参数梯度的方法。

发表于 03-14 11:07 •1033次阅读

卷积神经网络的介绍什么是卷积神经网络算法

卷积神经网络的介绍什么是卷积神经网络算法卷积神经网络涉及的关键技术卷积神经网络（Convo

发表于 08-21 16:49 •1873次阅读

神经网络反向传播算法的原理、数学推导及实现步骤

神经网络反向传播算法（Backpropagation Algorithm）是一种用于训练多层神经网络的算法，其基本原理是通过梯度

发表于 07-03 11:16 •787次阅读

神经网络反向传播算法的优缺点有哪些

是一种模拟人脑神经元网络的计算模型，具有强大的非线性映射能力和泛化能力。反向传播算法是训练神经网络的核心算法，通过梯度

发表于 07-03 11:24 •947次阅读

搜索历史

人工神经网络（梯度下降算法）介绍

评论

人工神经网络原理及下载

MATLAB神经网络工具箱函数

神经网络教程（李亚非）

人工神经网络课件

【专辑精选】人工智能之神经网络教程与资料

【案例分享】基于BP算法的前馈神经网络

人工神经网络实现方法有哪些？

【AI学习】第3篇--人工神经网络

卷积神经网络模型发展及应用

长短时记忆神经网络的算法

深度神经网络的困扰梯度爆炸与梯度消失

详解神经网络中反向传播和梯度下降

卷积神经网络的介绍什么是卷积神经网络算法

神经网络反向传播算法的原理、数学推导及实现步骤

神经网络反向传播算法的优缺点有哪些