激活函数中sigmoid、ReLU等函数的一些性质-电子发烧友网

本文主要是回答激活函数的使用

我们认识的激活函数中sigmoid、ReLU等，今天就是要讲解一下这些函数的一些性质

激活函数通常有一些性质：

非线性：当激活函数是线性的时候，一个两层的神经网络就可以基本逼近所有的函数，但是，如果激活函数是恒等激活函数的时候，就不满足这个性质了，而且如果MLP使用的是恒等激活函数，那么其实整个网络跟单层神经网络是等价的

可微性：当优化方法是基于梯度的时候，这个性质是必须的

单调性：当激活函数是单调的时候，这个性质是必须的

f(x)≈x：当激活函数满足这个性质的时候，如果参数的初始化是random的很小的值，那么神经网络的训练将会很高效；如果不满足这个性质，那么就需要很用心的去设置初始值

输出值的范围：当激活函数输出值是有限的时候，基于梯度的优化方法会更加稳定，因为特征的表示，当激活函数的输出是无限的时候，模型训练会更加的高效，不过在这种情况很小，一般需要一个更小的学习率

Sigmoid函数

Sigmoid是常用的激活函数，它的数学形式是这样，

当如果是非常大的负数或者正数的时候，梯度非常小，接近为0，如果你的初始值是很大的话，大部分神经元都出在饱和的情况，会导致很难学习

还有就是Sigmoid的输出，不是均值为0为的平均数，如果数据进入神经元的时候是正的(e.g.x>0elementwise inf=wTx+b)，那么w计算出的梯度也会始终都是正的。

当然了，如果你是按batch去训练，那么那个batch可能得到不同的信号，所以这个问题还是可以缓解一下的。因此，非0均值这个问题虽然会产生一些不好的影响

tanh

和Sigmoid函数很像，不同的是均值为0，实际上是Sigmoid的变形

数学形式

与Sigmoid不同的是，tanh是均值为0

ReLU

今年来，ReLU貌似用的很多

数学形式

ReLU的优点

相比较其他的，ReLU的收敛速度会比其他的方法收敛速度快的多

ReLU只需要一个阈值就可以得到激活值，而不用去算一大堆复杂的运算

也有一个很不好的缺点：就是当非常大的梯度流过一个 ReLU 神经元，更新过参数之后，这个神经元再也不会对任何数据有激活现象了，所以我们在训练的时候都需要设置一个比较合适的较小的学习率

Leaky-ReLU、P-ReLU、R-ReLU

数学形式

f(x)=x，(x>=0)

这里的α是一个很小的常数。这样，即修正了数据分布，又保留了一些负轴的值，使得负轴信息不会全部丢失

自己在写神经网络算法的时候还没尝试过这个激活函数，有兴趣的同学可以试试效果

对于 Leaky ReLU 中的α，通常都是通过先验知识人工赋值的。

然而可以观察到，损失函数对α的导数我们是可以求得的，可不可以将它作为一个参数进行训练呢？

不仅可以训练，而且效果更好。

如何去选择

目前业界人都比较流行ReLU，

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

神经网络

神经网络

+关注

关注
42

文章
4785

浏览量
101276
函数

函数

+关注

关注
3

文章
4350

浏览量
63051

原文标题：BP神经网络常用激活函数

文章出处：【微信号：AI_shequ，微信公众号：人工智能爱好者社区】欢迎添加关注！文章转载请注明出处。

sigmoid函数波形

1、Sigmoid函数原型2、sigmoid函数波形：由图形可看出在-10时已经接近于0，一般取值区间在[-5,5]。3、

发表于 09-03 06:53

Sigmoid函数介绍

一、Sigmoid 函数1.1 Sigmoid函数原型1.2 sigmoid

发表于 09-03 09:06

多输出Plateaued函数的密码学性质

该文对多输出Plateaued 函数的一些密码学性质进行了研究，以多输出函数的特征函数为工具，建立了多输出Plateaued

发表于 11-17 13:51 •18次下载

Sigmoid函数的拟合法分析及其高效处理

使用分段非线性逼近算法计算超越函数，以神经网络中应用最为广泛的Sigmoid函数为例，结合函数自身对称的

发表于 11-15 13:15 •1.2w次阅读

ReLU到Sinc的26种神经网络激活函数可视化大盘点

本文介绍了26个激活函数的图示及其一阶导数，在神经网络中，激活函数决定来自给定输入集的节点的输出

发表于 01-11 17:42 •3.2w次阅读

13种神经网络激活函数

ReLU（Rectified Linear Unit，修正线性单元）训练速度比tanh快6倍。当输入值小于零时，输出值为零。当输入值大于等于零时，输出值等于输入值。当输入值为正数时，导数为1，因此不会出现sigmoid函数反向传

发表于 05-16 11:18 •3.3w次阅读

一些人会怀疑：难道神经网络不是最先进的技术？

如上图所示，sigmoid的作用确实是有目共睹的，它能把任何输入的阈值都限定在0到1之间，非常适合概率预测和分类预测。但这几年sigmoid与tanh却一直火不起来，凡是提及激活

发表于 06-30 08:55 •3415次阅读

PyTorch已为我们实现了大多数常用的非线性激活函数

PyTorch已为我们实现了大多数常用的非线性激活函数，我们可以像使用任何其他的层那样使用它们。让我们快速看一个在PyTorch中使用ReLU激活

发表于 07-06 14:47 •972次阅读

在PyTorch中使用ReLU激活函数的例子

PyTorch已为我们实现了大多数常用的非线性激活函数，我们可以像使用任何其他的层那样使用它们。让我们快速看一个在PyTorch中使用ReLU激活

发表于 07-06 15:27 •2607次阅读

Dynamic ReLU：根据输入动态确定的ReLU

这是我最近才看到的一篇论文，它提出了动态ReLU (Dynamic ReLU, DY-ReLU)，可以将全局上下文编码为超函数，并相应地调整

发表于 09-01 17:28 •752次阅读

PyTorch中激活函数的全面概览

为了更清晰地学习Pytorch中的激活函数，并对比它们之间的不同，这里对最新版本的Pytorch中的激活

发表于 04-30 09:26 •622次阅读

神经网络中激活函数的定义及类型

引言神经网络是一种模拟人脑神经元结构的计算模型，广泛应用于图像识别、自然语言处理、语音识别等领域。在神经网络中，激活函数起着至关重要的作用

发表于 07-02 10:09 •750次阅读

卷积神经网络激活函数的作用

卷积神经网络（Convolutional Neural Networks, CNNs）是深度学习中一种重要的神经网络结构，广泛应用于图像识别、语音识别、自然语言处理等领域。在卷积神经网络中，激

发表于 07-03 09:18 •1280次阅读

BP神经网络激活函数怎么选择

中，激活函数起着至关重要的作用，它决定了神经元的输出方式，进而影响整个网络的性能。一、激活函数

发表于 07-03 10:02 •834次阅读

神经元模型激活函数通常有哪几类

神经元模型激活函数是神经网络中的关键组成部分，它们负责在神经元之间引入非线性，使得神经网络能够学习和模拟复杂的函数映射。以下是对神经元模型激活

发表于 07-11 11:33 •1183次阅读