带Dropout的训练过程-电子发烧友网

dropout是指在深度学习网络的训练过程中，对于神经网络单元，按照一定的概率将其暂时从网络中丢弃。注意是暂时，对于随机梯度下降来说，由于是随机丢弃，故而每一个mini-batch都在训练不同的网络。

过拟合是深度神经网（DNN）中的一个常见问题：模型只学会在训练集上分类，这些年提出的许多过拟合问题的解决方案，其中dropout具有简单性而且效果也非常良好。

算法概述

我们知道如果要训练一个大型的网络，而训练数据很少的话，那么很容易引起过拟合，一般情况我们会想到用正则化、或者减小网络规模。然而Hinton在2012年文献：《Improving neural networks by preventing co-adaptation of feature detectors》提出了，在每次训练的时候，随机让一半的特征检测器停过工作，这样可以提高网络的泛化能力，Hinton又把它称之为dropout。

第一种理解方式是，在每次训练的时候使用dropout，每个神经元有百分之50的概率被移除，这样可以使得一个神经元的训练不依赖于另外一个神经元，同样也就使得特征之间的协同作用被减弱。Hinton认为，过拟合可以通过阻止某些特征的协同作用来缓解。

第二种理解方式是，我们可以把dropout当做一种多模型效果平均的方式。对于减少测试集中的错误，我们可以将多个不同神经网络的预测结果取平均，而因为dropout的随机性，我们每次dropout后，网络模型都可以看成是一个不同结构的神经网络，而此时要训练的参数数目却是不变的，这就解脱了训练多个独立的不同神经网络的时耗问题。在测试输出的时候，将输出权重除以二，从而达到类似平均的效果。

需要注意的是如果采用dropout，训练时间大大延长，但是对测试阶段没影响。

带dropout的训练过程

而为了达到ensemble的特性，有了dropout后，神经网络的训练和预测就会发生一些变化。在这里使用的是dropout以pp的概率舍弃神经元

训练层面

对应的公式变化如下如下：

没有dropout的神经网络：

有dropout的神经网络：

无可避免的，训练网络的每个单元要添加一道概率流程。

测试层面

预测的时候，每一个单元的参数要预乘以p。

除此之外还有一种方式是，在预测阶段不变，而训练阶段改变。

Inverted Dropout的比例因子是

关于这个比例我查了不少资料，前面的是论文的结论；后面是keras源码中dropout的实现。有博客写的公式不一致，我写了一个我觉得是对的版本。

Dropout与其它正则化

Dropout通常使用L2归一化以及其他参数约束技术。正则化有助于保持较小的模型参数值。

使用Inverted Dropout后，上述等式变为：

可以看出使用Inverted Dropout，学习率是由因子q=1−p进行缩放。由于q在[0,1]之间，η和q之间的比例变化：

参考文献将q称为推动因素，因为其能增强学习速率，将r(q)称为有效的学习速率。

有效学习速率相对于所选的学习速率而言更高：基于此约束参数值的规一化可以帮助简化学习速率选择过程。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

Dropout

Dropout

+关注

关注
0

文章
13

浏览量
10081
深度学习

深度学习

+关注

关注
73

文章
5521

浏览量
121680

原文标题：理解神经网络中的Dropout

文章出处：【微信号：Imgtec，微信公众号：Imagination Tech】欢迎添加关注！文章转载请注明出处。

基于智能语音交互芯片的模拟训练器示教与回放系统设计

，提高了培训效果。回放系统通过记录操作训练过程中各操作人员的口令、声音强度、动作、时间、操作现象等，待操作训练结束后通过重演训练过程，以便操作者及时纠正自己的问题。示教系统也可理解为对标准操作

发表于 07-01 08:07

Python和Keras在训练期间如何将高斯噪声添加到输入数据中呢？

噪声，模型被迫学习对输入中的微小变化具有鲁棒性的特征，这可以帮助它在新的、看不见的数据上表现更好。高斯噪声也可以在训练过程中添加到神经网络的权重中以提高其性能，这种技术称为 Dropout。让我们

发表于 02-16 14:04

基于有限状态机的虚拟训练过程模型研究

通过一个基于操作规程的虚拟训练系统研究了系统仿真流程，分析了有限状态机（FSM）的原理，结合虚拟仿真训练的特点，设计出了操作过程模型，并通过Windows 消息机制编程实

发表于 12-07 14:23 •14次下载

理解神经网络中的Dropout

dropout是指在深度学习网络的训练过程中，对于神经网络单元，按照一定的概率将其暂时从网络中丢弃。注意是暂时，对于随机梯度下降来说，由于是随机丢弃，故而每一个mini-batch都在训练不同的网络

发表于 11-16 01:11 •3838次阅读

卷积神经网络训练过程中的SGD的并行化设计

for parallelizing convolutional neural networks 本文也将针对这篇文章给出分析。 1、简介介绍一种卷积神经网络训练过程中的SGD的并行化方法。

发表于 11-16 14:43 •3407次阅读

分类器的训练过程

opencv中haar、lbp的训练原理及过程

发表于 11-27 15:18 •0次下载

基于分割后门训练过程的后门防御方法

后门攻击的目标是通过修改训练数据或者控制训练过程等方法使得模型预测正确干净样本，但是对于带有后门的样本判断为目标标签。例如，后门攻击者给图片增加固定位置的白块(即中毒图片)并且修改图片的标签为目标标签。用这些中毒数据训练模型过后

发表于 01-05 09:23 •986次阅读

深度学习模型训练过程详解

详细介绍深度学习模型训练的全过程，包括数据预处理、模型构建、损失函数定义、优化算法选择、训练过程以及模型的评估与调优。

发表于 07-01 16:13 •1622次阅读

卷积神经网络的基本原理、结构及训练过程

、训练过程以及应用场景。一、卷积神经网络的基本原理卷积运算卷积运算是卷积神经网络的核心，它是一种数学运算，用于提取图像中的局部特征。卷积运算的过程如下：（1）定义卷积核：卷积核是一个小的矩阵，用于在输入图像上滑动，提取局部特征。（2）滑动窗口：将

发表于 07-02 14:21 •3153次阅读

CNN模型的基本原理、结构、训练过程及应用领域

CNN模型的基本原理、结构、训练过程以及应用领域。卷积神经网络的基本原理 1.1 卷积运算卷积运算是CNN模型的核心，它是一种数学运算

发表于 07-02 15:26 •4242次阅读

卷积神经网络的基本结构和训练过程

处理具有空间层次结构的数据时表现出色。本文将从卷积神经网络的历史背景、基本原理、网络结构、训练过程以及应用领域等方面进行详细阐述，以期全面解析这一重要算法。

发表于 07-02 18:27 •1116次阅读

深度学习的典型模型和训练过程

深度学习作为人工智能领域的一个重要分支，近年来在图像识别、语音识别、自然语言处理等多个领域取得了显著进展。其核心在于通过构建复杂的神经网络模型，从大规模数据中自动学习并提取特征，进而实现高效准确的预测和分类。本文将深入解读深度学习中的典型模型及其训练过程，旨在为读者提供一个全面而深入的理解。

发表于 07-03 16:06 •1772次阅读

解读PyTorch模型训练过程

PyTorch作为一个开源的机器学习库，以其动态计算图、易于使用的API和强大的灵活性，在深度学习领域得到了广泛的应用。本文将深入解读PyTorch模型训练的全过程，包括数据准备、模型构建、训练循环、评估与保存等关键步骤，并结合

发表于 07-03 16:07 •1249次阅读

BP神经网络的基本结构和训练过程

网络结构，通过误差反向传播算法（Error Backpropagation Algorithm）来训练网络，实现对复杂问题的学习和解决。以下将详细阐述BP神经网络的工作方式，涵盖其基本原理、训练过程、应用实例以及优缺点等多个方面。

发表于 07-10 15:07 •5322次阅读

GPU是如何训练AI大模型的

在AI模型的训练过程中，大量的计算工作集中在矩阵乘法、向量加法和激活函数等运算上。这些运算正是GPU所擅长的。接下来，AI部落小编带您了解GPU是如何训练AI大模型的。

发表于 12-19 17:54 •287次阅读

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

带Dropout的训练过程

评论

基于智能语音交互芯片的模拟训练器示教与回放系统设计

Python和Keras在训练期间如何将高斯噪声添加到输入数据中呢？

基于有限状态机的虚拟训练过程模型研究

理解神经网络中的Dropout

卷积神经网络训练过程中的SGD的并行化设计

分类器的训练过程

基于分割后门训练过程的后门防御方法

深度学习模型训练过程详解

卷积神经网络的基本原理、结构及训练过程

CNN模型的基本原理、结构、训练过程及应用领域

卷积神经网络的基本结构和训练过程

深度学习的典型模型和训练过程

解读PyTorch模型训练过程

BP神经网络的基本结构和训练过程

GPU是如何训练AI大模型的