在深度学习中为什么要正则化输入？-电子发烧友网

本文作者原创，转载请注明出处。

今天我们来讲解一下为什么要正则化输入（也叫标准化输入）呢？

正则化输入其实就是论文中说的局部相应归一化，它最早由Krizhevsky和Hinton在关于ImageNet的论文里面使用的一种数据标准化方法。

在实际应用中，我们可能会遇到各维度数据或者各特征在空间中的分布差别很大。就如同下图

这给训练增加了难度，我们可以看一下如果是这样的数据我们会得到一个什么样的梯度下降图。

很明显，这是一个狭长的立体图形，在进行反向传播的过程中，如果在两端开始梯度下降的话，整个过程就变得很漫长。所以为了解决这种情况，我们使用了正则化输入去解决。下面就是正则化输入的计算公式：

按照这个公式来计算的话，我们的梯度下降就变成这样了。

这样的话我们无论是从哪一个点开始梯度下降，得到的效果是一样的。

那我们再来看一下在Tensorflow中是怎么实现的。Tensorflow中的API是tf.nn.lrn，别名也叫tf.nn.local_response_normalization，这两个是一个东西。再来看一下函数是怎么定义的：

local_response_normalization(  input,  depth_radius=5,  bias=1,  alpha=1,  beta=0.5,  name=None)

里面那么多参数，那分别又是代表什么呢？首先，input是我们要输入的张量，depth_radius就是上面公式中的n/2，其实这个变量名为什么叫depth_radius呢？radius不是半径吗？与半径又有什么关系呢，我等下再来讲解为什么。接着，bias是偏移量，alpha就是公式中的α，beat就是公式中的β。

其实啊，LRN也可以看作是“每个像素”在零值化后除以“半径以内的其他对应像素的平方和”，这个半径就是给定的变量depth_radius的值。

那我们用代码来看一下效果怎么样：

import numpy as npimport tensorflow as tfa = 2 * np.ones([2, 2, 2, 3])print(a)b = tf.nn.local_response_normalization(a, 1, 0, 1, 1)with tf.Session() as sess:    print(sess.run(b))

输出的结果a是：

输出的结果b是：

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

深度学习

深度学习

+关注

关注
73

文章
5503

浏览量
121182
正则化输入

正则化输入

+关注

关注
0

文章
1

浏览量
846

原文标题：技术详解 | 为什么要正则化输入？

文章出处：【微信号：gh_a204797f977b，微信公众号：深度学习实战】欢迎添加关注！文章转载请注明出处。

深度学习在汽车中的应用

的“深度”层面源于输入层和输出层之间实现的隐含层数目，隐含层利用数学方法处理（筛选/卷积）各层之间的数据，从而得出最终结果。在视觉系统中，深度

发表于 03-13 06:45

改善深层神经网络--超参数优化、batch正则化和程序框架学习总结

《深度学习工程师-吴恩达》02改善深层神经网络--超参数优化、batch正则化和程序框架学习总结

发表于 06-16 14:52

深度学习在预测和健康管理中的应用

深度学习在预测和健康管理中的应用综述摘要深度学习对预测和健康管理（PHM）引起了浓厚的兴趣，因为

发表于 07-12 06:46

一种基于机器学习的建筑物分割掩模自动正则化和多边形化方法

化处理，使其更加逼真，即有更多的直线型轮廓，在需要时构造直角。这是通过给定输入图像为真的概率的鉴别器和从鉴别器响应中学习创造更真实图像的生成器之间的相互作用来实现的。最后，从正则

发表于 09-01 07:19

dropout正则化技术介绍

dropout技术是神经网络和深度学习模型的一种简单而有效的正则化方式。本文将向你介绍dropout正则

发表于 10-10 10:38 •2次下载

基于快速自编码的正则化极限学习机

正则化极限学习机RELM是一种单隐层前馈神经网络，不同于传统神经网络算法，RELM通过随机设置输入层权重和偏置值，可以快速求得输出层权重，并且引入正

发表于 11-30 16:58 •0次下载

三种典型的神经网络以及深度学习中的正则化方法应用于无人驾驶

在前几十年，神经网络并没有受到人们的重视，直到深度学习的出现，人们利用深度学习解决了不少实际问题（即一些落地性质的商业应用），神经网络才成为学界和工业界关注的一个焦点。本文以尽可能直白

发表于 06-03 09:27 •9647次阅读

【连载】深度学习笔记4：深度神经网络的正则化

今天要写的是关于机器学习和深度学习中的一项关键技术：正则化。相信

发表于 08-14 11:58 •3351次阅读

深度学习笔记5：正则化与dropout

在笔记 4 中，详细阐述了机器学习中利用正则化防止过拟合的基本方法，对 L1 和 L

发表于 08-24 18:31 •3884次阅读

详解机器学习和深度学习常见的正则化

说到正则化大家应该都不陌生，这个在机器学习和深度学习中都是非常常见的，常用的

发表于 01-29 17:52 •2323次阅读

基于AdaBoost框架的弹性正则化多核学习算法

在正则化多核学习中，稀疏的核函数权值会导致有用信息丢失和泛化性能退化，而通过非稀疏模型选取所有核函数则会产生较多的冗余信息并对噪声敏感。针对

发表于 06-03 11:37 •1次下载

基于耦合字典学习与图像正则化的跨模态检索

基于耦合字典学习与图像正则化的跨模态检索

发表于 06-27 11:23 •39次下载

深度学习在语音识别中的应用及挑战

一、引言随着深度学习技术的快速发展，其在语音识别领域的应用也日益广泛。深度学习技术可以有效地提高语音识别的精度和效率，并且被广泛应用于各种

发表于 10-10 18:14 •909次阅读

深度学习模型中的过拟合与正则化

测试数据或新数据上表现不佳的现象。为了解决这个问题，正则化（Regularization）技术应运而生，成为深度学习中不可或缺的一部分。本文

发表于 07-09 15:56 •967次阅读

NPU在深度学习中的应用

设计的硬件加速器，它在深度学习中的应用日益广泛。 1. NPU的基本概念 NPU是一种专门针对深度学习算法优化的处理器，它与传统的CPU和G

发表于 11-14 15:17 •598次阅读

搜索历史

在深度学习中为什么要正则化输入？

评论

深度学习在汽车中的应用

改善深层神经网络--超参数优化、batch正则化和程序框架学习总结

深度学习在预测和健康管理中的应用

一种基于机器学习的建筑物分割掩模自动正则化和多边形化方法

dropout正则化技术介绍

基于快速自编码的正则化极限学习机

三种典型的神经网络以及深度学习中的正则化方法应用于无人驾驶

【连载】深度学习笔记4：深度神经网络的正则化

深度学习笔记5：正则化与dropout

详解机器学习和深度学习常见的正则化

基于AdaBoost框架的弹性正则化多核学习算法

基于耦合字典学习与图像正则化的跨模态检索

深度学习在语音识别中的应用及挑战

深度学习模型中的过拟合与正则化

NPU在深度学习中的应用