代码教程 - 如何估算深度神经网络的最优学习率（附代码教程）

Jeremy Howard 和他在 USF 数据研究所的团队开发了 fast.ai。这是一个基于 PyTorch 的高级抽象的深度学习库。fast.ai 是一个简单而强大的工具集，可以用于训练最先进的深度学习模型。Jeremy 在他最新的深度学习课程（）中使用了这个库。

fast.ai 提供了学习率搜索器的一个实现。你只需要写几行代码就能绘制模型的损失函数-学习率的图像（来自 GitHub：plot_loss.py）：

# learn is an instance of Learnerclass or one of derived classes like ConvLearner

learn.lr_find()

learn.sched.plot_lr()

库中并没有提供代码绘制损失函数变化率的图像，但计算起来非常简单（plot_change_loss.py）：

def plot_loss_change(sched, sma=1, n_skip=20, y_lim=(-0.01,0.01)):

"""

Plots rate of change of the loss function.

Parameters:

sched - learning rate scheduler, an instance of LR_Finder class.

sma - number of batches for simple moving average to smooth out the curve.

n_skip - number of batches to skip on the left.

y_lim - limits for the y axis.

"""

derivatives = [0] * (sma + 1)

for i in range(1 + sma, len(learn.sched.lrs)):

derivative = (learn.sched.losses[i] - learn.sched.losses[i - sma]) / sma

derivatives.append(derivative)

plt.ylabel("d/loss")

plt.xlabel("learning rate (log scale)")

plt.plot(learn.sched.lrs[n_skip:], derivatives[n_skip:])

plt.xscale('log')

plt.ylim(y_lim)

plot_loss_change(learn.sched, sma=20)

请注意：只在训练之前选择一次学习率是不够的。训练过程中，最优学习率会随着时间推移而下降。你可以定期重新运行相同的学习率搜索程序，以便在训练的稍后时间查找学习率。

使用其他库实现本方案

我还没有准备好将这种学习率搜索方法应用到诸如 Keras 等其他库中，但这应该不是什么难事。只需要做到：

多次运行训练，每次只训练一个小批量；

在每次分批训练之后通过乘以一个小的常数的方式增加学习率；

当损失函数值高于先前观察到的最佳值时，停止程序。（例如，可以将终止条件设置为「当前损失 > *4 最佳损失」）

学习计划

选择学习率的初始值只是问题的一部分。另一个需要优化的是学习计划（learning schedule）：如何在训练过程中改变学习率。传统的观点是，随着时间推移学习率要越来越低，而且有许多方法进行设置：例如损失函数停止改善时逐步进行学习率退火、指数学习率衰退、余弦退火等。

我上面引用的论文描述了一种循环改变学习率的新方法，它能提升卷积神经网络在各种图像分类任务上的性能表现。

阅读全文

上一页 12全文

本文导航

第 1 页：如何估算深度神经网络的最优学习率（附代码教程）
第 2 页：代码教程

深度学习(119547) 深度学习(119547)
卷积神经网络(11423) 卷积神经网络(11423)



请按住滑块，拖动到最右边



了解新功能

浅析深度神经网络压缩与加速技术

深度神经网络是深度学习的一种框架，它是一种具备至少一个隐层的神经网络。与浅层神经网络类似

2023-10-11 09:14:33

136

深度学习的神经网络架构解析

感知器是所有神经网络中最基本的，也是更复杂的神经网络的基本组成部分。它只连接一个输入神经元和一个输出神经元。

2023-08-31 16:55:50

293

人工神经网络和bp神经网络的区别

人工神经网络和bp神经网络的区别人工神经网络（Artificial Neural Network, ANN）是一种模仿人脑神经元网络结构和功能的计算模型，也被称为神经网络（Neural

2023-08-22 16:45:18

707

cnn卷积神经网络简介 cnn卷积神经网络代码

cnn卷积神经网络简介 cnn卷积神经网络代码卷积神经网络（Convolutional Neural Network，简称CNN）是目前深度学习领域中应用广泛的一种神经网络模型。CNN的出现

2023-08-21 17:16:13

291

cnn卷积神经网络matlab代码

cnn卷积神经网络matlab代码卷积神经网络（Convolutional Neural Network, CNN）是深度学习中一种常用的神经网络结构，它是通过卷积层、池化层和全连接层等组合而成

2023-08-21 17:15:59

290

卷积神经网络和深度神经网络的优缺点卷积神经网络和深度神经网络的区别

深度神经网络是一种基于神经网络的机器学习算法，其主要特点是由多层神经元构成，可以根据数据自动调整神经元之间的权重，从而实现对大规模数据进行预测和分类。卷积神经网络是深度神经网络的一种，主要应用于图像和视频处理领域。

2023-08-21 17:07:36

529

卷积神经网络是什么？卷积神经网络的工作原理和应用

　　卷积神经网络(Convolutional Neural Network，CNN)是一种深度学习神经网络，主要用于图像和视频的识别、分类和预测，是计算机视觉领域中应用最广泛的深度学习算法之一。该网络模型可以自动从原始数据中学习有用的特征，并将其映射到相应的类别。

2023-08-21 17:03:46

440

卷积神经网络算法代码matlab

卷积神经网络算法代码matlab 卷积神经网络（Convolutional Neural Network，CNN）是一种深度学习网络模型，其特点是具有卷积层（Convolutional Layer

2023-08-21 16:50:11

301

卷积神经网络算法比其他算法好吗

卷积神经网络算法比其他算法好吗卷积神经网络（Convolutional Neural Networks, CNN）是一种用于图像识别和处理等领域的深度学习算法。相对于传统的图像识别算法，如SIFT

2023-08-21 16:49:51

186

卷积神经网络的介绍什么是卷积神经网络算法

的深度学习算法。CNN模型最早被提出是为了处理图像，其模型结构中包含卷积层、池化层和全连接层等关键技术，经过多个卷积层和池化层的处理，CNN可以提取出图像中的特征信息，从而对图像进行分类。一、卷积神经网络算法卷积神经网络算法最早起源于图像处理领域。它是一种深

2023-08-21 16:49:46

276

卷积神经网络的基本原理卷积神经网络发展卷积神经网络三大特点

卷积神经网络的基本原理卷积神经网络发展历程卷积神经网络三大特点卷积神经网络的基本原理卷积神经网络（Convolutional Neural Networks，CNN）是深度学习领域

2023-08-21 16:49:39

262

卷积神经网络如何识别图像

卷积神经网络如何识别图像卷积神经网络（Convolutional Neural Network, CNN）由于其出色的图像识别能力而成为深度学习的重要组成部分。CNN是一种深度神经网络，其结构为

2023-08-21 16:49:27

484

正在加载...

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

代码教程 - 如何估算深度神经网络的最优学习率（附代码教程）

本文导航

评论