边缘计算中深度神经网络剪枝压缩的研究-电子发烧友网

边缘计算将计算、网络、存储等能力扩展到物联网设备附近的网络边缘侧，而以深度学习为代表的人工智能技术让每个边缘计算的节点都具有计算和决策的能力，这使得某些复杂的智能应用可以在本地边缘端进行处理，满足了敏捷连接、实时业务、数据优化、应用智能、安全与隐私保护等方面的需求。智能边缘计算利用物联网的边缘设备进行数据采集和智能分析计算，实现智能在云和边缘之间流动，对人工智能算法、终端、芯片都提出了新的需求，正成为越来越多人工智能企业关注的重点方向。然而，由于深度学习模型推理需要消耗大量的计算资源，当前的大多数边缘设备由于资源受限无法以低延迟、低功耗、高精确率的方式支持深度学习应用。

深度神经网络与其他很多机器学习模型一样，可分为训练和推理两个阶段。训练阶段根据数据学习模型中的参数（对神经网络来说主要是网络中的权重）；推理阶段将新数据输入模型，经过计算得出结果。过参数化是指在训练阶段，网络需要大量的参数来捕捉数据中的微小信息，而一旦训练完成到了推理阶段，就不需要这么多的参数。基于这样的假设，就可以在部署前对模型进行简化。模型压缩中的剪枝（pruning）和量化两类方法正是基于这样的前提。模型简化的优点包括但不限于：（1）计算量的减小，从而使计算时间更少，功耗更小；（2）存储和读写访问量变小，可以放到更边缘的设备上运行，本来需要既慢又耗能的DRAM参与，现在有可能放在SRAM就可以。其核心问题是如何有效地裁剪模型并使得精度的损失最小化。

对于神经网络修剪的研究始于20世纪80年代末、90年代初。汉森（Hanson）在1988年提出基于幅度的修剪方法，即对网络中每个隐含单元施加与其绝对值相关的权重衰减来使隐含单元数量最小化。乐昆（LeCun）和哈斯比（Hassibi）分别在1990年和1993年提出最优脑损伤（Optimal Brain Damage，OBD）和最优脑手术（Optimal Brain Surgeon，OBS）方法，它们基于损失函数相对于权重的二阶导数（对权重向量来说即Hessian矩阵）来衡量网络中权重的重要程度，然后对其进行裁剪。由于受到当时计算资源的限制，研究仅限于浅层神经网络，但其对问题的定义和解决问题的思路对之后的工作产生了深远的影响。从2012年起，神经网络的变化趋势是不断加深网络以提高精度。在2015-2016年期间，Han等人发表了一系列对深度神经网络进行模型压缩的工作，其中Deep Compression对当时经典网络AlexNet和VGG进行了压缩。结合修剪、量化和哈夫曼编码等多种方法，将网络尺寸压缩至几十分之一，性能获得成倍的提升。其中对于修剪带来的精度损失，使用了迭代修剪方法进行补偿，使精度几乎没有损失。之后这几年，模型压缩领域变得越来越丰富，越来越多的相关工作衍生而出。

从网络修剪的粒度来说，可以分为结构化剪枝（structured pruning）和非结构化剪枝（unstructured pruning）两类。早期的一些方法是基于非结构化的，它修剪的粒度为单个神经元。如果对卷积核进行非结构化剪枝，则得到的卷积核是稀疏的，即中间有很多元素为0的矩阵。除非下层的硬件和计算库对其有比较好的支持，否则修剪后的网络很难获得实质的性能提升。稀疏矩阵无法利用现有成熟的基础线性代数子程序（Basic Linear Algebra Subprograms，BLAS）库来获得额外性能收益。因此，很多研究是集中在结构化剪枝上，通常细分为通道剪枝、卷积核剪枝和网络结构修剪。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

神经网络

神经网络

+关注

关注
42

文章
4779

浏览量
101153
深度学习

深度学习

+关注

关注
73

文章
5512

浏览量
121519
边缘计算

边缘计算

+关注

关注
22

文章
3121

浏览量
49490

神经网络在FPGA上的应用：深度压缩方法

对AlexNet和VGG-16进行了实验，获得了35倍和49倍的压缩量，而且精度几乎没有损失。 1. 原理深度压缩之所以获得成功主要是结合了三种压缩方法：

发表于 11-21 11:00 •3262次阅读

<b class='flag-5'>神经网络</b>在FPGA上的应用：<b class='flag-5'>深度</b><b class='flag-5'>压缩</b>方法

从AlexNet到MobileNet，带你入门深度神经网络

思维导图如下：发展历程DNN-定义和概念在卷积神经网络中，卷积操作和池化操作有机的堆叠在一起，一起组成了CNN的主干。同样是受到猕猴视网膜与视觉皮层之间多层网络的启发，深度

发表于 05-08 15:57

如何设计BP神经网络图像压缩算法？

，并能在脑海中重现这些图像信息，这不仅与人脑的海量信息存储能力有关，还与人脑的信息处理能力，包括数据压缩能力有关。在各种神经网络中，多层前馈神经网络具有很强的信息处理能力，由于其采用B

发表于 08-08 06:11

深度神经网络是什么

多层感知机深度神经网络in collaboration with Hsu Chung Chuan, Lin Min Htoo, and Quah Jia Yong. 与许忠传，林敏涛和华佳勇合作

发表于 07-12 06:35

基于深度神经网络的激光雷达物体识别系统

的激光雷达物体识别技术一直难以在嵌入式平台上实时运行。经纬恒润经过潜心研发，攻克了深度神经网络在嵌入式平台部署所面临的算子定制与加速、量化策略、模型压缩等难题，率先实现了高性能激光检测神经网络

发表于 12-21 07:59

卷积神经网络模型发展及应用

network，DBN）[24]，从此拉开了深度学习大幕。随着深度学习理论的研究和发展，研究人员提出了一系列卷积神经网络模型。为了比较

发表于 08-02 10:39

深度神经网络的压缩和正则化剖析

利用深度压缩和DSD训练来提高预测精度。深度神经网络已经成为解决计算机视觉、语音识别和自然语言处理等机器学习任务的最先进的技术。尽管如此，

发表于 11-16 13:11 •1845次阅读

面向“边缘”应用的卷积神经网络如何进行量化与压缩详细方法

针对卷积神经网络（ CNN）推理计算所需内存空间和资源过大，限制了其在嵌入式等“边缘”设备上部署的问题，提出结合网络权重裁剪及面向嵌入式硬件平台数据类型的数据量化的

发表于 12-26 17:01 •4次下载

基于深度神经网络的结构化剪枝算法

　　现有结构化剪枝算法通常运用深度神经网络（DNN）的一阶或者零阶信息对通道进行剪枝，为利用二阶信息加快DNN网络模型收敛速度，借鉴HAWQ

发表于 03-10 16:41 •2次下载

神经网络图像压缩算法的FPGA实现技术研究论文免费下载

神经网络图像压缩是图像压缩和神经网络领域的主要研究方向之一，基于多层前馈神经网络的

发表于 03-22 16:06 •11次下载

深度神经网络模型的压缩和优化综述

近年来，随着深度学习的飞速发展，深度神经网络受到了越来越多的关注，在许多应用领域取得了显著效果。通常，在较高的计算量下，深度

发表于 04-12 10:26 •20次下载

基于剪枝与量化的卷积神经网络压缩算法

随着深度学习的发展，卷积神经网络作为其重要算法被广泛应用到计算机视觉、自然语言处理及语音处理等各个领域，并取得了比传统算法更为优秀的成绩。但是，卷积神经网络结构复杂，参数量和

发表于 05-17 15:44 •6次下载

卷积神经网络和深度神经网络的优缺点卷积神经网络和深度神经网络的区别

深度神经网络是一种基于神经网络的机器学习算法，其主要特点是由多层神经元构成，可以根据数据自动调整神经元之间的权重，从而实现对大规模数据进行预

发表于 08-21 17:07 •4241次阅读

卷积神经网络的压缩方法

，CNN模型的参数量和计算量也随之剧增，这对硬件资源提出了严峻挑战。因此，卷积神经网络的压缩方法成为了研究热点。本文将从多个角度详细介绍卷积神经网络

发表于 07-11 11:46 •424次阅读

FPGA在深度神经网络中的应用

、低功耗等特点，逐渐成为深度神经网络在边缘计算和设备端推理的重要硬件平台。本文将详细探讨FPGA在深度神

发表于 07-24 10:42 •793次阅读