0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

边缘AI的模型压缩技术

星星科技指导员 来源:嵌入式计算设计 作者:Rakesh R. Nakod 2022-10-19 14:22 次阅读

深度学习在模型及其数据集方面正在以惊人的速度增长。在应用方面,深度学习市场以图像识别为主,其次是光学字符识别,以及面部和物体识别。根据 Allied 的市场调查,2020 年全球深度学习市场规模为 68.5 亿美元,预计到 2030 年将达到 1799.6 亿美元,从 2021 年到 2030 年的复合年增长率为 39.2%。

在某个时间点,人们认为大型和复杂的模型表现更好,但现在它几乎是一个神话。随着边缘AI的发展,越来越多的技术将大型复杂模型转换为可以在边缘上运行的简单模型,所有这些技术结合在一起执行模型压缩。

什么是模型压缩?

模型压缩是在具有低计算能力和内存的边缘设备上部署SOTA(最先进的)深度学习模型的过程,而不会影响模型在准确性,精度,召回性等方面的性能。模型压缩广泛地减少了模型中的两件事,即大小和延迟。大小减小侧重于通过减少模型参数使模型更简单,从而减少执行中的 RAM 要求和内存中的存储要求。减少延迟是指减少模型进行预测或推断结果所花费的时间。模型大小和延迟通常是一起的,大多数技术都会减少两者。

流行的模型压缩技术

修剪:

修剪是模型压缩的最流行的技术,它通过删除冗余和无关紧要的参数来工作。神经网络中的这些参数可以是连接器、神经元、通道,甚至是层。它很受欢迎,因为它同时减小了模型的大小并改善了延迟。

pYYBAGNPl6-AZ2uZAAGw_oTIvEs500.png

修剪

修剪可以在训练模型时或在训练后完成。有不同类型的修剪技术,包括重量/连接修剪,神经元修剪,过滤器修剪和层修剪。

量化:

当我们在修剪中移除神经元,连接,过滤器,层等以减少加权参数的数量时,权重的大小在量化过程中减小。在此过程中,较大集中的值将映射到较小集中的值。与输入网络相比,输出网络的值范围较窄,但保留了大部分信息

知识提炼:

在知识提炼过程中,一个复杂而大型的模型在一个非常大的数据集上被训练。微调大型模型后,它可以很好地处理看不见的数据。一旦实现,这些知识就会转移到较小的神经网络或模型中。同时使用教师网络(较大模型)和学生网络(较小模型)。这里存在两个方面,知识提炼,其中我们不调整教师模型,而在迁移学习中,我们使用确切的模型和权重,在一定程度上改变模型,并针对相关任务进行调整。

poYBAGNPl7aAcED2AAB8DjxHRCw852.png

知识蒸馏系统

知识、蒸馏算法和师生架构模型是典型知识蒸馏系统的三个主要部分,如上图所示。

低矩阵分解:

矩阵构成了大多数深度神经架构的大部分。该技术旨在通过应用矩阵或张量分解并将它们变成更小的矩阵来识别冗余参数。当应用于密集 DNN(深度神经网络)时,此技术可降低 CNN(卷积神经网络)层的存储要求和因式分解,并缩短推理时间。具有二维且具有秩 r 的权重矩阵 A 可以分解为更小的矩阵,如下所示。

poYBAGNPl72AUTPYAABK48-5WA8433.png

低矩阵因式分解

模型准确性和性能在很大程度上取决于正确的因式分解和秩选择。低秩因式分解过程中的主要挑战是更难实现,并且计算密集型。总体而言,与全秩矩阵表示相比,密集层矩阵的因式分解可导致更小的模型和更快的性能。

由于边缘AI,模型压缩策略变得非常重要。这些方法相互补充,可以在整个AI管道的各个阶段使用。像张量流和Pytorch这样的流行框架现在包括修剪和量化等技术。最终,该领域使用的技术数量将会增加。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 连接器
    +关注

    关注

    98

    文章

    14318

    浏览量

    136167
  • RAM
    RAM
    +关注

    关注

    8

    文章

    1367

    浏览量

    114533
  • 深度学习
    +关注

    关注

    73

    文章

    5493

    浏览量

    120979
收藏 人收藏

    评论

    相关推荐

    AI模型托管原理分析

    AI模型托管是指将训练好的AI模型部署在云端或边缘服务器上,由第三方平台提供模型运行、管理和优化
    的头像 发表于 11-07 09:33 112次阅读

    云天励飞边缘AI推动大模型规模化应用落地

    2024年毫无疑问是大模型应用落地元年,面对灵活多变的任务和复杂的场景环境,用边缘AI打造低成本、高效能、强落地的大模型应用是关键。
    的头像 发表于 09-18 14:59 367次阅读

    云知声在边缘侧大模型技术探索和应用

      随着人工智能技术的飞速发展,汽车行业正从“软件定义汽车”向“AI定义汽车”的新时代迈进。如何将大模型技术更深入地整合到车载系统中,以实现更高效、更低成本的智能化解决方案,正成为众多
    的头像 发表于 06-29 15:30 786次阅读

    ai边缘盒子有哪些用途?ai视频分析边缘计算盒子详解

    的解决方案。AI边缘盒子的主要用途在于利用边缘计算和人工智能技术,在数据产生源头附近即时处理数据,提供低延迟和高响应性能。例如,在智慧工地上,AI
    的头像 发表于 05-29 14:24 891次阅读
    <b class='flag-5'>ai</b><b class='flag-5'>边缘</b>盒子有哪些用途?<b class='flag-5'>ai</b>视频分析<b class='flag-5'>边缘</b>计算盒子详解

    部署在边缘设备上的轻量级模型

    的地方进行智能决策和数据处理。   边缘AI 算法通常是经过优化和压缩的轻量级模型   边缘AI
    的头像 发表于 05-11 00:17 2543次阅读

    NVIDIA与恩智浦联手,在边缘设备上部署AI模型

    恩智浦工业及IoT边缘高级副总裁Charles Dachs表示,人工智能的创新将塑造智能互联世界的未来,融入Nvidia先进的AI培训技术以及恩智浦在工业及物联网边缘科研实力,将产生协
    的头像 发表于 03-25 16:05 832次阅读

    cubemx ai导入onnx模型压缩失败了怎么解决?

    cubemx ai导入onnx模型压缩失败。请问我怎么解决
    发表于 03-19 07:58

    NanoEdge AI技术原理、应用场景及优势

    能耗并提高数据安全性。本文将对 NanoEdge AI技术原理、应用场景以及优势进行综述。 1、技术原理 NanoEdge AI 的核心技术
    发表于 03-12 08:09

    什么是AI边缘计算,AI边缘计算的特点和优势介绍

    随着人工智能的迅猛发展,AI边缘计算成为了热门话题。那么什么是AI边缘计算呢?简单来说,它是将人工智能技术引入
    的头像 发表于 02-01 11:42 822次阅读

    AI边缘计算机应用场景广泛!大语言模型与数字人结合方案在边缘侧落地

    电子发烧友网报道(文/李弯弯)AI边缘计算机是一种人工智能和边缘计算技术相结合的计算机设备。它可以在本地设备上运行AI
    的头像 发表于 01-16 01:11 4385次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>边缘</b>计算机应用场景广泛!大语言<b class='flag-5'>模型</b>与数字人结合方案在<b class='flag-5'>边缘</b>侧落地

    边缘AI它到底是什么?能做什么?

    边缘AI它到底是什么?能做什么? 边缘人工智能是一种新兴的人工智能技术,它将人工智能的计算和决策能力移动到离数据生成源和终端设备更近的边缘
    的头像 发表于 01-11 14:44 1245次阅读

    边缘AI核心技术和产业链!技术持续进步,应用不断拓展!

    ,并保护用户的隐私。此外,边缘AI还可以在没有互联网连接的情况下独立运行,这对于一些实时性要求较高的应用非常重要。   边缘AI 产业链及核心技术
    的头像 发表于 01-11 01:20 4688次阅读
    <b class='flag-5'>边缘</b><b class='flag-5'>AI</b>核心<b class='flag-5'>技术</b>和产业链!<b class='flag-5'>技术</b>持续进步,应用不断拓展!

    边缘侧部署大模型优势多!模型量化解决边缘设备资源限制问题

    电子发烧友网报道(文/李弯弯)大模型边缘部署是将大模型部署在边缘设备上,以实现更快速、更低延迟的计算和推理。边缘设备可以是各种终端设备,如
    的头像 发表于 01-05 00:06 3367次阅读

    AI模型怎么解决芯片过剩?

    AI模型
    电子发烧友网官方
    发布于 :2024年01月02日 15:42:05

    AI模型可以设计电路吗?

    AI模型
    电子发烧友网官方
    发布于 :2024年01月02日 15:09:29