0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

边缘AI的模型压缩技术

星星科技指导员 来源:嵌入式计算设计 作者:Rakesh R. Nakod 2022-10-19 14:22 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

深度学习在模型及其数据集方面正在以惊人的速度增长。在应用方面,深度学习市场以图像识别为主,其次是光学字符识别,以及面部和物体识别。根据 Allied 的市场调查,2020 年全球深度学习市场规模为 68.5 亿美元,预计到 2030 年将达到 1799.6 亿美元,从 2021 年到 2030 年的复合年增长率为 39.2%。

在某个时间点,人们认为大型和复杂的模型表现更好,但现在它几乎是一个神话。随着边缘AI的发展,越来越多的技术将大型复杂模型转换为可以在边缘上运行的简单模型,所有这些技术结合在一起执行模型压缩。

什么是模型压缩?

模型压缩是在具有低计算能力和内存的边缘设备上部署SOTA(最先进的)深度学习模型的过程,而不会影响模型在准确性,精度,召回性等方面的性能。模型压缩广泛地减少了模型中的两件事,即大小和延迟。大小减小侧重于通过减少模型参数使模型更简单,从而减少执行中的 RAM 要求和内存中的存储要求。减少延迟是指减少模型进行预测或推断结果所花费的时间。模型大小和延迟通常是一起的,大多数技术都会减少两者。

流行的模型压缩技术

修剪:

修剪是模型压缩的最流行的技术,它通过删除冗余和无关紧要的参数来工作。神经网络中的这些参数可以是连接器、神经元、通道,甚至是层。它很受欢迎,因为它同时减小了模型的大小并改善了延迟。

pYYBAGNPl6-AZ2uZAAGw_oTIvEs500.png

修剪

修剪可以在训练模型时或在训练后完成。有不同类型的修剪技术,包括重量/连接修剪,神经元修剪,过滤器修剪和层修剪。

量化:

当我们在修剪中移除神经元,连接,过滤器,层等以减少加权参数的数量时,权重的大小在量化过程中减小。在此过程中,较大集中的值将映射到较小集中的值。与输入网络相比,输出网络的值范围较窄,但保留了大部分信息。

知识提炼:

在知识提炼过程中,一个复杂而大型的模型在一个非常大的数据集上被训练。微调大型模型后,它可以很好地处理看不见的数据。一旦实现,这些知识就会转移到较小的神经网络或模型中。同时使用教师网络(较大模型)和学生网络(较小模型)。这里存在两个方面,知识提炼,其中我们不调整教师模型,而在迁移学习中,我们使用确切的模型和权重,在一定程度上改变模型,并针对相关任务进行调整。

poYBAGNPl7aAcED2AAB8DjxHRCw852.png

知识蒸馏系统

知识、蒸馏算法和师生架构模型是典型知识蒸馏系统的三个主要部分,如上图所示。

低矩阵分解:

矩阵构成了大多数深度神经架构的大部分。该技术旨在通过应用矩阵或张量分解并将它们变成更小的矩阵来识别冗余参数。当应用于密集 DNN(深度神经网络)时,此技术可降低 CNN(卷积神经网络)层的存储要求和因式分解,并缩短推理时间。具有二维且具有秩 r 的权重矩阵 A 可以分解为更小的矩阵,如下所示。

poYBAGNPl72AUTPYAABK48-5WA8433.png

低矩阵因式分解

模型准确性和性能在很大程度上取决于正确的因式分解和秩选择。低秩因式分解过程中的主要挑战是更难实现,并且计算密集型。总体而言,与全秩矩阵表示相比,密集层矩阵的因式分解可导致更小的模型和更快的性能。

由于边缘AI,模型压缩策略变得非常重要。这些方法相互补充,可以在整个AI管道的各个阶段使用。像张量流和Pytorch这样的流行框架现在包括修剪和量化等技术。最终,该领域使用的技术数量将会增加。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 连接器
    +关注

    关注

    105

    文章

    16347

    浏览量

    147841
  • RAM
    RAM
    +关注

    关注

    8

    文章

    1400

    浏览量

    120975
  • 深度学习
    +关注

    关注

    73

    文章

    5604

    浏览量

    124609
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI模型微调企业项目实战课

    决胜未来 未来十年,AI 的竞争将不再是“谁家模型参数大”的军备竞赛,而是“谁家模型更懂行业、更安全”的落地较量。 参与企业微调实战课,其意义远超掌握一门技术工具。它本质上是帮助企业培
    发表于 04-16 18:48

    论马斯克的预言:AI使人类边缘

    依据 马斯克认为AI已进入“递归式自我改进”阶段,新一代的AI模型由上一代模型参与训练,人类监督的角色正在被边缘化。他预计完全自动化的
    发表于 03-14 05:27

    边缘AI算力临界点:深度解析176TOPS香橙派AI Station的产业价值

    310P芯片的底层架构,深度剖析这款产品的技术细节、算力门槛及其在实际产业落地中的真实价值。 一、176TOPS的产业门槛:为何这是边缘算力的新起点? AI硬件的核心指标始终是算力,但不同层级的算力决定
    发表于 03-10 14:19

    意法半导体STM32 AI模型库助力边缘AI落地应用

    在开发边缘AI(Edge AI)时,可以说“理解问题本身”就已成功了一半。然而,随着AI模型持续演进,即便是经验丰富的工程师,也会发现优化变
    的头像 发表于 01-14 11:07 840次阅读

    直播有礼 | 瑞萨边缘AI线上技术月——AI MCU/MPU产品及边缘AI案例集

    RA生态工作室关注我们随着人工智能技术不断迭代,使用远端算力平台进行模型部署和AI计算并在端侧决策成为可能,边缘AI
    的头像 发表于 01-13 18:05 700次阅读
    直播有礼 | 瑞萨<b class='flag-5'>边缘</b><b class='flag-5'>AI</b>线上<b class='flag-5'>技术</b>月——<b class='flag-5'>AI</b> MCU/MPU产品及<b class='flag-5'>边缘</b><b class='flag-5'>AI</b>案例集

    影像仪AI自动寻边技术精准捕捉边界测量,检测效率翻倍!

    【智能制造测量】影像测量仪的AI自动寻边技术是通过深度学习模型,实现对工件特征的自主识别与边缘精准提取。能解决质检环节中多重边界提偏、刀纹干扰、对比度低等测量痛点。
    发表于 11-18 10:16

    如何利用NPU与模型压缩技术优化边缘AI

    AI 模型体积庞大,部署在 NPU上常常面临困难,这凸显了模型压缩技术的重要性。要实现高效的实时边缘
    的头像 发表于 11-07 15:26 1403次阅读
    如何利用NPU与<b class='flag-5'>模型</b><b class='flag-5'>压缩</b><b class='flag-5'>技术</b>优化<b class='flag-5'>边缘</b><b class='flag-5'>AI</b>

    AI模型的配置AI模型该怎么做?

    STM32可以跑AI,这个AI模型怎么搞,知识盲区
    发表于 10-14 07:14

    AI 边缘计算网关:开启智能新时代的钥匙​—龙兴物联

    顺畅地通向云端,实现设备与云端之间高效的数据传输与交互。通过融合先进的边缘计算和人工智能技术AI 边缘计算网关能够在靠近数据源的网络边缘
    发表于 08-09 16:40

    Nordic收购 Neuton.AI 关于产品技术的分析

    与 Nordic 的 nRF54 系列超低功耗无线 SoC 结合,使得即使是资源极为有限的设备也能高效运行边缘 AI。Nordic 目前正在将 Neuton 深度集成到自身开发生态中,未来会提供更多工具、固件
    发表于 06-28 14:18

    边缘AI实现的核心环节:硬件选择和模型部署

    边缘AI的实现原理是将人工智能算法和模型部署到靠近数据源的边缘设备上,使这些设备能够在本地进行数据处理、分析和决策,而无需将数据传输到远程的云端服务器。
    的头像 发表于 06-19 12:19 1658次阅读
    <b class='flag-5'>边缘</b><b class='flag-5'>AI</b>实现的核心环节:硬件选择和<b class='flag-5'>模型</b>部署

    边缘AI的优势和技术基石

    在万物皆可AI(人工智能)的今天,市场上几乎每家企业都在宣称自己的业务中有了AI成分。因此,将AI接入极靠近终端客户的网络边缘也就没什么悬念了。这里的
    的头像 发表于 06-12 10:14 1658次阅读
    <b class='flag-5'>边缘</b><b class='flag-5'>AI</b>的优势和<b class='flag-5'>技术</b>基石

    边缘AI实现的核心环节:硬件选择和模型部署

    电子发烧友网综合报道 边缘AI的实现原理是将人工智能算法和模型部署到靠近数据源的边缘设备上,使这些设备能够在本地进行数据处理、分析和决策,而无需将数据传输到远程的云端服务器。
    发表于 05-26 07:09 1574次阅读

    Deepseek海思SD3403边缘计算AI产品系统

    海思SD3403边缘计算AI框架,提供了一套开放式AI训练产品工具包,解决客户低成本AI系统,针对差异化AI 应用场景,自己采集样本数据,进
    发表于 04-28 11:05

    意法半导体边缘AI套件中提供的全部工具

    意法半导体边缘AI套件(ST Edge AI Suite)是一套专为边缘AI开发设计的集成化工具集合,覆盖从数据采集、
    的头像 发表于 04-21 17:46 1773次阅读