0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

迈向更高效的图像分类:解析DeiT模型的移植和适配

算能开发者社区 2023-11-23 08:33 次阅读

1. DeiT概述

1.1 项目简介

Deit(Data-efficient image Transformers)是由Facebook与索邦大学的Matthieu Cord教授合作开发的图像分类模型。作为一种基于Transformer架构的深度学习模型,DeiT在保持高性能的同时,能够大大提高数据效率,为图像识别领域带来了颠覆性的变化。

与传统的CNN不同,DeiT模型采用了Transformer的自注意力机制,将图像分割成若干个固定大小的块,并对每个块进行编码,捕捉图像中的长程依赖关系。

本文将为大家介绍如何将DeiT移植到算能BM1684X平台上。

1.2 模型介绍

DeiT目前有3个版本的模型(tiny, small, base),均由12个Attention结构组成,模型区别在于输入的header个数及embed_dim不同。

Attention结构如下图所示:

f5dd2bea-8997-11ee-9788-92fbcf53809c.pngattention

不同版本的模型具体参数区别如下表:

f5f01ad4-8997-11ee-9788-92fbcf53809c.pngversion

2. 模型移植

以下部分介绍如何将DeiT移植到算能BM1684X平台上。

2.1 模型trace

原始DeiT模型基于Pytorch框架训练及推理。算能TPU-MLIR工具链可以编译通过jit trace过的静态模型。

首先进行模型trace,命令如下,需要修改原推理代码。

f612c46c-8997-11ee-9788-92fbcf53809c.pngtrace

2.2 模型编译

以下介绍如何使用算能TPU-MLIR工具链将上一步trace过的模型编译成可以在算能BM1684X上推理的bmodel。在模型移植过程中遇到一些算子边界的处理问题,均已修复。

f6221b60-8997-11ee-9788-92fbcf53809c.pngtransformf634c6ac-8997-11ee-9788-92fbcf53809c.pngdeploy

2.3 精度测试

DeiT为分类模型,精度测试采用topk来进行。

精度测试及性能测试结果如下:

f649d45c-8997-11ee-9788-92fbcf53809c.pngprecision

3 小结

总体看移植过程相对顺利,在解决了部分算子边界问题之后可以成功编译出bmodel。F32精度基本可与原始框架对齐。由于第一个Conv stride > 15,在进行F16/BF16转换时遇到比对问题,这部分代码目前仍在重构,生成bmodel过程中这部分采用F32混精度处理。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 图像
    +关注

    关注

    2

    文章

    1087

    浏览量

    40499
  • 模型
    +关注

    关注

    1

    文章

    3261

    浏览量

    48914
  • 深度学习
    +关注

    关注

    73

    文章

    5507

    浏览量

    121272
收藏 人收藏

    评论

    相关推荐

    Mamba入局图像复原,达成新SOTA

    MambaIRv2,更高性能、更高效率!另外还有ACM MM 2024上的Freqmamba方法,在图像去雨任务中取得了SOTA性能! 显然,这种基于Mamba的方法在图像复原领域,比
    的头像 发表于 12-30 18:09 136次阅读
    Mamba入局<b class='flag-5'>图像</b>复原,达成新SOTA

    AI模型部署边缘设备的奇妙之旅:目标检测模型

    的规律,从而降低了模型在新数据上的泛化能力。 对抗攻击易感性:图像分类模型容易受到精心设计的对抗样本的影响,这些样本在人类看来几乎与原始图像
    发表于 12-19 14:33

    高通AI Hub:轻松实现Android图像分类

    高通AI Hub为开发者提供了一个强大的平台,以优化、验证和部署在Android设备上的机器学习模型。这篇文章将介绍如何使用高通AI Hub进行图像分类的程式码开发,并提供一个实际的例子来展示其在Android平台上的应用。
    的头像 发表于 11-26 01:03 265次阅读
    高通AI Hub:轻松实现Android<b class='flag-5'>图像</b><b class='flag-5'>分类</b>

    使用卷积神经网络进行图像分类的步骤

    使用卷积神经网络(CNN)进行图像分类是一个涉及多个步骤的过程。 1. 问题定义 确定目标 :明确你想要分类图像类型,例如猫和狗、不同的植物种类等。 数据需求 :确定需要多少数据以及
    的头像 发表于 11-15 15:01 321次阅读

    高效模型的推理综述

    模型由于其在各种任务中的出色表现而引起了广泛的关注。然而,大模型推理的大量计算和内存需求对其在资源受限场景的部署提出了挑战。业内一直在努力开发旨在提高大模型推理效率的技术。本文对现有的关于
    的头像 发表于 11-15 11:45 439次阅读
    <b class='flag-5'>高效</b>大<b class='flag-5'>模型</b>的推理综述

    主动学习在图像分类技术中的应用:当前状态与未来展望

    本文对近年来提出的主动学习图像分类算法进行了详细综述,并根据所用样本数据处理及模型优化方案,将现有算法分为三类:基于数据增强的算法,包括利用图像增广来扩充训练数据,或者根据
    的头像 发表于 11-14 10:12 341次阅读
    主动学习在<b class='flag-5'>图像</b><b class='flag-5'>分类</b>技术中的应用:当前状态与未来展望

    字节发布SeedEdit图像编辑模型

    近日,字节跳动公司在其豆包大模型团队的官方网站上,正式公布了其最新的通用图像编辑模型——SeedEdit。这款创新性的图像编辑模型,为用户提
    的头像 发表于 11-12 10:43 276次阅读

    AI大模型图像识别中的优势

    AI大模型图像识别中展现出了显著的优势,这些优势主要源于其强大的计算能力、深度学习算法以及大规模的数据处理能力。以下是对AI大模型图像识别中优势的介绍: 一、
    的头像 发表于 10-23 15:01 748次阅读

    浪潮信息源2.0大模型与百度PaddleNLP全面适配

    近日,浪潮信息宣布其开源大模型源2.0已全面适配百度PaddleNLP。这一举措标志着大模型开发生态正加速进化,为用户提供了更加便捷、高效的大模型
    的头像 发表于 10-17 18:15 536次阅读

    GaN如何实现更高效、更紧凑的电源

    电子发烧友网站提供《GaN如何实现更高效、更紧凑的电源.pdf》资料免费下载
    发表于 09-12 10:00 0次下载
    GaN如何实现<b class='flag-5'>更高效</b>、更紧凑的电源

    计算机视觉怎么给图像分类

    图像分类是计算机视觉领域中的一项核心任务,其目标是将输入的图像自动分配到预定义的类别集合中。这一过程涉及图像的特征提取、特征表示以及分类器的
    的头像 发表于 07-08 17:06 766次阅读

    如何使用PyTorch构建更高效的人工智能

    术界和工业界得到了广泛应用。本文将深入探讨如何使用PyTorch构建更高效的人工智能系统,从框架基础、模型训练、实战应用等多个方面进行详细解析
    的头像 发表于 07-02 13:12 396次阅读

    鸿蒙应用模型:【应用模型解析

    应用模型是系统为开发者提供的应用程序所需能力的抽象提炼,它提供了应用程序必备的组件和运行机制。有了应用模型,开发者可以基于一套统一的模型进行应用开发,使应用开发更简单、高效
    的头像 发表于 05-31 11:38 532次阅读
    鸿蒙应用<b class='flag-5'>模型</b>:【应用<b class='flag-5'>模型</b>】<b class='flag-5'>解析</b>

    一种利用光电容积描记(PPG)信号和深度学习模型对高血压分类的新方法

    ,因此在医疗信号方面它比其他模型产生了更高的准确度结果。从我们提出的模型 AvgPool_VGG-16 获得的结果表明,平均池化是比最大池化更适合信号图像
    发表于 05-11 20:01

    搭载星火认知大模型的AI鼠标:一键呼出AI助手,办公更高效

    搭载星火认知大模型的AI鼠标:一键呼出AI助手,办公更高效 在这个AI时代,如果你想在激烈竞争的职场中不被淘汰,讯飞AI鼠标AM30就是你的不二选择。 这款鼠标搭载了星火认知大模型AI,为你提供了
    的头像 发表于 03-25 11:52 514次阅读
    搭载星火认知大<b class='flag-5'>模型</b>的AI鼠标:一键呼出AI助手,办公<b class='flag-5'>更高效</b>