0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

迈向更高效的图像分类:解析DeiT模型的移植和适配

算能开发者社区 2023-11-23 08:33 次阅读

1. DeiT概述

1.1 项目简介

Deit(Data-efficient image Transformers)是由Facebook与索邦大学的Matthieu Cord教授合作开发的图像分类模型。作为一种基于Transformer架构的深度学习模型,DeiT在保持高性能的同时,能够大大提高数据效率,为图像识别领域带来了颠覆性的变化。

与传统的CNN不同,DeiT模型采用了Transformer的自注意力机制,将图像分割成若干个固定大小的块,并对每个块进行编码,捕捉图像中的长程依赖关系。

本文将为大家介绍如何将DeiT移植到算能BM1684X平台上。

1.2 模型介绍

DeiT目前有3个版本的模型(tiny, small, base),均由12个Attention结构组成,模型区别在于输入的header个数及embed_dim不同。

Attention结构如下图所示:

f5dd2bea-8997-11ee-9788-92fbcf53809c.pngattention

不同版本的模型具体参数区别如下表:

f5f01ad4-8997-11ee-9788-92fbcf53809c.pngversion

2. 模型移植

以下部分介绍如何将DeiT移植到算能BM1684X平台上。

2.1 模型trace

原始DeiT模型基于Pytorch框架训练及推理。算能TPU-MLIR工具链可以编译通过jit trace过的静态模型。

首先进行模型trace,命令如下,需要修改原推理代码。

f612c46c-8997-11ee-9788-92fbcf53809c.pngtrace

2.2 模型编译

以下介绍如何使用算能TPU-MLIR工具链将上一步trace过的模型编译成可以在算能BM1684X上推理的bmodel。在模型移植过程中遇到一些算子边界的处理问题,均已修复。

f6221b60-8997-11ee-9788-92fbcf53809c.pngtransformf634c6ac-8997-11ee-9788-92fbcf53809c.pngdeploy

2.3 精度测试

DeiT为分类模型,精度测试采用topk来进行。

精度测试及性能测试结果如下:

f649d45c-8997-11ee-9788-92fbcf53809c.pngprecision

3 小结

总体看移植过程相对顺利,在解决了部分算子边界问题之后可以成功编译出bmodel。F32精度基本可与原始框架对齐。由于第一个Conv stride > 15,在进行F16/BF16转换时遇到比对问题,这部分代码目前仍在重构,生成bmodel过程中这部分采用F32混精度处理。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 图像
    +关注

    关注

    2

    文章

    1091

    浏览量

    40669
  • 模型
    +关注

    关注

    1

    文章

    3406

    浏览量

    49457
  • 深度学习
    +关注

    关注

    73

    文章

    5527

    浏览量

    121833
收藏 人收藏

    评论

    相关推荐

    DMD能够显示更高位数的图像吗?

    我在使用DLP DIscovery 4100时发现上位机只能传输二进制图像到DMD中显示,我想问一下DMD能够显示更高位数的图像
    发表于 03-03 08:33

    天数智芯加速DeepSeek全系列模型适配

    天数智芯正携手合作伙伴,以惊人的速度推进DeepSeek全系列模型适配与上线工作。目前,多款DeepSeek模型服务已正式登陆各大平台,为用户带来多样化的选择。 其中,DeepSeek
    的头像 发表于 02-10 15:30 434次阅读

    龙芯中科与DeepSeek大模型协同适配成功

    龙芯中科近日宣布了一项重大进展,其自主研发的龙芯3号CPU已成功运行DeepSeek R17B模型,实现了本地化高效部署。这一成就标志着国产芯片与AI大模型的协同适配取得了关键性突破,
    的头像 发表于 02-10 09:14 381次阅读

    海光信息技术团队成功适配DeepSeek大模型

    方面取得了重要进展。 DeepSeek-Janus-Pro是海光团队近期完成适配优化的第三款DeepSeek大模型。此次适配工作的顺利完成,充分展示了海光DCU在生态构建和技术支持方面的强大优势。通过深度整合和优化,海光DCU为
    的头像 发表于 02-08 14:10 331次阅读

    xgboost在图像分类中的应用

    和易用性,在各种机器学习任务中得到了广泛应用,包括分类、回归和排序问题。在图像分类领域,尽管深度学习模型(如卷积神经网络CNN)占据主导地位,但XGBoost仍然有其独特的应用价值,特
    的头像 发表于 01-19 11:16 433次阅读

    Mamba入局图像复原,达成新SOTA

    MambaIRv2,更高性能、更高效率!另外还有ACM MM 2024上的Freqmamba方法,在图像去雨任务中取得了SOTA性能! 显然,这种基于Mamba的方法在图像复原领域,比
    的头像 发表于 12-30 18:09 351次阅读
    Mamba入局<b class='flag-5'>图像</b>复原,达成新SOTA

    AI模型部署边缘设备的奇妙之旅:目标检测模型

    的规律,从而降低了模型在新数据上的泛化能力。 对抗攻击易感性:图像分类模型容易受到精心设计的对抗样本的影响,这些样本在人类看来几乎与原始图像
    发表于 12-19 14:33

    使用卷积神经网络进行图像分类的步骤

    使用卷积神经网络(CNN)进行图像分类是一个涉及多个步骤的过程。 1. 问题定义 确定目标 :明确你想要分类图像类型,例如猫和狗、不同的植物种类等。 数据需求 :确定需要多少数据以及
    的头像 发表于 11-15 15:01 511次阅读

    高效模型的推理综述

    模型由于其在各种任务中的出色表现而引起了广泛的关注。然而,大模型推理的大量计算和内存需求对其在资源受限场景的部署提出了挑战。业内一直在努力开发旨在提高大模型推理效率的技术。本文对现有的关于
    的头像 发表于 11-15 11:45 835次阅读
    <b class='flag-5'>高效</b>大<b class='flag-5'>模型</b>的推理综述

    AI大模型图像识别中的优势

    AI大模型图像识别中展现出了显著的优势,这些优势主要源于其强大的计算能力、深度学习算法以及大规模的数据处理能力。以下是对AI大模型图像识别中优势的介绍: 一、
    的头像 发表于 10-23 15:01 1509次阅读

    浪潮信息源2.0大模型与百度PaddleNLP全面适配

    近日,浪潮信息宣布其开源大模型源2.0已全面适配百度PaddleNLP。这一举措标志着大模型开发生态正加速进化,为用户提供了更加便捷、高效的大模型
    的头像 发表于 10-17 18:15 622次阅读

    GaN如何实现更高效、更紧凑的电源

    电子发烧友网站提供《GaN如何实现更高效、更紧凑的电源.pdf》资料免费下载
    发表于 09-12 10:00 0次下载
    GaN如何实现<b class='flag-5'>更高效</b>、更紧凑的电源

    计算机视觉怎么给图像分类

    图像分类是计算机视觉领域中的一项核心任务,其目标是将输入的图像自动分配到预定义的类别集合中。这一过程涉及图像的特征提取、特征表示以及分类器的
    的头像 发表于 07-08 17:06 1040次阅读

    如何使用PyTorch构建更高效的人工智能

    术界和工业界得到了广泛应用。本文将深入探讨如何使用PyTorch构建更高效的人工智能系统,从框架基础、模型训练、实战应用等多个方面进行详细解析
    的头像 发表于 07-02 13:12 492次阅读

    搭载星火认知大模型的AI鼠标:一键呼出AI助手,办公更高效

    搭载星火认知大模型的AI鼠标:一键呼出AI助手,办公更高效 在这个AI时代,如果你想在激烈竞争的职场中不被淘汰,讯飞AI鼠标AM30就是你的不二选择。 这款鼠标搭载了星火认知大模型AI,为你提供了
    的头像 发表于 03-25 11:52 619次阅读
    搭载星火认知大<b class='flag-5'>模型</b>的AI鼠标:一键呼出AI助手,办公<b class='flag-5'>更高效</b>