0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

爱芯元智AX650N成端侧、边缘侧Transformer最佳落地平台

爱芯元智AXERA 来源:爱芯元智AXERA 2023-05-30 11:04 次阅读

近来,ChatGPT成为社会各界关注的焦点。从技术领域看,ChatGPT的爆发是深度学习领域演进、发展和突破的结果,其背后代表着Transformer结构下的大模型技术的飞速进展。因此,如何在端侧、边缘侧高效部署Transformer也成为用户选择平台的核心考量。

2023年3月,爱芯元智推出了第三代高算力、高能效比的SoC芯片——AX650N,依托其在高性能、高精度、易部署、低功耗等方面的优异表现,AX650N受到越来越多有大模型部署需求用户的青睐,并且先人一步成为Transformer端侧、边缘侧落地平台。

2ace5026-fe8e-11ed-90ce-dac502259ad0.png

Transformer是当前各种大模型所采用的主要结构,而ChatGPT的火爆让人们逐渐意识到人工智能有着更高的上限,并可以在计算机视觉领域发挥出巨大潜能。相比于在云端用GPU部署Transformer大模型,在边缘侧、端侧部署Transformer最大的挑战则来自功耗,这也使得爱芯元智兼具高性能和低功耗特质的混合精度NPU,成为端侧和边缘侧部署Transformer的首选平台,而其优越性能则决定了Transformer的运行效果。

作为人工智能视觉感知芯片研发及基础算力平台公司,爱芯元智始终致力于让更多的实际应用落地。目前大众普遍采用的Transformer网络SwinT,在爱芯元智AX650N平台表现出色:361 FPS的高性能、80.45%的高精度、199 FPS/W的低功耗以及原版模型且PTQ量化的极易部署能力,都让AX650N在Transformer的落地中有着领先的优势地位。

2af13dca-fe8e-11ed-90ce-dac502259ad0.png

具体来看,361帧的高性能,可媲美汽车自动驾驶领域基于GPU的高端域控SoC;而80.45%的高精度成绩同样高于市面平均水平;199 FPS/W的速度则充分体现出低功耗的特点,对比于目前基于GPU的高端域控SoC,有着数倍的优势;更为重要的,AX650N部署方便,GitHub上的原版模型可以在爱芯元智的平台上高效运行,不需要对模型做修改,亦无需QAT重新训练。与此同时,AX650N支持低比特混合精度,用户如果采用INT4,可以极大地减少内存和带宽占用率,达到有效控制端侧、边缘侧部署成本的目的。这些特性都保证了AX650N作为人工智能算力平台,最终落地效果更好用、更易用,且大幅提升了用户效率。

目前,AX650N已适配包括ViT/DeiT、Swin/SwinV2、DETR在内的Transformer模型,在DINOv2也已达到30帧以上的运行结果,这也更便于用户在下游进行检测、分类、分割等操作。基于AX650N的产品目前已在智慧城市、智慧教育、智能制造等计算机视觉核心领域发挥出重要作用。

2b2847ca-fe8e-11ed-90ce-dac502259ad0.png

接下来,爱芯元智AX650N将会针对Transformer结构进行持续优化,并且探索更多的Transformer大模型,例如多模态大模型,不断让Transformer在爱芯元智平台上得到更好的落地效果。值得一提的是,爱芯元智还将推出相应开发板,满足开发者对Transformer深度研究的需求,探寻更丰富的产品应用。

“爱芯元智将继续努力打造基于芯片+软件的端侧、边缘侧人工智能算力平台,让智能落实到生活的真实场景,最终实现普惠AI造就美好生活的企业愿景”,爱芯元智创始人、CEO仇肖莘女士表示。未来,爱芯元智将在成为人工智能算力平台型公司的道路上继续探索,加速基于Transformer的大模型在端侧、边缘侧落地的节奏,让普惠智能真正落地生根,开花结果。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    455

    文章

    50791

    浏览量

    423466
  • 人工智能
    +关注

    关注

    1791

    文章

    47258

    浏览量

    238410
  • ChatGPT
    +关注

    关注

    29

    文章

    1560

    浏览量

    7631

原文标题:高能低耗易部署,爱芯元智AX650N成端侧、边缘侧Transformer最佳落地平台

文章出处:【微信号:爱芯元智AXERA,微信公众号:爱芯元智AXERA】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    基于AX650N的M.2智能推理卡解决方案

    2024年是大模型在边缘&落地的第一年。从这一年开始,头部手机厂商在自己的旗舰机型中内置了3B以下的本地大模型,证明了3B以下大模型的
    的头像 发表于 12-23 16:39 216次阅读

    科技发布ATS323X系列AI音频芯片

    刚过去不久,炬科技宣布全新一代基于模数混合SRAM存内计算(Mixed-mode SRAM based CIM,简称“MMSCIM”)技术的AI音频芯片正式发布,紧接着,炬科技
    的头像 发表于 12-12 14:58 192次阅读

    广和通开启AI新时代

    AI发展正酣,随着终端芯片算力越来越高、模型能力越来越强、实时响应及隐私保护的应用需求增加,
    的头像 发表于 12-12 10:35 192次阅读

    把握关键节点,美格智能持续推动AI规模化拓展

    将成为和系统同样重要的存在,如果说电路是连接身体的“血管”,那么AI就将成为终端的智慧“大脑”。 ▶加速演进,大模型加速走向 从手机移动开始,
    的头像 发表于 11-25 16:45 248次阅读
    把握关键节点,美格智能持续推动<b class='flag-5'>端</b><b class='flag-5'>侧</b>AI规模化拓展

    AI浪潮已来!炬科技发布新一代AI音频芯片,能效比和AI算力大幅度提升

    电子发烧友原创 章鹰   11月5日,在深圳会展中心7号馆内,炬科技董事长兼CEO周正宇博士带来了《AI芯片的未来》演讲,他对AI
    的头像 发表于 11-06 09:11 2535次阅读
    <b class='flag-5'>端</b><b class='flag-5'>侧</b>AI浪潮已来!炬<b class='flag-5'>芯</b>科技发布新一代<b class='flag-5'>端</b><b class='flag-5'>侧</b>AI音频芯片,能效比和AI算力大幅度提升

    速荣膺最佳技术实践应用奖

    智车载事业部(品牌“速”)凭借在车载芯片领域的创新技术研发实力以及在推动量产上车方面
    的头像 发表于 10-25 11:39 336次阅读

    广和通AI解决方案驱动性能密集型场景商用型场景商用

    2024世界机器人大会期间,广和通宣布:基于高通QCS8550平台的广和通AI解决方案高效使能性能密集型场景。该AI解决方案整合强大
    的头像 发表于 08-23 16:06 309次阅读

    广和通AI解决方案驱动性能密集型场景商用型场景商用

    2024世界机器人大会期间,广和通宣布:基于高通QCS8550平台的广和通AI解决方案高效使能性能密集型场景。该AI解决方案整合强大
    的头像 发表于 08-23 16:05 667次阅读
    广和通<b class='flag-5'>端</b><b class='flag-5'>侧</b>AI解决方案驱动性能密集型场景商用型场景商用

    基于AX650N芯片部署MiniCPM-V 2.0高效多模态大模型

    2.8B参数。MiniCPM-V 2.0具有领先的光学字符识别(OCR)和多模态理解能力。该模型在综合性OCR能力评测基准OCRBench上达到开源社区的最佳水平,甚至在场景文字理解方面实现接近Gemini Pro的性能。简单来说,就是能够实现更好地理解图片中内容,实现精准的“以图生文”的能力,所见即所得。
    的头像 发表于 07-15 09:34 891次阅读
    基于<b class='flag-5'>AX650N</b>芯片部署MiniCPM-V 2.0高效<b class='flag-5'>端</b><b class='flag-5'>侧</b>多模态大模型

    基于AX650N/AX630C部署大语言模型Qwen2

    本文将分享如何将最新的大语言模型部署到超高性价比SoC上,向业界对大模型部署的开发者提供一种新的思路。
    的头像 发表于 07-06 17:43 3539次阅读
    基于<b class='flag-5'>AX650N</b>/<b class='flag-5'>AX</b>630C部署<b class='flag-5'>端</b><b class='flag-5'>侧</b>大语言模型Qwen2

    广和通AI解决方案荣膺MWCS 2024边缘AI计算最佳创新奖

    在近日举行的2024世界移动通信大会·上海(MWCS 2024)上,广和通凭借其卓越的AI解决方案荣获2024信息通信业“新质推荐”——边缘AI计算最佳创新方案奖。这一荣誉不仅彰显
    的头像 发表于 06-28 15:44 755次阅读

    AX620E和AX650芯片获PSA一级安全认证

    据认证资料显示,AX620E系列是专为IPC及其他智能视觉应用而生的高性能AI视觉处理器,在高画质、智能处理和分析等方面均处于业界领先地位。该系列芯片采用Arm® Cortex
    的头像 发表于 04-23 17:04 844次阅读

    AX620E和AX650系列芯片正式通过PSA Certified安全认证

    万物互联的时代,安全性已成为物联网产品设计及部署的基本要求。近日,AX620E和AX650系列芯片(包含
    的头像 发表于 04-23 15:45 813次阅读
    <b class='flag-5'>爱</b><b class='flag-5'>芯</b><b class='flag-5'>元</b>智<b class='flag-5'>AX</b>620E和<b class='flag-5'>AX650</b>系列芯片正式通过PSA Certified安全认证

    嘉楠基于RISC-V的AIoT SoC采用了原的ISP IP和GPU IP

    原股份(原,股票代码:688521.SH)今日宣布嘉楠科技(嘉楠,纳斯达克股票代码:CAN)全球首款支持RISC-V Vector 1.0标准的商用量产AIoT芯片K230集成
    的头像 发表于 03-14 10:20 635次阅读

    嘉楠AIoT芯片K230集原ISP IP和GPU IP

    近日,领先的集成电路设计企业原股份(以下简称“原”)宣布与嘉楠科技(以下简称“嘉楠”)展开深度合作。此次合作中,嘉楠科技推出的全球首款支持RISC-V Vector 1.0标准的商用量产
    的头像 发表于 03-14 10:02 1312次阅读