0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Arm Ethos-U85:满足物联网面向AI时代的高性能需求

Arm社区 来源:Arm社区 2024-04-09 17:04 次阅读

随着人工智能 (AI) 不断对我们的日常生活产生越来越大的影响,其推理任务也逐渐从云端迁移到边缘侧和端侧。边缘侧推理为板载设备引入智能化能力,使数据能够在本地进行处理,并实时做出决策,同时提高了数据隐私性和安全性。

Arm Ethos NPU

Arm 多年来不断开发边缘 AI 加速器,以满足边缘侧和端侧不断增长的推理工作负载需求。此前两款成功的 NPU 产品 —— Arm Ethos-U55 和 Ethos-U65,为边缘侧和端侧 AI 应用带来了高性能、高能效的解决方案。

Ethos-U55 通常部署在基于 Cortex-M 的异构系统中。而 Ethos-U65 则将 Ethos-U 系列的适用性扩展到基于 Cortex-A 的系统中,并为设备上的机器学习 (ML) 能力带来了两倍的性能提升。这两款产品均提供统一的工具链,可简化开发并支持常见的 ML 神经网络运算,包括卷积神经网络 (CNN) 和循环神经网络 (RNN)。

Transformer 架构的影响

于 2017 年问世的 Transformer 架构彻底改变了生成式 AI,并成为许多新型神经网络的首选架构。基于 Transformer 架构的模型可利用注意力机制处理序列数据,并在机器翻译、自然语言理解、语音识别、分割和图像字幕生成等多项 AI 任务中实现优异的效果。

这些模型可被调整和压缩,在不过多影响准确度的情况下,能高效运行于边缘设备上,并在许多边缘侧和端侧用例中发挥领先的优势。

全新 Ethos-U85 NPU

依托 Ethos-U 系列 NPU 过往的成功经验,Arm 推出了全新产品 —— Ethos-U85。该处理器秉承此前 Ethos-U NPU 一贯的高性能、高能效设计理念,并可同时为边缘侧和端侧设备上采用 Transformer 架构的现有和未来的工作负载提供支持。

Ethos-U85 是 Arm Ethos-U 产品线中的第三代 NPU,也是迄今为止性能和能效最强的 Ethos NPU。与上一代产品相比,该 NPU 的性能提升了四倍,能效提高了 20%,并且可在主流网络上实现高达 85% 的利用率。全新 Ethos-U85 可满足诸如工厂自动化和商用或智能家居摄像头等物联网应用不断攀升的性能需求。此外,其专为搭配基于 Cortex-M 或 Cortex-A的系统一同运行而设计,并容忍高 DRAM 延迟。

Ethos-U85 的主要特性包括:

单周期支持从 128 到 2048 个 MAC 单元的配置 —— 在 1GHz 时,算力可支持从 256 GOPS 到 4 TOPS。

支持 int8 权重和 int8 或 int16 激活。

支持 Transformer 架构网络,以及 CNN 和 RNN。

硬件原生支持 2/4 稀疏性,使吞吐量翻倍。

内部 SRAM 为 29 至 267 KB,多达六个 128 位 AXI5 接口

支持权重压缩,采用标准和快速权重编码器

支持扩展压缩。

除了 Ethos-U55 和 Ethos-U65 目前支持的算子,通过支持 TRANSPOSE、GATHER、MATMUL、RESIZE BILINEAR 和 ARGMAX 等运算,Ethos-U85 涵盖了对 Transformer 模型和 DeeplabV3 语义分割网络的原生硬件支持。

Ethos-U85 也支持元素级算子链化。通过链化将元素级运算与先前的运算相结合,使 SRAM 不必先写入再读取中间张量。由此可凭借 NPU 和内存之间数据传输量的减少,提高 NPU 的效率。相比于 Ethos-U65,链化是 Ethos-U85 在效率提升上的新功能之一,其余还包括快速的权重编码器、优化的 MAC 阵列能效,以及提升的元素效率。

76e89a6c-f64e-11ee-a297-92fbcf53809c.png

图:Ethos-U85 系统配置

Ethos-U85 可用于与 Ethos-U55 和 Ethos-U65 相同的系统配置流程,并且我们支持从基于 Cortex-A 的系统直接驱动 Ethos-U85 的功能。

Ethos-U85 支持与上一代 Ethos-U 系列产品相同的软件工具链, 即使用 TFLmicro 运行时。此外,在这个基础上,Ethos-U85 同时还能为更广泛采用 Transformer 架构的用例提供支持,这对于已经投入在基于 Cortex-A/Cortex-M 与 Ethos-U55/Ethos-U65 的系统厂商来说,将能扩大其过往的投资价值。未来,我们预计将支持面向边缘设备的 PyTorch 运行时 ExecuTorch。

Ethos-U85 支持的算子将在 NPU 上进行加速,对于特殊算子不支持的情况,其中部分算子将调用 CMSIS-NN 库实现在 Cortex-M系统上进行加速。例如,在 tinyLlama 的用例中,该模型算子可完全映射到 Ethos-U85,没有算子回退到 CPU

Ethos-U85 担任了 Arm 全新物联网参考设计平台 Corstone-320 的核心角色,该参考设计平台加快了各类 AIoT 解决方案中高性能 SoC 的开发和部署。

释放边缘 AI 的无限潜力

Ethos-U85 将提供在边缘侧和端侧设备上执行领先 AI 功能所需的算力。随着 AI 时代的不断发展,我们的合作伙伴将获得基于 Arm Ethos-U 的可靠、高效兼具高性能的解决方案。我们预计在新兴的边缘 AI 用例、智能家居、零售或工业场景中看到 Ethos-U85 被广泛部署,这些用例和场景需要更高的计算性能,并支持新型的 AI 框架。

Arm 引以为傲的是,我们不断通过前沿的软硬件解决方案,为合作伙伴与生态系统提供强而有力的支持。全新 Ethos-U85 的推出将释放边缘侧和端侧 AI 推理用例的无限潜能,从而改变世界。Arm 正在引领边缘 AI 的创新提升至全新水平,并持续夯实 Arm 成为未来边缘 AI 的基石。



审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • sram
    +关注

    关注

    6

    文章

    767

    浏览量

    114683
  • 物联网
    +关注

    关注

    2909

    文章

    44613

    浏览量

    373149
  • 人工智能
    +关注

    关注

    1791

    文章

    47253

    浏览量

    238406
  • Cortex-M
    +关注

    关注

    2

    文章

    229

    浏览量

    29757
  • AI加速器
    +关注

    关注

    1

    文章

    69

    浏览量

    8635

原文标题:Arm Ethos-U85:满足物联网面向 AI 时代的高性能需求

文章出处:【微信号:Arm社区,微信公众号:Arm社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    AI高性能计算平台是什么

    AI高性能计算平台不仅是AI技术发展的基石,更是推动AI应用落地、加速产业升级的重要工具。以下,是对AI
    的头像 发表于 11-11 09:56 190次阅读

    高通推出面向AI时代的全新工业联网产品组合

    AI解决方案,从而在AI时代占据领先地位。作为解决工业需求的关键举措,全新工规级处理器产品组合高通IQ系列面向最具挑战性的安全级工作环境而设
    的头像 发表于 11-08 10:22 251次阅读

    ARM开发板在联网中的应用

    于需要长时间运行且能源有限的联网设备来说至关重要。低功耗意味着更长的电池寿命和更低的运营成本。 2. 高性能 ARM处理器提供了高性能的处
    的头像 发表于 11-05 11:38 474次阅读

    大模型时代的算力需求

    现在AI已进入大模型时代,各企业都争相部署大模型,但如何保证大模型的算力,以及相关的稳定性和性能,是一个极为重要的问题,带着这个极为重要的问题,我需要在此书中找到答案。
    发表于 08-20 09:04

    芯品# 联网市场性能最高的 NPU

    提高数据隐私和安全性。 ArmEthos NPU 如何增强边缘和端点的 AI 性能? 多年来,Arm 一直在开发边缘
    的头像 发表于 06-26 17:28 7828次阅读
    芯品# <b class='flag-5'>物</b><b class='flag-5'>联网</b>市场<b class='flag-5'>性能</b>最高的 NPU

    罗彻斯特电子携手u-blox为全球客户提供领先的联网解决方案

    在当今数字化快速发展的时代联网(IoT)已成为推动工业、汽车和消费行业变革的重要力量。罗彻斯特电子与u-blox的强强联手,正是为了满足
    的头像 发表于 06-26 10:15 575次阅读

    广和通发布高性能端侧AI解决方案,赋能联网生态系统

    展现了广和通在联网领域的深厚积累,更标志着公司在拓展联网生态系统和满足端侧AI应用
    的头像 发表于 06-07 16:15 638次阅读

    FRAM SF25C20晶圆合封MCU,满足小尺寸和高性能需求

    FRAM SF25C20晶圆合封MCU,满足小尺寸和高性能需求
    的头像 发表于 04-22 09:49 618次阅读
    FRAM SF25C20晶圆合封MCU,<b class='flag-5'>满足</b>小尺寸和<b class='flag-5'>高性能需求</b>

    Arm发布新一代Ethos-U AI加速器 Arm旨在瞄准国产CPU市场

    Arm发布的新一代Ethos-U AI加速器确实在业界引起了广泛关注。
    的头像 发表于 04-18 15:59 755次阅读

    Arm推第三代边缘AI加速器:Arm Ethos-U85

    除了Ethos-U85之外,Arm还推出了全新的联网参考设计平台Corstone-320。该平台将Arm
    发表于 04-16 11:09 672次阅读
    <b class='flag-5'>Arm</b>推第三代边缘<b class='flag-5'>AI</b>加速器:<b class='flag-5'>Arm</b> <b class='flag-5'>Ethos-U85</b>

    Arm推动生成式AI落地边缘!全新Ethos-U85 AI加速器支持Transformer 架构,性能提升四倍

    等领先企业均已推出搭载 Ethos-U 的量产芯片。最近,Arm发布Arm Ethos-U85 AI加速器,这款加速器在
    的头像 发表于 04-16 09:10 4605次阅读
    <b class='flag-5'>Arm</b>推动生成式<b class='flag-5'>AI</b>落地边缘!全新<b class='flag-5'>Ethos-U85</b> <b class='flag-5'>AI</b>加速器支持Transformer 架构,<b class='flag-5'>性能</b>提升四倍

    Arm发布第三代NPU,适用于工业自动化等场景,性能提升四倍

    Ethos-U85 在能源效率上相比前作提高了 20%,且可兼容常用神经网络以达 85% 的利用率。其设计适配基于 Arm Cortex-M / A 处理器内核的系统,对内存延迟有较强适应性。
    的头像 发表于 04-12 16:13 967次阅读

    Arm推出新一代Ethos-U AI加速器及全新联网参考设计平台

    Arm 控股有限公司(纳斯达克股票代码:ARM,以下简称“Arm”)今日宣布推出 Arm Ethos-U85 神经网络处理器 (NPU),是
    的头像 发表于 04-09 17:02 880次阅读
    <b class='flag-5'>Arm</b>推出新一代<b class='flag-5'>Ethos-U</b> <b class='flag-5'>AI</b>加速器及全新<b class='flag-5'>物</b><b class='flag-5'>联网</b>参考设计平台

    面向联网(IOT)、工业、通信等应用的模拟及数模混合芯片设计

    本命题方向为面向联网(IOT)、工业、通信等应用的模拟及数模混合芯片设计,特别聚焦于应用广泛的高性能数据转换器(ADC/DAC)芯片设计。
    的头像 发表于 03-27 14:00 736次阅读
    <b class='flag-5'>面向</b><b class='flag-5'>物</b><b class='flag-5'>联网</b>(IOT)、工业、通信等应用的模拟及数模混合芯片设计

    Hitek Systems开发基于PCIe的高性能加速器以满足行业需求

    Hitek Systems 使用开放式 FPGA 堆栈 (OFS) 和 Agilex 7 FPGA,以开发基于最新 PCIe 的高性能加速器 (HiPrAcc),旨在满足网络、计算和高容量存储应用的需求
    的头像 发表于 03-22 14:02 632次阅读
    Hitek Systems开发基于PCIe的<b class='flag-5'>高性能</b>加速器以<b class='flag-5'>满足</b>行业<b class='flag-5'>需求</b>