0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

使用神经处理单元集群转换边缘AI

星星科技指导员 来源:嵌入式计算设计 作者:Saumitra Jagdale 2022-10-19 10:57 次阅读

随着人工智能领域获得牵引力,这些设备变得越来越计算和耗电。随后,边缘设备上的处理负载随着系统架构的性能和复杂性而显著增加。因此,在系统中灌输了更高分辨率的图像和更复杂的算法,随着对AI处理的需求不断增长,以实现高TOPS性能,这需要进一步优化。

Synopsys 发布了神经处理单元 (NPU)、知识产权 (IP) 内核和工具链,以满足 AI 片上系统 (SoC) 中日益复杂的神经网络模型的性能需求。其新的设计软件 ARC NPX6 和 NPX6FS NPU IP 可处理实时计算的需求,同时为 AI 应用消耗超低功耗。此外,该公司的新 MetaWare MX 开发工具提供了一个完整的编译环境,具有自动化神经网络算法分区,可最大限度地提高最新 NPU 上应用软件开发的资源效率。

使用新的设计软件 ARC NPX6 和 NPX6FS NPU IP 以及元软件 MX 开发工具包,设计人员可以利用最新的神经网络模型,满足不断升级的性能期望,并加快其下一代智能 SoC 的上市时间。ARC NPX6 NPU IP 系列包括许多处理深度学习算法覆盖的产品,包括对象识别、图像质量增强和场景分割等计算机视觉任务,以及音频和自然语言处理等大型 AI 应用。设计中的单个内核可以从 4K MAC 扩展到 96K MAC,以实现超过 250 TOPS 和超过 440 TOPS 的单个 AI 引擎性能,并且很少。

NPX6 NPU IP 包含对多达 8 个 NPU 的多 NPU 群集的硬件和软件支持,稀疏性为 3500 TOPS。由于硬件和软件中的高级带宽功能以及内存层次结构(每个内核中包含L1内存以及用于访问常见L2内存的高性能,低延迟连接),可以扩展到大量MAC数量。对于受益于神经网络内部 BF16 或 FP16 的应用,提供了可选的张量浮点单元。

poYBAGNPZ7iAFPArAAGDfudyRsU033.png

MetaWare MX 开发工具包为应用软件开发提供了软件编程环境,包括神经网络软件开发工具包 (NN SDK) 和虚拟模型支持。NN SDK 会自动将使用流行框架(如巨炬、张量流或 ONNX)训练的神经网络转换为 NPX 优化的可执行代码。

这个概念是,NPX6 NPU处理器IP随后可用于制造各种产品,从几个TOPS到数千个TOPS,所有这些都可以使用单个工具链编写。

NPX6 网络输出电源的主要特性:

可扩展的实时 AI/神经处理器 IP,具有多达 3,500 个 TOPS 的性能,支持 CNN、RNN/LSTM、变压器、推荐器网络和其他神经网络。

功率效率(高达 30 TOPS/W)在业界无与伦比。

卷积加速器的 1-24 个内核,增加了 4K MAC/内核

张量加速器,支持张量运算符集体系结构并允许变量激活 (TOSA)

软件开发套件

用于自动混合模式量化的工具

降低带宽的架构和软件工具特性

通过并行处理各个层来减少延迟。

设计软件 ARC VPX 矢量 DSP 无缝集成。

生产力很高。张量流和巨炬框架,以及ONNX交换标准,由元软件MX开发工具包支持。

此外,ARC NPX6FS NPU IP 符合 ISO 26262 ASIL D 标准,用于随机硬件故障检测和系统功能安全开发流程。这些处理器具有符合 ISO 26262 的特定安全机制,可处理下一代区域性设计的混合关键性和虚拟化需求,以及全面的安全文档。

ARC 元软件 MX 开发工具包包括神经网络软件开发工具包 (SDK)、编译器和调试器、虚拟平台 SDK、运行时和库以及高级仿真模型。它提供了一个统一的工具链环境来加速应用程序开发,并在MAC资源之间智能地划分算法以实现最佳处理。MetaWare MX 安全开发工具包包含安全手册和安全指南,可帮助开发人员满足 ISO 26262 标准,并为安全关键型汽车应用的 ISO 26262 合规性测试做准备。

利用 NPU 集群加速边缘 AI 应用

为了满足人工智能应用不断增长的性能和复杂需求,恩智浦NPU IP核提供高性能、可扩展的实时人工智能和神经处理IP,具有多达3500个TOPS,支持各种神经网络,如CNN、RNN/LSTM、变压器和推荐器网络。

此外,它通过并行处理各个层来减少延迟。此外,高生产力的元软件 MX 开发工具包支持张量流和巨魔框架以及 ONNX 交换格式。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    19286

    浏览量

    229852
  • 神经网络
    +关注

    关注

    42

    文章

    4771

    浏览量

    100772
  • 人工智能
    +关注

    关注

    1791

    文章

    47279

    浏览量

    238511
收藏 人收藏

    评论

    相关推荐

    AI模型部署边缘设备的奇妙之旅:如何实现手写数字识别

    ,而不必传输到外部服务器,这有助于更好地保护用户隐私和数据安全。 然而,边缘计算也带来了独特的挑战,特别是在资源受限的嵌入式系统中部署复杂的AI模型时。为了确保神经网络模型能够在边缘
    发表于 12-06 17:20

    HZHY-AI100G:适配鸿蒙系统的AI边缘计算智能盒

    Cortex-A55处理器,主频高达2.0GHz,同时内置1TOPS的NPU(神经网络处理单元),能够在多个应用场景中实现高效的数据处理。支
    的头像 发表于 11-23 01:09 208次阅读
    HZHY-<b class='flag-5'>AI</b>100G:适配鸿蒙系统的<b class='flag-5'>AI</b><b class='flag-5'>边缘</b>计算智能盒

    使用 ADI 的 MAX78002 MCU 开发边缘 AI 应用

    的物联网设备上运行。 Analog Devices, Inc. 的微控制器单元 (MCU) 可以通过集成的低功耗卷积神经网络 (CNN) 加速器来解决边缘处理限制,以
    的头像 发表于 10-17 11:39 1455次阅读
    使用 ADI 的 MAX78002 MCU 开发<b class='flag-5'>边缘</b> <b class='flag-5'>AI</b> 应用

    使用逻辑和转换优化数字驾驶舱处理单元

    电子发烧友网站提供《使用逻辑和转换优化数字驾驶舱处理单元.pdf》资料免费下载
    发表于 09-05 11:08 0次下载
    使用逻辑和<b class='flag-5'>转换</b>优化数字驾驶舱<b class='flag-5'>处理</b><b class='flag-5'>单元</b>

    基于FPGA的类脑计算平台 —PYNQ 集群的无监督图像识别类脑计算系统

    模拟器,可为 SNN 算法开发者和神经学家提供理想满意的类脑仿真实验平台。 (2)本设计提供的基于 NEST 仿真器的 FPGA 集群的硬件加速服务可以为实验环境不理 想,应用计算复杂周期长的用户带来
    发表于 06-25 18:35

    边缘AI网关,将具备更强大的计算和学习能力

    电子发烧友网报道(文/李弯弯)网关又称网间连接器、协议转换器。网关在网络层以上实现网络互连,是复杂的网络互连设备,仅用于两个高层协议不同的网络互连。   边缘AI网关是指在边缘计算环境
    的头像 发表于 06-06 00:26 3529次阅读

    ai边缘盒子有哪些用途?ai视频分析边缘计算盒子详解

    近年来,随着人工智能和边缘计算的发展,一种名为AI边缘盒子的新型设备正逐渐引起广泛关注。作为一种集成了边缘计算和AI算法
    的头像 发表于 05-29 14:24 983次阅读
    <b class='flag-5'>ai</b><b class='flag-5'>边缘</b>盒子有哪些用途?<b class='flag-5'>ai</b>视频分析<b class='flag-5'>边缘</b>计算盒子详解

    边缘计算单元多接入能力怎么算

    边缘计算作为一种分布式计算模式,其多接入能力是评估其性能和扩展性的重要指标之一。在实际应用中,我们需要考虑多个因素来计算边缘计算单元的多接入能力。这包括带宽和网络延迟、处理能力、并发连
    的头像 发表于 05-16 17:51 321次阅读

    AI边缘计算盒子优势有哪些?如何实现低延迟处理

    AI边缘计算盒子作为一种集成人工智能技术的边缘计算设备,其优势主要体现在以下几个方面,万物纵横为您详细介绍: 边缘计算盒子 1. 低延迟处理
    的头像 发表于 05-09 16:07 653次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>边缘</b>计算盒子优势有哪些?如何实现低延迟<b class='flag-5'>处理</b>?

    面向边缘AI应用的全新RZ/V2H

    一款新的64位 MPU RZ/V2H ,为瑞萨电子的RZ/V系列带来了针对边缘AI的重大升级。边缘AI是指在连接网络的边缘进行的
    的头像 发表于 05-07 14:56 7443次阅读
    面向<b class='flag-5'>边缘</b><b class='flag-5'>AI</b>应用的全新RZ/V2H

    risc-v多核芯片在AI方面的应用

    得RISC-V多核芯片能够更好地适应AI算法的不同需求,包括深度学习、神经网络等,从而提高芯片的性能和效率,降低成本,使AI边缘计算晶片更具竞争力。 再者,RISC-V的多核设计可以进
    发表于 04-28 09:20

    全新AMD锐龙8000F系列处理器整机正式发售 配备神经处理单元(NPU)

    器,将由AMD渠道品牌整机合作伙伴提供整机进行销售。全新AMD锐龙8000F系列处理器为提高效率进行了低功耗优化,其中的AMD锐龙7 8700F配备了尖端的神经处理单元(NPU),它提
    的头像 发表于 04-18 11:05 856次阅读
    全新AMD锐龙8000F系列<b class='flag-5'>处理</b>器整机正式发售 配备<b class='flag-5'>神经</b><b class='flag-5'>处理</b><b class='flag-5'>单元</b>(NPU)

    恩智浦推出首次搭载专属神经处理单元(NPU)的MCX N系列!

    恩智浦半导体强势推出新品MCX N系列产品,首次集成恩智浦专用神经处理单元(NPU), 可助力实现高性能、低功耗的边缘安全智能。
    的头像 发表于 03-14 09:46 1179次阅读

    NanoEdge AI的技术原理、应用场景及优势

    NanoEdge AI 是一种基于边缘计算的人工智能技术,旨在将人工智能算法应用于物联网(IoT)设备和传感器。这种技术的核心思想是将数据处理和分析从云端转移到设备本身,从而减少数据传输延迟、降低
    发表于 03-12 08:09

    什么是AI边缘计算,AI边缘计算的特点和优势介绍

    随着人工智能的迅猛发展,AI边缘计算成为了热门话题。那么什么是AI边缘计算呢?简单来说,它是将人工智能技术引入边缘计算的新兴领域,旨在将计算
    的头像 发表于 02-01 11:42 899次阅读