0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Kria K26 SOM性能解决方案的对比分析

YCqV_FPGA_EETre 来源:FPGA开发圈 作者:FPGA开发圈 2021-07-02 14:13 次阅读

赛灵思的研究结果表明,K26 SOM 提供了比英伟达 Jetson Nano 高出大约 3 倍的性能。此外,它的单位功耗性能较之英伟达 Jetson TX2 提升了 2 倍。对于 SSD MobileNet-v1 这样的网络,K26 SOM 的低时延、高性能深度学习处理单元 (DPU)提供了比 Nano 高出 4 倍甚至更高的性能。

01

与未来兼容的 Kria K26 SOM

智能应用除了要求亚微秒级的时延,还需要具备私密性、低功耗、安全性和低成本。以 Zynq MPSoC 架构为基础,Kria K26 SOM 提供了业界一流的单位功耗性能和更低的总体拥有成本,使之成为边缘设备的理想选择。

原始计算能力

就在边缘设备上部署解决方案而言,硬件必须拥有充足的算力,才能处理先进 ML 算法工作负载。我们可以使用各种深度学习处理单元 (DPU) 配置对 Kria K26 SOM 进行配置,还能根据性能要求,将最适用的配置集成到设计内。

支持更低精度的数据类型

深度学习算法正在以极快的速度演进发展,各种更低精度的数据类型和定制数据正在进入使用。传统的 GPU 厂商已无法满足当前的市场需求,而 Kria K26 SOM 能够支持全系列数据类型精度,如 PF32、INT8、二进制和其他定制数据类型。

运算的能耗成本

低时延与低功耗

为了改善软件可编程能力,GPU 架构需要频繁访问外部 DDR。这种做法非常低效,有时候会对高带宽设计要求构成瓶颈。相反,Zynq MPSoC 架构具有高能效,它的可重配置能

力便于开发者设计的应用减少或不必访问外部存储器。这不仅有助于减少应用的总功耗,也通过降低端到端时延改善了响应能力。

典型 GPU 与 Zynq MPSoC 架构

灵活性

与数据流固定的 GPU 不同,赛灵思硬件提供了灵活性用来专门地重新配置数据路径,从而实现最大吞吐量并降低时延。此外,可编程的数据路径也降低了对批处理的需求,而批处理是 GPU 的一个重大不足,需要在降低时延或提高吞吐量之间做出权衡取舍。Kria SOM 灵活的架构已在稀疏网络中展示出巨大潜力。

02

与英伟达 Jetson 性能比较

深度学习模型性能比较

根据测试数据,所有模型在 K26 SOM 上的性能数值均优于英伟达 Jetson Nano。而且对于 SSD Mobilenet-V1 等部分模型,吞吐量则为 Jetson Nano 的四倍以上,为 Jetson Tx2 的两倍左右,从下表可以很容易地看到显著的吞吐量提升。

FPS(时延优化)

功耗测量

边缘设备提供最佳性能这点非常重要,但同时必须降低能耗。赛灵思测量了英伟达和赛灵思 SOM 模块在执行具体模型时发生的峰值功率,结果很明显,K26 SOM 优于 Jetson Nano

3.5 倍,优于 Jetson TX2 2.4 倍。

FPS/瓦

实际应用性能比较

为了分析实际用例,我们选择了一种准确检测和识别车辆牌照的基于机器学习的应用。将 Uncanny Vision 行业领先的 ANPR 算法部署在 Kria SOM 上后,与英伟达用 Deepstream-SDK 完成的“车牌识别”的公开数据进行比较,结果说明,Uncanny Vision 的 ANPR 流水线在针对 KV260 入门套件进行优化后,实现了超过 33fps 的吞吐量,显著优于英伟达基准测试中 Jetson Nano 的 8pfs 和 Jetson Tx2 的 23fps。这种前所未有的性能水平为 ANPR 集成商和 OEM 厂商提供了优于竞争对手的开发灵活性。

实际应用测试显示,K26 SOM 不仅在标准性能比较中表现极其优异,并且在为开发者提供加速整体 AI 和视觉流水线所需的原始性能时,效率也更高。通过对比,在标准的基准测试领域之外,竞争解决方案倾向于提供较低效率水平,而且功耗较高。

文章出处:【微信公众号:FPGA开发圈】

责任编辑:gt

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 赛灵思
    +关注

    关注

    32

    文章

    1794

    浏览量

    131144
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4686

    浏览量

    128652
  • 英伟达
    +关注

    关注

    22

    文章

    3727

    浏览量

    90758

原文标题:白皮书 | Kria K26:边缘端视觉 AI 理想平台

文章出处:【微信号:FPGA-EETrend,微信公众号:FPGA开发圈】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    RoCE与IB对比分析(二):功能应用篇

    在上一篇中,我们对RoCE、IB的协议栈层级进行了详细的对比分析,二者本质没有不同,但基于实际应用的考量,RoCE在开放性、成本方面更胜一筹。本文我们将继续分析RoCE和IB在拥塞控制、QoS、ECMP三个关键功能中的性能表现。
    的头像 发表于 11-15 14:03 75次阅读
    RoCE与IB<b class='flag-5'>对比分析</b>(二):功能应用篇

    光伏电站运维管理系统与传统运维模式对比分析

           光伏电站运维管理系统与传统运维模式对比分析        随着全球对可再生能源的关注度不断提升,光伏电站作为绿色能源的重要组成部分,其运维管理显得尤为重要。传统的运维模式已逐渐无法满足
    的头像 发表于 11-08 16:14 159次阅读
    光伏电站运维管理系统与传统运维模式<b class='flag-5'>对比分析</b>

    亿佰特污水监控系统智能解决方案,精确感知、精细管理!

    亿佰特污水监控系统智能解决方案,精确感知、精细管理!
    的头像 发表于 11-01 08:07 136次阅读
    亿佰特污水监控系统智<b class='flag-5'>能解决方案</b>,精确感知、精细管理!

    单臂螺旋天线:无线通信中的高效能解决方案

    深圳特信电子|单臂螺旋天线:无线通信中的高效能解决方案
    的头像 发表于 10-31 09:04 139次阅读

    常用音频线接口对比分析

    对比分析: 一、光纤接口 原理 :利用光信号进行音频传输,采用光从光密介质进入光疏介质时发生全反射的原理。 转换方式 :音频信号→数字信号→光信号→数字信号→音频信号。 优点 :传输速度快、抗干扰能力强、传输距离长,且不受外界电磁波干扰,能支持
    的头像 发表于 10-30 15:58 238次阅读

    对比分析点焊机与传统焊接方法

    在焊接技术的演进历程中,点焊机凭借其高效、精确与自动化的特性,在现代工业制造中迅速崛起,成为现代工业制造中的重要工具。相较于历史悠久的传统焊接方式,点焊机展现了诸多独特优势。以下我们将从点焊机的工作原理、优缺点及应用领域三大维度,对两者进行细致入微的对比分析
    的头像 发表于 09-12 11:52 323次阅读

    网关和路由器的对比分析

    网关和路由器作为计算机网络中的关键设备,各自承担着不同的角色和功能。下面将从定义、功能、应用场景、性能等多个方面对网关和路由器进行对比分析
    的头像 发表于 08-27 10:20 894次阅读

    激光锡焊与回流焊接对焊点影响的对比分析

    针对电子装联技术的特点,激光锡焊与回流焊接在对焊点影响方面做以下对比分析
    的头像 发表于 08-23 11:19 389次阅读

    交流伺服电机与直流伺服电机的对比分析

    伺服电机作为现代工业自动化领域的核心动力元件,广泛应用于各种高精度、高效率的运动控制系统中。其中,交流伺服电机和直流伺服电机作为两种主要的伺服电机类型,各有其独特的工作原理、性能特点和应用场景。本文将对这两种伺服电机进行详细的对比分析,以期为工程师和技术人员在实际应用中提
    的头像 发表于 06-24 14:40 717次阅读

    贸泽开售适用于工业、医疗和机器人应用的AMD/Xilinx Kria K24 SOM

    机器人、工厂自动化等)提供合适的功率、成本和性能。   贸泽供应的AMD/Xilinx KriaK24 SOMKria
    发表于 06-21 15:24 891次阅读
    贸泽开售适用于工业、医疗和机器人应用的AMD/Xilinx <b class='flag-5'>Kria</b> <b class='flag-5'>K</b>24 <b class='flag-5'>SOM</b>

    SD卡、MicroSD卡和SD NAND的性能与应用对比

    在当前丰富多元的存储解决方案领域,SD卡、MicroSD卡以及SD NAND凭借其各自的独特优势和特定的使用情景,赢得了市场的广泛认可。每种存储技术都展现了其独到之处,为用户带来了多样化的选择。接下来,MK米客方德将深入探讨这三种存储介质的性能、特点以及适用领域,提供一份
    的头像 发表于 06-14 15:48 752次阅读
    SD卡、MicroSD卡和SD NAND的<b class='flag-5'>性能</b>与应用<b class='flag-5'>对比</b>

    控制继电器与PLC的对比分析

    将对控制继电器和PLC进行详细的对比分析,旨在帮助读者更好地理解两者的差异,以便在实际应用中做出更合适的选择。
    的头像 发表于 06-03 15:01 1.7w次阅读

    超级电容储能与飞轮储能的对比分析

    随着全球能源结构的转型和可再生能源技术的快速发展,储能技术已成为电力系统中的重要组成部分。超级电容储能和飞轮储能作为两种新兴的储能技术,各自具有独特的优点和局限性。本文将对这两种储能技术进行全面对比分析,旨在探讨它们在不同应用场景下的优势和适用性,为储能技术的选择和应用提供参考。
    的头像 发表于 05-17 15:48 2264次阅读

    火电厂凝汽器不停车在线清洗与凝汽器停车清洗八种技术对比分析

    通过凝汽器结垢对发电机组运行安全性和经济性的影响分析,以及对火电行业现有凝汽器清洗技术的优劣对比介绍,并通过火电厂凝汽器在线化学清洗技术案例,对清洗前后凝汽器运行性能数据进行了对比分析
    的头像 发表于 03-21 19:57 417次阅读
    火电厂凝汽器不停车在线清洗与凝汽器停车清洗八种技术<b class='flag-5'>对比分析</b>

    DC电源模块与AC电源模块的对比分析

    DC电源模块与AC电源模块的对比分析 BOSHIDA DC电源模块和AC电源模块是两种常见的电源模块,它们在供电方式、稳定性、适用范围等方面有所不同,下面是它们的对比分析: 1. 供电方式: DC
    的头像 发表于 01-15 14:01 846次阅读
    DC电源模块与AC电源模块的<b class='flag-5'>对比分析</b>