0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

赛灵思Kria K26 SOM应运而生为ML边缘应用开发提供了更加理想的选择

Xilinx赛灵思官微 来源:Xilinx赛灵思官微 作者:Xilinx赛灵思官微 2021-07-01 11:52 次阅读

随着人工智能机器学习算法取得一系列新进展

众多高计算强度的应用正在被部署到边缘设备上

当下,业界迫切需要一种高效率的硬件

既能高效率地执行复杂算法

又能适应这种技术的快速演进

在此背景下,赛灵思 Kria K26 SOM应运而生

为 ML 边缘应用开发提供了更加理想的选择

赛灵思的研究结果表明,K26 SOM 提供了比英伟达 Jetson Nano 高出大约 3 倍的性能。此外,它的单位功耗性能较之英伟达 Jetson TX2 提升了 2 倍。对于 SSD MobileNet-v1 这样的网络,K26 SOM 的低时延、高性能深度学习处理单元 (DPU)提供了比 Nano 高出 4 倍甚至更高的性能。

01

与未来兼容的 Kria K26 SOM

智能应用除了要求亚微秒级的时延,还需要具备私密性、低功耗、安全性和低成本。以 Zynq MPSoC 架构为基础,Kria K26 SOM 提供了业界一流的单位功耗性能和更低的总体拥有成本,使之成为边缘设备的理想选择。

原始计算能力

就在边缘设备上部署解决方案而言,硬件必须拥有充足的算力,才能处理先进 ML 算法工作负载。我们可以使用各种深度学习处理单元 (DPU) 配置对 Kria K26 SOM 进行配置,还能根据性能要求,将最适用的配置集成到设计内。

支持更低精度的数据类型

深度学习算法正在以极快的速度演进发展,各种更低精度的数据类型和定制数据正在进入使用。传统的 GPU 厂商已无法满足当前的市场需求,而 Kria K26 SOM 能够支持全系列数据类型精度,如 PF32、INT8、二进制和其他定制数据类型。

低时延与低功耗

为了改善软件可编程能力,GPU 架构需要频繁访问外部 DDR。这种做法非常低效,有时候会对高带宽设计要求构成瓶颈。相反,Zynq MPSoC 架构具有高能效,它的可重配置能

力便于开发者设计的应用减少或不必访问外部存储器。这不仅有助于减少应用的总功耗,也通过降低端到端时延改善了响应能力。

灵活性

与数据流固定的 GPU 不同,赛灵思硬件提供了灵活性用来专门地重新配置数据路径,从而实现最大吞吐量并降低时延。此外,可编程的数据路径也降低了对批处理的需求,而批处理是 GPU 的一个重大不足,需要在降低时延或提高吞吐量之间做出权衡取舍。Kria SOM 灵活的架构已在稀疏网络中展示出巨大潜力。

02

与英伟达 Jetson 性能比较

深度学习模型性能比较

根据测试数据,所有模型在 K26 SOM 上的性能数值均优于英伟达 Jetson Nano。而且对于 SSD Mobilenet-V1 等部分模型,吞吐量则为 Jetson Nano 的四倍以上,为 Jetson Tx2 的两倍左右,从下表可以很容易地看到显著的吞吐量提升。

功耗测量

边缘设备提供最佳性能这点非常重要,但同时必须降低能耗。赛灵思测量了英伟达和赛灵思 SOM 模块在执行具体模型时发生的峰值功率,结果很明显,K26 SOM 优于 Jetson Nano

3.5 倍,优于 Jetson TX2 2.4 倍。

实际应用性能比较

为了分析实际用例,我们选择了一种准确检测和识别车辆牌照的基于机器学习的应用。将 Uncanny Vision 行业领先的 ANPR 算法部署在 Kria SOM 上后,与英伟达用 Deepstream-SDK 完成的“车牌识别”的公开数据进行比较,结果说明,Uncanny Vision 的 ANPR 流水线在针对 KV260 入门套件进行优化后,实现了超过 33fps 的吞吐量,显著优于英伟达基准测试中 Jetson Nano 的 8pfs 和 Jetson Tx2 的 23fps。这种前所未有的性能水平为 ANPR 集成商和 OEM 厂商提供了优于竞争对手的开发灵活性。

实际应用测试显示,K26 SOM 不仅在标准性能比较中表现极其优异,并且在为开发者提供加速整体 AI 和视觉流水线所需的原始性能时,效率也更高。通过对比,在标准的基准测试领域之外,竞争解决方案倾向于提供较低效率水平,而且功耗较高。

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4768

    浏览量

    129281
  • 人工智能
    +关注

    关注

    1796

    文章

    47643

    浏览量

    239917
  • SOM
    SOM
    +关注

    关注

    0

    文章

    60

    浏览量

    15762

原文标题:白皮书 | Kria K26:边缘端视觉 AI 理想平台

文章出处:【微信号:赛灵思,微信公众号:Xilinx赛灵思官微】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    低温失效的原因,有没有别的方法或者一些见解?

    低温失效的原因,有没有别的方法或者一些见解。就是芯片工作温度在100°--40°区间,然后呢我们到了0°以下就不工作了,然后在低温的情况下监测电流和电压都正常,频率也都正常,频
    发表于 12-30 16:28

    Silicon Labs携手Eta Compute简化边缘ML开发

    Silicon Labs(芯科科技)与 Eta Compute近期共同宣布建立合作伙伴关系,将支持产品开发人员将机器学习(ML)高级功能无缝集成到其边缘ML嵌入式产品中,以添加多样应用
    的头像 发表于 12-12 10:26 230次阅读

    TI解读:嵌启未来 边缘AI不边缘

    的创新半导体、直观的软件和设计专业知识可以帮助您转变设计,使其更智能、更安全、适应性更强。 随着物联网技术的飞速发展, 边缘计算正逐渐成为实现高效数据处理和实时决策的关键技术。 在这一背景下,边缘 AI 应运而生,它通过将
    的头像 发表于 12-09 14:18 648次阅读
    TI解读:嵌启未来 <b class='flag-5'>边缘</b>AI不<b class='flag-5'>边缘</b>

    云端ai开发环境怎么样

    随着云计算技术的成熟与普及,云端AI开发环境应运而生,为AI开发提供一个高效、灵活、可扩展的开发
    的头像 发表于 10-24 09:37 227次阅读

    智能安全带是时代应运而生的产物

    面对传统安全带的种种不足,智能安全带应运而生。它集成了现代传感技术、物联网技术、大数据分析等前沿科技,实现对高空作业工人安全的全方位、智能化监控与管理。智能安全带不仅能够实时监测工人的身体状态
    的头像 发表于 08-05 11:07 345次阅读

    EOS智慧营销设计平台:精准高效可扩展的营销新选择

    随着人工智能、大数据和信息技术的不断发展,企业需要更高效、更精准的工具来设计和实施营销策略。这时,EOS智慧营销设计平台应运而生,为企业提供全新的营销解决方案。
    的头像 发表于 07-24 14:07 400次阅读
    EOS智慧营销设计平台:精准高效可扩展的营销新<b class='flag-5'>选择</b>

    快讯 | 发展新质生产力问道如何下好“创新棋”?

    7月11日,南湖区委宣传部、清华大学马克主义学院共同带队一行莅临围绕时频新质生产力创新层面进行实地调研,副总经理田永和、对外合作部
    的头像 发表于 07-12 13:31 502次阅读
    <b class='flag-5'>赛</b><b class='flag-5'>思</b>快讯 | 发展新质生产力问道<b class='flag-5'>赛</b><b class='flag-5'>思</b>?<b class='flag-5'>赛</b><b class='flag-5'>思</b>如何下好“创新棋”?

    FPGA下载问题

    在ARM开发中,通常可供选择的下载器有多种。清华的FPGA,除了官方的专用下载器,有其他的下载器可以使用吗?使用下载器可以吗?
    发表于 06-23 12:28

    贸泽开售适用于工业、医疗和机器人应用的AMD/Xilinx Kria K24 SOM

    机器人、工厂自动化等)提供合适的功率、成本和性能。   贸泽供应的AMD/Xilinx KriaK24 SOMKria
    发表于 06-21 15:24 931次阅读
    贸泽开售适用于工业、医疗和机器人应用的AMD/Xilinx <b class='flag-5'>Kria</b> <b class='flag-5'>K</b>24 <b class='flag-5'>SOM</b>

    给我一个FPGA,可以撬起所有显示的接口和面板

    兼顾内外屏幕。 对于的FPGA来说,可以根据FHD、UHD、8K的性能需求,来选择对应的FPGA产品系列。 产品这部分,据介绍,对于
    发表于 04-25 18:10

    智能化加速,AI边缘计算盒子提供强力支持!

    电子发烧友网报道(文/李弯弯)随着数字化时代的到来,数据量呈爆炸式增长,对数据处理的速度和效率提出了更高的要求。传统的云计算模式已经无法满足一些场景的智能化需求。因此,边缘计算应运而生,而边缘计算
    的头像 发表于 04-12 01:10 5387次阅读
    智能化加速,AI<b class='flag-5'>边缘</b>计算盒子<b class='flag-5'>提供</b>强力支持!

    FPGA flash操作原理

    FPGA flash操作原理分享
    的头像 发表于 04-09 15:03 1050次阅读

    智能边缘计算网关有哪些优势?

    在当今时代,数据已经成为驱动业务决策的关键因素。然而,传统的数据处理方式往往存在延迟,无法满足实时性要求。此时,智能边缘计算网关应运而生,它能够将数据处理和分析的能力从中心服务器转移至设备边缘
    的头像 发表于 04-03 14:39 378次阅读

    物联网边缘网关优势有哪些及相关优势产品

    随着物联网技术的快速发展,越来越多的设备接入网络,数据交互日益频繁,对数据处理和传输的要求也越来越高。在这样的背景下,物联网边缘网关应运而生,以其低延迟、减少带宽消耗、提高数据质量和安全性等优势,为
    的头像 发表于 03-26 15:20 372次阅读
    物联网<b class='flag-5'>边缘</b>网关优势有哪些及相关优势产品

    边缘计算网关与边缘计算的融合之道

    随着物联网、大数据和人工智能的飞速发展,数据处理和分析的需求呈现出爆炸式增长。传统的中心化数据处理模式已难以满足实时性、低延迟和高带宽的需求,边缘计算应运而生,成为解决这一难题的关键技术。而边缘计算
    的头像 发表于 02-26 16:29 502次阅读
    <b class='flag-5'>边缘</b>计算网关与<b class='flag-5'>边缘</b>计算的融合之道