0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

赛灵思INT8优化为嵌入式视觉应用性能和计算方法

Xilinx赛灵思官微 来源:djl 作者:赛灵思 2019-07-29 11:19 次阅读

赛灵思 INT8 优化为使用深度学习推断和传统计算机视觉功能的嵌入式视觉应用提供最优异的性能和能效最出色的计算方法。与其他 FPGA DSP 架构相比,赛灵思的集成 DSP 架构在 INT8 深度学习运算上能实现 1.75 倍的解决方案级性能。

本白皮书探讨将 INT8 运算用于实现在赛灵思 DSP48E2 片上、使用深度学习推断和计算机视觉功能的嵌入式视觉应用,以及这种方案与其他 FPGA 的对比。与占用相同资源数量的其他 FPGA 相比,赛灵思的 DSP 架构对 INT8 乘法累加(MACC) 运算能实现 1.75 倍的峰值解决方案级性能。由于嵌入式视觉应用可以在不牺牲准确性的情况下使用较低位精度,因此需要高效的 INT8 实现方案。

赛灵思的 DSP 架构和库针对 INT8 运算进行了精心优化。本白皮书介绍如何使用赛灵思 16nm 和 20nm All Programmable 器件中的 DSP48E2 Slice,在共享相同内核权重的同时处理两个并行的 INT8 MACC 运算。本白皮书还阐述了要运用赛灵思这一独特技术,为何输入的最小位宽为 24 位。此外本白皮书还详细介绍了如何以 SIMD 模式使用 DSP48E2 Slice,供基本算术运算使用。另外还提供在深度学习领域或其他计算机视觉处理任务领域如何将这些功能用于嵌入式视觉的实例。

全书目录

用于深度学习和计算机视觉的 INT8

赛灵思 DSP Slice 片上的 INT8 运算

可扩展的 INT8 优化

DSP48E2 SIMD 模式

映射 INT8 优化到深度学习应用

创建 INT8 链接 MACC 的其他方法

映射 INT8 优化到计算机视觉功能

使用可扩展 INT8 优化的定制 2D 卷积

使用 SIMD 运算的中值滤波器

竞争分析

在竞争分析中使用英特尔的 Arria 10 器件与赛灵思的 Zynq UltraScale+ MPSoC 对比。在进行嵌入式视觉应用计算效率比较时,选择的器件有可比的 DSP 密度和器件功耗:

• Arria 10 SoC :SX220、SX270 和 SX480

• Zynq UltraScale+ MPSoC :ZU3、ZU7 和 ZU9 器件

重点比较能用于包括深度学习和计算机视觉在内的众多应用的通用 MACC 性能。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 嵌入式视觉
    +关注

    关注

    8

    文章

    117

    浏览量

    59120
  • 算术运算
    +关注

    关注

    0

    文章

    6

    浏览量

    5665
收藏 人收藏

    评论

    相关推荐

    用OpenCV和Vivado HLS加速基于Zynq SoC的嵌入式视觉应用开发

    设计流程  为了进一步帮助嵌入式视觉开发人员创建Smarter Vision系统,在Vivado中增加了对OpenCV
    发表于 04-21 15:49

    XilinxFPGA技术及应用线上公开课

    ` 本帖最后由 MGJOY 于 2017-4-10 15:07 编辑 本周三,4月12日,FPGA技术及应用线上公开课。欢迎大家观看、学习交流~分享主题【
    发表于 04-10 15:06

    海量干货分享!XDF(开发者大会)北京站各分论坛演讲资料公布

    中的研究与应用 - 科大讯飞基因组数据的 FPGA 超级计算系统 - SmartVSCTurbo-提升您的洞察力 - Sumup边缘计算分论坛面向嵌入式深度剖析的机器学习 - Xilinx使用支持
    发表于 01-03 15:19

    基于Spartan-3A的视频分析

    视频分析对性能处理的要求可充分发挥FPGA的并行架构、嵌入式和DSP处理能力所带来的优点。
    发表于 05-16 10:26 1151次阅读
    基于<b class='flag-5'>赛</b><b class='flag-5'>灵</b><b class='flag-5'>思</b>Spartan-3A的视频分析

    收购嵌入式Linux方案提供商PetaLogix

    All Programmable技术和器件的全球领先企业公司(Xilinx, Inc. (NASDAQ:XLNX) )今天宣布收购嵌入式Linux解决方案提供商PetaLogix
    发表于 08-30 16:59 645次阅读

    收购嵌入式Linux方案提供商PetaLogix

    公司(Xilinx)宣布收购嵌入式Linux解决方案提供商PetaLogix。随着Linux解决方案成为越来越多依赖
    发表于 09-05 09:14 566次阅读

    玩转Xilinx嵌入式视觉开发者专区 让视觉系统开发更加简单

    Programmable 的差异化嵌入式视觉应用。通过嵌入式视觉开发者专区,
    发表于 11-10 14:49 972次阅读

    强化嵌入式视觉应用与工业物联网产品系列

    与软件定义SDSoC开发环境公用版。这些新产品、开发环境及强化产业生态系的结合,使该公司客户得以在快速成长的嵌入式视觉应用与工业物联网市场中,创造具更高差异化与灵活性的应用。
    发表于 02-08 17:37 192次阅读

    Xilinx INT8 优化开发嵌入式视觉

    INT8 优化为使用深度学习推断和传统计算视觉
    的头像 发表于 09-22 17:27 5460次阅读

    嵌入式视觉的发展趋势及其算法示例

    在这篇文章中,前机器视觉市场战略总监Aaron Behman 针对嵌入式视觉方面的问题进行
    发表于 11-15 17:27 5430次阅读

    DSP48E2 Slice 上优化 INT8 深度学习运算分析

    学习每秒运算次数 (OPS) 上相比其它 FPGA,能实现 1.75 倍的峰值解决方案级性能。由于深度学习推断可以在不牺牲准确性的情况下使用较低位精度,因此需要高效的 INT8 实现方案。
    发表于 11-16 14:23 1.5w次阅读
    DSP48E2 Slice 上<b class='flag-5'>优化</b> <b class='flag-5'>INT8</b> 深度学习运算分析

    扩大生态系统,重塑嵌入式视觉、工业物联网系统设计的未来

    的系统正在重塑嵌入式视觉和工业物联网 (IIoT) 的未来。于今年 2 月在德国纽伦堡举办的嵌入式
    的头像 发表于 02-14 03:09 3491次阅读
    <b class='flag-5'>赛</b><b class='flag-5'>灵</b><b class='flag-5'>思</b>扩大生态系统,重塑<b class='flag-5'>嵌入式</b><b class='flag-5'>视觉</b>、工业物联网系统设计的未来

    Arm携手助力嵌入式开发人员获取成熟的Arm IP

    Arm和(Xilinx)强强联合,将业界最强大、最成熟的嵌入式生态系统优势与赛FPGA
    的头像 发表于 10-11 10:05 3139次阅读

    INT8优化为嵌入式视觉应用提供性能计算方法

    要使用可编程逻辑上的 DSP 实现中值滤波器,可以对算法做改动。每次比较运算可以分为减法运算及后续的符号位检查。对减法运算,DSP48E2 Slice 能够以四个 12 位或两个 24 位模式进行运算。要充分利用 DSP48E2 Slice,可以并行运算多个像素。
    的头像 发表于 07-30 08:59 3444次阅读
    <b class='flag-5'>赛</b><b class='flag-5'>灵</b><b class='flag-5'>思</b><b class='flag-5'>INT8</b><b class='flag-5'>优化为</b><b class='flag-5'>嵌入式</b><b class='flag-5'>视觉</b>应用提供<b class='flag-5'>性能</b>和<b class='flag-5'>计算方法</b>

    性能优良的FPGA嵌入式处理器平台

    公司昨天宣布了由独立的第三方对运行Accelerated Technology公司(AT)的Nucleus实时操作系统(RTOS)的32位MicroBlaze处理器平台进行的测试结果,再次证明了
    发表于 06-28 11:38 2299次阅读