赛灵思INT8优化为嵌入式视觉应用性能和计算方法-电子发烧友网

赛灵思 INT8 优化为使用深度学习推断和传统计算机视觉功能的嵌入式视觉应用提供最优异的性能和能效最出色的计算方法。与其他 FPGA DSP 架构相比，赛灵思的集成 DSP 架构在 INT8 深度学习运算上能实现 1.75 倍的解决方案级性能。

本白皮书探讨将 INT8 运算用于实现在赛灵思 DSP48E2 片上、使用深度学习推断和计算机视觉功能的嵌入式视觉应用，以及这种方案与其他 FPGA 的对比。与占用相同资源数量的其他 FPGA 相比，赛灵思的 DSP 架构对 INT8 乘法累加(MACC) 运算能实现 1.75 倍的峰值解决方案级性能。由于嵌入式视觉应用可以在不牺牲准确性的情况下使用较低位精度，因此需要高效的 INT8 实现方案。

赛灵思的 DSP 架构和库针对 INT8 运算进行了精心优化。本白皮书介绍如何使用赛灵思 16nm 和 20nm All Programmable 器件中的 DSP48E2 Slice，在共享相同内核权重的同时处理两个并行的 INT8 MACC 运算。本白皮书还阐述了要运用赛灵思这一独特技术，为何输入的最小位宽为 24 位。此外本白皮书还详细介绍了如何以 SIMD 模式使用 DSP48E2 Slice，供基本算术运算使用。另外还提供在深度学习领域或其他计算机视觉处理任务领域如何将这些功能用于嵌入式视觉的实例。

全书目录

用于深度学习和计算机视觉的 INT8

赛灵思 DSP Slice 片上的 INT8 运算

可扩展的 INT8 优化

DSP48E2 SIMD 模式

映射 INT8 优化到深度学习应用

创建 INT8 链接 MACC 的其他方法

映射 INT8 优化到计算机视觉功能

使用可扩展 INT8 优化的定制 2D 卷积

使用 SIMD 运算的中值滤波器

竞争分析

在竞争分析中使用英特尔的 Arria 10 器件与赛灵思的 Zynq UltraScale+ MPSoC 对比。在进行嵌入式视觉应用计算效率比较时，选择的器件有可比的 DSP 密度和器件功耗：

• Arria 10 SoC ：SX220、SX270 和 SX480

• Zynq UltraScale+ MPSoC ：ZU3、ZU7 和 ZU9 器件

重点比较能用于包括深度学习和计算机视觉在内的众多应用的通用 MACC 性能。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

嵌入式视觉

嵌入式视觉

+关注

关注
8

文章
117

浏览量
59190
算术运算

算术运算

+关注

关注
0

文章
6

浏览量
5711

用OpenCV和Vivado HLS加速基于Zynq SoC的嵌入式视觉应用开发

设计流程　　为了进一步帮助嵌入式视觉开发人员创建Smarter Vision系统，赛灵思在Vivado中增加了对OpenCV

发表于 04-21 15:49

Xilinx赛灵思FPGA技术及应用线上公开课

` 本帖最后由 MGJOY 于 2017-4-10 15:07 编辑本周三，4月12日，赛灵思FPGA技术及应用线上公开课。欢迎大家观看、学习交流~分享主题【赛

发表于 04-10 15:06

海量干货分享！XDF（赛灵思开发者大会）北京站各分论坛演讲资料公布

中的研究与应用 - 科大讯飞基因组数据的 FPGA 超级计算系统 - SmartVSCTurbo-提升您的洞察力 - Sumup边缘计算分论坛面向嵌入式深度剖析的机器学习 - Xilinx使用支持

发表于 01-03 15:19

基于赛灵思Spartan-3A的视频分析

视频分析对性能处理的要求可充分发挥赛灵思FPGA的并行架构、嵌入式和DSP处理能力所带来的优点。

发表于 05-16 10:26 •1240次阅读

基于<b class='flag-5'>赛</b><b class='flag-5'>灵</b><b class='flag-5'>思</b>Spartan-3A的视频分析

赛灵思收购嵌入式Linux方案提供商PetaLogix

All Programmable技术和器件的全球领先企业赛灵思公司(Xilinx, Inc. (NASDAQ:XLNX) )今天宣布收购嵌入式Linux解决方案提供商PetaLogix

发表于 08-30 16:59 •666次阅读

赛灵思收购嵌入式Linux方案提供商PetaLogix

赛灵思公司（Xilinx）宣布收购嵌入式Linux解决方案提供商PetaLogix。随着Linux解决方案成为越来越多依赖赛

发表于 09-05 09:14 •583次阅读

玩转Xilinx嵌入式视觉开发者专区让视觉系统开发更加简单

Programmable 的差异化嵌入式视觉应用。通过嵌入式视觉开发者专区，赛灵

发表于 11-10 14:49 •1015次阅读

赛灵思强化嵌入式视觉应用与工业物联网产品系列

与软件定义SDSoC开发环境公用版。这些新产品、开发环境及强化产业生态系的结合，使该公司客户得以在快速成长的嵌入式视觉应用与工业物联网市场中，创造具更高差异化与灵活性的应用。赛灵

发表于 02-08 17:37 •216次阅读

Xilinx INT8 优化开发嵌入式视觉

赛灵思 INT8 优化为使用深度学习推断和传统计算机视觉

发表于 09-22 17:27 •5552次阅读

嵌入式视觉的发展趋势及其算法示例

在这篇文章中，前赛灵思机器视觉市场战略总监Aaron Behman 针对嵌入式视觉方面的问题进行

发表于 11-15 17:27 •5587次阅读

DSP48E2 Slice 上优化 INT8 深度学习运算分析

学习每秒运算次数 (OPS) 上相比其它 FPGA，能实现 1.75 倍的峰值解决方案级性能。由于深度学习推断可以在不牺牲准确性的情况下使用较低位精度，因此需要高效的 INT8 实现方案。赛灵

发表于 11-16 14:23 •1.5w次阅读

赛灵思扩大生态系统，重塑嵌入式视觉、工业物联网系统设计的未来

的系统正在重塑嵌入式视觉和工业物联网 (IIoT) 的未来。赛灵思于今年 2 月在德国纽伦堡举办的嵌入式

发表于 02-14 03:09 •3584次阅读

Arm携手赛灵思助力嵌入式开发人员获取成熟的Arm IP

Arm和赛灵思（Xilinx）强强联合，将业界最强大、最成熟的嵌入式生态系统优势与赛灵思FPGA

发表于 10-11 10:05 •3223次阅读

赛灵思INT8优化为嵌入式视觉应用提供性能和计算方法

要使用可编程逻辑上的 DSP 实现中值滤波器，可以对算法做改动。每次比较运算可以分为减法运算及后续的符号位检查。对减法运算，DSP48E2 Slice 能够以四个 12 位或两个 24 位模式进行运算。要充分利用 DSP48E2 Slice，可以并行运算多个像素。

发表于 07-30 08:59 •3633次阅读

性能优良的赛思灵FPGA嵌入式处理器平台

赛灵思公司昨天宣布了由独立的第三方对运行Accelerated Technology公司（AT）的Nucleus实时操作系统（RTOS）的32位MicroBlaze处理器平台进行的测试结果,再次证明了

发表于 06-28 11:38 •2358次阅读

搜索历史

赛灵思INT8优化为嵌入式视觉应用性能和计算方法

评论

用OpenCV和Vivado HLS加速基于Zynq SoC的嵌入式视觉应用开发

Xilinx赛灵思FPGA技术及应用线上公开课

海量干货分享！XDF（赛灵思开发者大会）北京站各分论坛演讲资料公布

基于赛灵思Spartan-3A的视频分析

赛灵思收购嵌入式Linux方案提供商PetaLogix

赛灵思收购嵌入式Linux方案提供商PetaLogix

玩转Xilinx嵌入式视觉开发者专区让视觉系统开发更加简单

赛灵思强化嵌入式视觉应用与工业物联网产品系列

Xilinx INT8 优化开发嵌入式视觉

嵌入式视觉的发展趋势及其算法示例

DSP48E2 Slice 上优化 INT8 深度学习运算分析

赛灵思扩大生态系统，重塑嵌入式视觉、工业物联网系统设计的未来

Arm携手赛灵思助力嵌入式开发人员获取成熟的Arm IP

赛灵思INT8优化为嵌入式视觉应用提供性能和计算方法

性能优良的赛思灵FPGA嵌入式处理器平台