Xilinx Zynq系列FPGA实现神经网络中相关资源评估-电子发烧友网

Xilinx zynq系列FPGA实现神经网络评估

本篇目录

1. 内存占用

1.1FPGA程序中内存的实现方式

1.2Zynq的BRAM内存大小

1.3一个卷积操作占用的内存

2. PipeCNN可实现性

PipeCNN论文解析：用OpenCL实现FPGA上的大型卷积网络加速

2.1已实现的PipeCNN资源消耗

3. 实现大型神经网络的方法

4. Virtex-7高端FPGA概览、7系列FPGA相关文档

正文

0Zynq7000系列概览

1内存占用

1.1 FPGA程序中内存的实现方式

参阅xilinx文档UG998

FPGA并没有像软件那样用已有的cache，FPGA的HLS编译器会在FPGA中创建一个快速的memory architecture以最好的适应算法中的数据样式（data layout）。因此FPGA可以有相互独立的不同大小的内部存储空间，例如寄存器，移位寄存器，FIFOs和BRAMs。

寄存器：最快的内存结构，集成在在运算单元之中，获取不需要额外的时延。

移位寄存器：可以被当作一个数据序列，每一个数据可以在不同的运算之中被重复使用。将其中所有数据移动到相邻的存储设备中只需要一个时钟周期。

FIFO：只有一个输入和输出的数据序列，通常被用于循环或循环函数，细节会被HLS编译器处理。

BRAM：集成在FPGA fabric模块中的RAM，每个xilinx的FPGA中集成有多个这样的BRAM。可以被当作有以下特性的cache：1.不支持像处理器cache中那样的缓存一致性（cache coherency,collision）,不支持处理器中的一些逻辑类型。2.只在设备有电时保持内存。3.不同的BRAM块可以同时传输数据。

1.2Zynq的BRAM内存大小

zynq 7z020的BRAM为4.9Mb，7z035的BRAM为17.6Mb（2.2MB）

1.3一个卷积操作占用的内存

例如，我们实现的卷积函数，输入27×600，卷积核16×27，输出16×600，数据类型为float。

//convolution operationfor (i = 0; i < 16; i++) { for (j = 0; j < 600; j++) { result = 0; for (k = 0; k < 27; k++) { temp = weights[i*27+k] * buf_in[k*600+j]; result += temp; } buf_out[i*600+j] = result; } }

在HLS中生成的IPcore占用硬件资源为：

在vivado中搭建好系统，占用的资源为：

2PipeCNN可实现性

PipeCNN是一个基于OpenCL的FPGA实现大型卷积网络的加速器。

PipeCNN解析文档：

PipeCNN论文解析：用OpenCL实现FPGA上的大型卷积网络加速

github地址：https://github.com/doonny/PipeCNN#how-to-use

2.1 已实现的PipeCNN资源消耗

对于Altera FPGA，运用Intel's OpenCL SDKv16.1 toolset.

对于Xilinx FPGAs, theSDAcceldevelopment environment v2017.2 can be used.

Xilinx'sKCU1500(XCKU115 FPGA)（已经有xilin的板子实现过pipeCNN，但是型号比zynq高很多）

硬件资源可以被三个宏调控，device/hw_param.cl. Change the following macros

VEC_SIZE

LANE_NUM

CONV_GP_SIZE_X

消耗资源为：

3实现大型神经网络的方法

方案一：压缩模型到<2.2MB，可实现在BRAM中

优点：1.速度快 2.实现方便

缺点：1.模型压缩难度 2.难以实现大型网络

方案二：用FPGA调用DDR

优点：1.速度中等 2.可实现大型网络

缺点：调用DDR有难度，开发周期长

方案三：用片上单片机调用DDR（插入SD卡）分包传入IPcore运算

优点：可实现大型网络

缺点：速度较慢

4Virtex-7高端FPGA概览

Virtex-7为高端FPGA，比Zynq高了一个档次。

7系列FPGA相关文档：

责任编辑：lq

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

FPGA

FPGA

+关注

关注
1630

文章
21759

浏览量
604325
神经网络

神经网络

+关注

关注
42

文章
4774

浏览量
100899
Xilinx

Xilinx

+关注

关注
71

文章
2168

浏览量
121692

原文标题：Xilinx Zynq系列FPGA实现神经网络中相关资源评估

文章出处：【微信号：HXSLH1010101010，微信公众号：FPGA技术江湖】欢迎添加关注！文章转载请注明出处。

Xilinx ZYNQ 7000系列SoC的功能特性

本文介绍下Xilinx ZYNQ 7000系列SoC的功能特性、资源特性、封装兼容性以及如何订购器件。

发表于 10-24 15:04 •1004次阅读

<b class='flag-5'>Xilinx</b> <b class='flag-5'>ZYNQ</b> 7000<b class='flag-5'>系列</b>SoC的功能特性

FPGA在深度神经网络中的应用

、低功耗等特点，逐渐成为深度神经网络在边缘计算和设备端推理的重要硬件平台。本文将详细探讨FPGA在深度神经网络中的应用，包括其优势、设计流程、关键技术以及实际应用案例。

发表于 07-24 10:42 •728次阅读

分享几个用FPGA实现的小型神经网络

今天我们分享几个用FPGA实现的小型神经网络，侧重应用。

发表于 07-24 09:30 •1230次阅读

分享几个用<b class='flag-5'>FPGA</b><b class='flag-5'>实现</b>的小型<b class='flag-5'>神经网络</b>

神经网络专用硬件实现的方法和技术

神经网络专用硬件实现是人工智能领域的一个重要研究方向，旨在通过设计专门的硬件来加速神经网络的训练和推理过程，提高计算效率和能效比。以下将详细介绍神经网络专用硬件

发表于 07-15 10:47 •1227次阅读

递归神经网络的实现方法

（Recurrent Neural Network，通常也简称为RNN，但在此处为区分，我们将循环神经网络称为Recurrent RNN）不同，递归神经网络更侧重于处理树状或图结构的数据，如句法分析树、自然语言的语法结构等。以下将从递归

发表于 07-10 17:02 •349次阅读

如何在FPGA上实现神经网络

可编程门阵列（FPGA）作为一种灵活、高效的硬件实现方式，为神经网络的加速提供了新的思路。本文将从FPGA实现

发表于 07-10 17:01 •2112次阅读

rnn是递归神经网络还是循环神经网络

RNN（Recurrent Neural Network）是循环神经网络，而非递归神经网络。循环神经网络是一种具有时间序列特性的神经网络，能够处理序列数据，具有记忆功能。以下是关于循环

发表于 07-05 09:52 •595次阅读

递归神经网络是循环神经网络吗

递归神经网络（Recurrent Neural Network，简称RNN）和循环神经网络（Recurrent Neural Network，简称RNN）实际上是同一个概念，只是不同的翻译方式

发表于 07-04 14:54 •809次阅读

深度神经网络与基本神经网络的区别

在探讨深度神经网络（Deep Neural Networks, DNNs）与基本神经网络（通常指传统神经网络或前向神经网络）的区别时，我们需要从多个维度进行深入分析。这些维度包括

发表于 07-04 13:20 •977次阅读

反向传播神经网络和bp神经网络的区别

反向传播神经网络（Backpropagation Neural Network，简称BP神经网络）是一种多层前馈神经网络，它通过反向传播算法来调整网络

发表于 07-03 11:00 •830次阅读

卷积神经网络的实现原理

卷积神经网络（Convolutional Neural Networks，简称CNN）是一种深度学习模型，广泛应用于图像识别、视频分析、自然语言处理等领域。本文将详细介绍卷积神经网络的实现原理、结构

发表于 07-03 10:49 •568次阅读

卷积神经网络的原理与实现

1.卷积神经网络（Convolutional Neural Networks，简称CNN）是一种深度学习模型，广泛应用于图像识别、视频分析、自然语言处理等领域。卷积神经网络是一种前馈神经网络，其

发表于 07-02 16:47 •615次阅读

神经网络在数学建模中的应用

数学建模是一种利用数学方法和工具来描述和分析现实世界问题的过程。神经网络是一种模拟人脑神经元结构和功能的计算模型，可以用于解决各种复杂问题。在数学建模中，神经网络可以作为一种有效的工具

发表于 07-02 11:29 •982次阅读

神经网络中的激活函数有哪些

在神经网络中，激活函数是一个至关重要的组成部分，它决定了神经元对于输入信号的反应方式，为神经网络引入了非线性因素，使得网络能够学习和处理复杂

发表于 07-01 11:52 •612次阅读

如何用FPGA加速神经网络

到底纯FPGA适不适合这种大型神经网络的设计？这个问题其实我们不适合回答，但是FPGA厂商是的实际操作是很有权威性的，现在不论是Intel还是Xilinx都没有在自己传统的

发表于 01-24 09:51 •971次阅读

搜索历史

Xilinx Zynq系列FPGA实现神经网络中相关资源评估

评论

Xilinx ZYNQ 7000系列SoC的功能特性

FPGA在深度神经网络中的应用

分享几个用FPGA实现的小型神经网络

神经网络专用硬件实现的方法和技术

递归神经网络的实现方法

如何在FPGA上实现神经网络

rnn是递归神经网络还是循环神经网络

递归神经网络是循环神经网络吗

深度神经网络与基本神经网络的区别

反向传播神经网络和bp神经网络的区别

卷积神经网络的实现原理

卷积神经网络的原理与实现

神经网络在数学建模中的应用

神经网络中的激活函数有哪些

如何用FPGA加速神经网络