基于INTEL FPGA硬浮点DSP实现卷积运算详解-电子发烧友网

概述

卷积是一种线性运算,其本质是滑动平均思想,广泛应用于图像滤波。而随着人工智能及深度学习的发展，卷积也在神经网络中发挥重要的作用，如卷积神经网络。本参考设计主要介绍如何基于INTEL 硬浮点的DSP Block实现32位单精度浮点的卷积运算，而针对定点及低精度的浮点运算，则需要对硬浮点DSP Block进行相应的替换即可。

原理分析

设:f(x), g(x)是两个可积函数，作积分：

基于INTEL FPGA硬浮点DSP实现卷积运算详解

随着x的不同取值，该积分定义了一个新的函数h(x)，称为函数f(x)与g(x)的卷积，记为h(x)=f(x)*g(x)。

如果卷积的变量是序列x(n)和h(n)，则卷积的结果为

基于INTEL FPGA硬浮点DSP实现卷积运算详解

其中*表示卷积。因此两个序列的卷积，实际上就是多项式的乘法，用个例子说明其工作原理。a = [7,5,4]; b = [6,7,9];则实现a和b的卷积，就是把a和b作为一个多项式的系数，按多项式的升幂或降幂排列，即为：

基于INTEL FPGA硬浮点DSP实现卷积运算详解

因此得到a*b=[42,79,122,73,36]；与Matlab运算结果一致。而二维卷积可以采用通用多项式乘积方法实现卷积运算。

基于INTEL FPGA的实现分析

如上我们确定了两个序列的卷积等同于两个多项式的乘法，因此当我们需要计算序列[a0,a1,a2, …,an-1]与[b0,b1,b2, …,bn-1]的卷积结果时，可以成立a,b两个n阶多项式，如下所示：

基于INTEL FPGA硬浮点DSP实现卷积运算详解

则[a0,a1,a2, …,an-1]与[b0,b1,b2, …,bn-1]的卷积结果即为由a*b得到的多项式的各项系数所组成的序列。令c=a*b，得到

基于INTEL FPGA硬浮点DSP实现卷积运算详解

则由多项式c的各阶系数所组成的新的序列[c0,c1,c2, …,c2n-1]即为[a0,a1,a2, …,an-1]与[b0,b1,b2, …,bn-1]的卷积结果。则按照高阶多项式计算展开可得到：

基于INTEL FPGA硬浮点DSP实现卷积运算详解

┆┆

基于INTEL FPGA硬浮点DSP实现卷积运算详解

┆┆

基于INTEL FPGA硬浮点DSP实现卷积运算详解

因此卷积的运算可以转化为行向量与列向量相乘的结果，即乘累加的运算结构。

Intel FPGA在Arria10DSP Block中首次支持了单精度硬浮点DSP block,是行业内第一个支持单精度DSP block，硬浮点DSP block架构如图1所示：

基于INTEL FPGA硬浮点DSP实现卷积运算详解

图1 硬浮点DSPblock架构

硬浮点DSP Block包含硬浮点乘法器，硬浮点加法器，支持乘累加运算，因此采用硬浮点DSPblock实现行列向量相乘是非常好的方式。下面我们针对一个实际的卷积运算，介绍如何基于INTEL硬浮点DSP block实现。假设我们需要求随机数组a=[4,8,9,11]与b=[10,5,7,13]的卷积运算结果，则根据上面的分析，保持数组a顺序不变，而数组b需根据上述分析结果，针对每一个卷积结果产生新的序列。所以整个实现包括数列重组模块和硬浮点乘法器模块及输出处理。下面是实现框图及仿真结果。

图2 实现框图

图3 Modelsim仿真结果

仿真结果与Matlab实现结果一致，并且该设计中充分考虑了FPGA并行扩展特性，对于低速率要求的设计可采用DSP Block复用的方式节约DSP block数量。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

dsp

dsp

+关注

关注
554

文章
8065

浏览量
351430
FPGA

FPGA

+关注

关注
1634

文章
21821

浏览量
607482
intel

intel

+关注

关注
19

文章
3486

浏览量
186704

原文标题：基于INTEL FPGA硬浮点DSP实现卷积运算

文章出处：【微信号：ALIFPGA，微信公众号：FPGA极客空间】欢迎添加关注！文章转载请注明出处。

FPGA图像处理基础----实现缓存卷积窗口

像素行与像素窗口一幅图像是由一个个像素点构成的，对于一幅480*272大小的图片来说，其宽度是480，高度是272。在使用FPGA进行图像处理时，最关键的就是使用FPGA内部的存储资源对像

发表于 02-07 10:43 •226次阅读

<b class='flag-5'>FPGA</b>图像处理基础----<b class='flag-5'>实现</b>缓存<b class='flag-5'>卷积</b>窗口

FPGA中的浮点四则运算是什么

由于定点的四则运算比较简单，如加减法只要注意符号扩展，小数点对齐等问题即可。在本文中，运用在前一节中描述的自定义浮点格式FPGA中数的表示方法（下），完成浮点四则

发表于 11-16 12:51 •469次阅读

<b class='flag-5'>FPGA</b>中的<b class='flag-5'>浮点</b>四则<b class='flag-5'>运算</b>是什么

FPGA中浮点四则运算的实现过程

发表于 11-16 11:19 •745次阅读

<b class='flag-5'>FPGA</b>中<b class='flag-5'>浮点</b>四则<b class='flag-5'>运算</b>的<b class='flag-5'>实现</b>过程

FPGA加速深度学习模型的案例

FPGA（现场可编程门阵列）加速深度学习模型是当前硬件加速领域的一个热门研究方向。以下是一些FPGA加速深度学习模型的案例：一、基于FPGA的AlexNet卷积

发表于 10-25 09:22 •508次阅读

如何在Tensorflow中实现反卷积

在TensorFlow中实现反卷积（也称为转置卷积或分数步长卷积）是一个涉及多个概念和步骤的过程。反卷积在深度学习领域，特别是在图像分割、图

发表于 07-14 10:46 •771次阅读

图像处理中的卷积运算

卷积运算是图像处理中一种极其重要的操作，广泛应用于图像滤波、边缘检测、特征提取等多个方面。它基于一个核（或称为卷积核、滤波器）与图像进行相乘并求和的过程，通过这一操作可以实现对图像的平

发表于 07-11 15:15 •2835次阅读

FPGA实现LeNet-5卷积神经网络

LeNet-5 是一个经典的卷积神经网络（CNN），由 Yann LeCun 在 1990 年代设计，主要用于手写数字识别任务（如 MNIST 数据集）。随着现场可编程门阵列（FPGA）技术的发展

发表于 07-11 10:27 •2530次阅读

卷积神经网络的实现原理

卷积神经网络（Convolutional Neural Networks，简称CNN）是一种深度学习模型，广泛应用于图像识别、视频分析、自然语言处理等领域。本文将详细介绍卷积神经网络的实现原理、结构

发表于 07-03 10:49 •741次阅读

卷积神经网络的基本原理、结构及训练过程

、训练过程以及应用场景。一、卷积神经网络的基本原理卷积运算卷积运算是卷积神经网络的核心，它

发表于 07-02 14:21 •3257次阅读

FPGA设计经验之图像处理

FPGA所能进行的实时流水线运算和DSP，GPU等进行的图像处理运算有何不同。DSP，GPU，CPU对图像的处理基本是以帧为单位的，从相机采

发表于 06-12 16:26

优秀的Verilog/FPGA开源项目-浮点运算器（FPU）介绍

浮点运算器（英文：floating point unit，简称FPU）是计算机系统的一部分，它是专门用来进行浮点数运算的（CPU中也叫ALU）。

发表于 04-26 11:27 •4157次阅读

优秀的Verilog/<b class='flag-5'>FPGA</b>开源项目-<b class='flag-5'>浮点</b><b class='flag-5'>运算</b>器（FPU）介绍

verilog实现卷积运算

在Verilog中实现卷积运算，你可以使用以下示例代码。这里假设输入数据是有符号8位数，输出数据也是有符号8位数。卷积在数字信号处理中通常指的是两个序列的逐元素乘积的和，也就是点乘。

发表于 03-26 07:51

verilog语音实现浮点运算

Verilog可以通过使用IEEE标准的浮点数表示来实现浮点运算。下面是一个基本的Verilog模块示例，展示了如何进行加法、乘法和除法等常见的浮点

发表于 03-25 21:49

Intel fpga芯片系列有哪些

Intel FPGA芯片系列主要包括以下几种。

发表于 03-14 16:28 •1227次阅读

STSPIN32F0支持硬件浮点运算吗？

STSPIN32F0 支不支持硬件浮点运算

发表于 03-13 06:32

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

基于INTEL FPGA硬浮点DSP实现卷积运算详解

评论

FPGA图像处理基础----实现缓存卷积窗口

FPGA中的浮点四则运算是什么

FPGA中浮点四则运算的实现过程

FPGA加速深度学习模型的案例

如何在Tensorflow中实现反卷积

图像处理中的卷积运算

FPGA实现LeNet-5卷积神经网络

卷积神经网络的实现原理

卷积神经网络的基本原理、结构及训练过程

FPGA设计经验之图像处理

优秀的Verilog/FPGA开源项目-浮点运算器（FPU）介绍

verilog实现卷积运算

verilog语音实现浮点运算

Intel fpga芯片系列有哪些

STSPIN32F0支持硬件浮点运算吗？