基于FPGA设计的sysGen算法系统设计-电子发烧友网

一、前言

利用FPGA设计算法一直以来都是热点，同样也是难点。将复杂的数学公式模型通过硬件系统来搭建，在低延时高并行性等优势背后极大提高了设计难度和开发周期。Xilinx公司的sysGen（system generator）工具扩展了MATLAB的simulink，提供很多IP Catalog中没有的基础模块和针对DSP应用的硬件模型。工程师利用丰富的模块和MATLAB强大的数据处理及可视化能力能够更快速完成设计与仿真验证工作。

二、sysGen算法系统设计

本文以个最简单的例子讲述利用sysGen搭建算法IP核，并集成到IP Integrator中作为ZYNQ PS端CPU的“定制外设”。仅用于测试目的。设计需求：在sysGen中搭建系统，将输入定点整数数据*2后输出，输入位宽为8bit。

在System Generator token中设定仿真步长为1sec。点击需要观测的信号连线，右击选择Xilinx add to viewer。启动仿真并启动Xilinx waveform viewer：

本质上就是调用Vivado的XSim工具进行行为仿真。仿真结果可见完成预期目标，现双击System Generator token ，选择Compiliation类型为IP Catalog并勾选Create testbench，按下Generate生成IP核。

三、仿真测试

根据User Guide介绍sysGen是“周期和比特精准的”，我们还是在Vivado环境下再次验证下。netlist文件夹内子文件夹ip_catalog中为IP核示例工程，由于自动生成了testbench，打开后直接进行行为仿真。sysGen在创建testbench时会将经过gatein和gateout的数据储存到文件中，testbench进行的工作为：将gatein数据作为测试激励送入到相应设计输入端口，之后把设计输出得到结果与gateout文件数据进行逐一比较从而验证设计是否与sysGen环境下仿真结果一致。

发现个比较有意思的现象，自动生成的testbench中clock生成并约束的50MHz，而是认为进行了拓展。

仿真波形如图：

将clock处改动为50MHz后，经过测试发现如果系统一开始就输入数据，前几个数据没有被真正处理，输出错误。可能是软件BUG吧，不过这种情况也非常少见，实际系统中输入数据大多情况会启动一段时间后才输入。这里等待100ns后再启动clock翻转：

改动后仿真波形：

四、AXI-Stream总线形式IP

到此算法IP的设计与验证结束。如果想将这个IP核导入到IP Integrator中作为CPU的外设，其接口必须满足AXI总线标准，因此回到sysGen中更改端口名称和位宽。端口要符合AXI-Stream标准信号名称，位宽为8bit整数倍。

生成IP核后，打开新的工程，导入该IP核到repository。

五、Block Design系统搭建

系统结构与上一篇该系列博文类似，均是以AXI DMA为核心的Loop系统，只是将AXI-Stream Data FIFO改成了自定义IP核。由于IP核slave和master接口只包含tdata和tvalid信号，因此需要添加接口衔接的一些简单逻辑。tready信号和tkeep信号直接连接constant使用常数驱动，DMA的s_axis_s2mm接口的tlast由wrapper内计数器逻辑驱动，将system中FCLK_CLK0 peripheral_aresetn m_axis_tvalid和s_axis_s2mm_tlast信号引出到wrapper中。

有一点比较坑：自定义IP通过AXI总线与DMA互联时，总线下相应的接口不一定会正确对应，所以需要分别将两端的每个接口相连。可以通过打开综合后的设计来确认连线无误。

自动生成wrapper后改动添加代码如下：
`timescale 1 ps / 1 ps

module user_wrapper
(DC,
DDR_addr,
DDR_ba,
DDR_cas_n,
DDR_ck_n,
DDR_ck_p,
DDR_cke,
DDR_cs_n,
DDR_dm,
DDR_dq,
DDR_dqs_n,
DDR_dqs_p,
DDR_odt,
DDR_ras_n,
DDR_reset_n,
DDR_we_n,
//FCLK_CLK0,
FIXED_IO_ddr_vrn,
FIXED_IO_ddr_vrp,
FIXED_IO_mio,
FIXED_IO_ps_clk,
FIXED_IO_ps_porb,
FIXED_IO_ps_srstb,
RES,
SCLK,
SDIN,
VBAT,
VDD
//m_axis_tvalid,
//peripheral_aresetn,
//s_axis_s2mm_tlast
);
output DC;
inout [14:0]DDR_addr;
inout [2:0]DDR_ba;
inout DDR_cas_n;
inout DDR_ck_n;
inout DDR_ck_p;
inout DDR_cke;
inout DDR_cs_n;
inout [3:0]DDR_dm;
inout [31:0]DDR_dq;
inout [3:0]DDR_dqs_n;
inout [3:0]DDR_dqs_p;
inout DDR_odt;
inout DDR_ras_n;
inout DDR_reset_n;
inout DDR_we_n;
//output FCLK_CLK0;
inout FIXED_IO_ddr_vrn;
inout FIXED_IO_ddr_vrp;
inout [53:0]FIXED_IO_mio;
inout FIXED_IO_ps_clk;
inout FIXED_IO_ps_porb;
inout FIXED_IO_ps_srstb;
output RES;
output SCLK;
output SDIN;
output VBAT;
output VDD;
//output [0:0]m_axis_tvalid;
//output [0:0]peripheral_aresetn;
//input s_axis_s2mm_tlast;

localparam DATA_NUM = 256;

wire DC;
wire [14:0]DDR_addr;
wire [2:0]DDR_ba;
wire DDR_cas_n;
wire DDR_ck_n;
wire DDR_ck_p;
wire DDR_cke;
wire DDR_cs_n;
wire [3:0]DDR_dm;
wire [31:0]DDR_dq;
wire [3:0]DDR_dqs_n;
wire [3:0]DDR_dqs_p;
wire DDR_odt;
wire DDR_ras_n;
wire DDR_reset_n;
wire DDR_we_n;
wire FCLK_CLK0;
wire FIXED_IO_ddr_vrn;
wire FIXED_IO_ddr_vrp;
wire [53:0]FIXED_IO_mio;
wire FIXED_IO_ps_clk;
wire FIXED_IO_ps_porb;
wire FIXED_IO_ps_srstb;
wire RES;
wire SCLK;
wire SDIN;
wire VBAT;
wire VDD;
wire [0:0]m_axis_tvalid;
wire [0:0]peripheral_aresetn;
wire s_axis_s2mm_tlast;

reg [8-1:0] cnt;
wire add_cnt;
wire end_cnt;

system system_i
(.DC(DC),
.DDR_addr(DDR_addr),
.DDR_ba(DDR_ba),
.DDR_cas_n(DDR_cas_n),
.DDR_ck_n(DDR_ck_n),
.DDR_ck_p(DDR_ck_p),
.DDR_cke(DDR_cke),
.DDR_cs_n(DDR_cs_n),
.DDR_dm(DDR_dm),
.DDR_dq(DDR_dq),
.DDR_dqs_n(DDR_dqs_n),
.DDR_dqs_p(DDR_dqs_p),
.DDR_odt(DDR_odt),
.DDR_ras_n(DDR_ras_n),
.DDR_reset_n(DDR_reset_n),
.DDR_we_n(DDR_we_n),
.FCLK_CLK0(FCLK_CLK0),
.FIXED_IO_ddr_vrn(FIXED_IO_ddr_vrn),
.FIXED_IO_ddr_vrp(FIXED_IO_ddr_vrp),
.FIXED_IO_mio(FIXED_IO_mio),
.FIXED_IO_ps_clk(FIXED_IO_ps_clk),
.FIXED_IO_ps_porb(FIXED_IO_ps_porb),
.FIXED_IO_ps_srstb(FIXED_IO_ps_srstb),
.RES(RES),
.SCLK(SCLK),
.SDIN(SDIN),
.VBAT(VBAT),
.VDD(VDD),
.m_axis_tvalid(m_axis_tvalid),
.peripheral_aresetn(peripheral_aresetn),
.s_axis_s2mm_tlast(s_axis_s2mm_tlast));

always @(posedge FCLK_CLK0)begin
if(!peripheral_aresetn)begin
cnt end
else if(add_cnt)begin
if(end_cnt)
cnt else
cnt end
end

assign add_cnt = m_axis_tvalid;
assign end_cnt = add_cnt && cnt== DATA_NUM-1;

assign s_axis_s2mm_tlast = end_cnt;

endmodule

user_wrapper

当自定义IP核输出256个数据时，拉高tlast信号结束传输。打开综合后的设计，添加调试探针，抓取DMA与自定义IP之间的接口信号，set up debug后完成接下来的流程。

六、软硬件联调

在硬件系统中定义数据帧长度为256个，数据位宽为16bit，因此C代码中DMA启动传输函数中数据长度参数为512byte。测试数据生成与检测代码非常简单：

我们直接查看ILA抓取AXI S总线波形：

看到CPU产生数据从1到4重复递增，IP核输出结果从2到8重复递增，输出为输入的2倍。

传输完成后进入DMA发送和接收中断，软件检测结果正确。在Memory窗口能够直接查看内存绝对地址里的数据，选定DDR接收缓存区起始地址，其中的数据与AXI总线传回数据一致，证明系统联调成功。之后任意算法模块均可采用本文方式进行设计和集成，可以说一劳永逸！

编辑：hfy

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

进群免费领FPGA学习资料！数字信号处理、傅里叶变换与FPGA开发等

~ 01、数字信号处理的FPGA实现旨在讲解前端数字信号处理算法的高效实现。首先概述了当前的FPGA技术、器件以及用于设计最先进DSP系统的工具。阐述了计算机

发表于 04-07 16:41

FPGA应用于人工智能的趋势

高速和低功耗： FPGA通过优化硬件结构和算法实现，能够在处理复杂的人工智能任务时保持高速和低功耗，这对于资源有限的嵌入式系统和移动设备尤为重要。灵活性： FPGA的可编程性使

发表于 10-25 09:20 •1575次阅读

FPGA在图像处理领域的优势有哪些？

FPGA具有可重配置性，可以在运行时根据需要对硬件进行重新配置。这使得FPGA在处理不同图像任务时，可以灵活地调整硬件资源，以适应不同的算法和场景需求。这种可重配置性提高了系统的可扩

发表于 10-09 14:36

为什么FPGA属于硬件，还需要搞算法？

交流学习，共同进步。交流问题（一） Q：为什么FPGA属于硬件，还需要搞算法？刚入门准备学fpga但一开始学的是语法，感觉像是电路用软件语言描述出来，fpga不

发表于 09-09 16:54

FPGA-5G通信算法的基本套路

？一个完整的通信系统，是十分庞大的，没有几百上千人，在短时间内是做不好的。本文仅仅针对5G NR中的基带算法部分，做一个简单梳理。对于5G通信系统，站在基站侧的角度，那么下行方向的整个处理

发表于 08-15 17:34

基于 FPGA 的会议系统设计

比较好的鲁棒性。Adaboost 是一种迭代算法，其核心思想是针对同一个训练集训练不同的弱分类器，然后把这些弱分类器集合起来，构成一个更强的最终分类器。Adaboost 算法系统具有较高的检测

发表于 08-01 18:40

FPGA在自动驾驶领域有哪些应用？

通过实现控制算法来增加系统的安全性和稳定性。例如，FPGA可以用于实现车辆的防碰撞系统，通过实时监测并处理传感器数据，预测并避免潜在的碰撞风险。四、具体实例以国内某个自动豪华车型为例

发表于 07-29 17:09

FPGA在人工智能中的应用有哪些？

，FPGA可以快速调整其硬件结构以适应新的算法，而无需更换整个硬件系统。二、云计算加速FPGA也被广泛应用于云计算领域，用于加速各种网络功能，如数据包的控制、分类和改写等。这样可以提

发表于 07-29 17:05

基于FPGA的指纹识别系统设计

随着人们对安全问题的日益重视，指纹识别作为一种高效、可靠的生物识别技术，在多个领域得到了广泛应用。本文设计并实现了一种基于FPGA的嵌入式指纹识别系统，该系统利用FPGA的高集成度、低

发表于 07-17 16:33 •1741次阅读

基于FPGA的CCD工业相机系统设计

基于FPGA的CCD工业相机系统设计是一个综合性的项目，它结合了硬件电路设计、FPGA编程以及图像处理技术。以下是一个详细的系统设计方案，包括设计概述、硬件架构、

发表于 07-17 11:24 •1786次阅读

基于FPGA的图像采集与显示系统设计

源和固有的并行处理能力，在数字信号处理、硬件加速、汽车电子等领域得到了广泛应用。在图像采集与显示系统中，FPGA能够实现高速、并行的数据处理，显著提高系统的实时性和性能。本文设计了一个基于FP

发表于 07-17 10:58 •2454次阅读

FPGA能实现什么样的算法？

FPGA功能如此强大，请问用FPGA能实现或者比较适合实现什么样的算法？

发表于 05-26 20:18

基于FPGA的实时边缘检测系统设计，Sobel图像边缘检测，FPGA图像处理

摘要：本文设计了一种基于 FPGA 的实时边缘检测系统，使用OV5640 摄像头模块获取实时的视频图像数据，提取图像边缘信息并通过 VGA显示。FPGA 内部使用流水线设计和并行运算加速

发表于 05-24 07:45

算法系列：彩色转灰度

今天和大侠简单聊一聊彩色转灰度的算法，话不多说，上货。一、基础　对于彩色转灰度，有一个很著名的心理学公式： Gray = R*0.299 + G*0.587 + B*0.114 二

发表于 05-22 19:02

基于FPGA的常见的图像算法模块总结

意在给大家补充一下基于FPGA的图像算法基础，于是讲解了一下常见的图像算法模块，经过个人的总结，将知识点分布如下所示。

发表于 04-28 11:45 •788次阅读

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

基于FPGA设计的sysGen算法系统设计

评论