基于直方图算法进行FPGA架构设计-电子发烧友网

引言

直方图统计在图像增强和目标检测领域有重要应用，比如直方图均衡，梯度直方图。直方图的不同种类和统计方法请见之前的文章。本章就是用FPGA来进行直方图的计算，并且利用FPGA的特性对计算过程进行加速。安排如下：

首先基于直方图算法进行FPGA架构设计，这里主要考虑了如何加速以及FPGA资源的利用两个因素；最后基于system Verilog搭建一个验证系统。

FPGA设计架构

不论是图像灰度直方图还是梯度直方图，本质上是对数据的分布进行计数。从FPGA角度来看，只关心以下几点：

1）根据数据大小确定其分布区间，统计分布在不同区间的数据个数，区间的大小可以调节，比如灰度直方图区间为1，梯度直方图通常大于1；

2）如何利用FPGA对直方图统计进行加速，以及如何考虑到芯片有限资源；

首先来考虑加速方式，直方图统计过程用伪代码表示为：

For(int i=0;i Index = get_index(data[i]);
Hist[index]++;
}

Get_index函数是为了确定数据属于哪个区间，如果区间大小为1，那么index就是数据自身。如果区间是平均分布，那么就需要进行数据的大小比较。如果区间大小是2的幂次，那么index只需要数据进行移位得到。

FPGA在加速计算中最主要就是利用并行化和流水线，并行化就是将一个任务拆解成多个子任务，多个子任务并行完成。而流水线是在处理一个子任务的时候，下一个来的子任务也可以进行处理，处理模块不会等待。流水线本质上是对子任务也进行“分割”，分割的每一块可以在处理模块中同时进行。

统计N个数据，可以将N分成M份，在FPGA上同时进行M个统计，用伪代码表示为：

For(int k=0;k //并行化
For(int i=0;i Index = get_index(data[k][i]);
Hist[k][index]++;
}
}

如果区间不是2的幂次，就需要比较器，这样并行M次，就需要M个同等比较器，这对资源消耗很大。因此目前设计仅仅支持2的幂次的区间。整个设计架构如图1.2。

图2.1 流水线处理

图2.2 直方图统计架构

主要分为以下几个模块：

1）statis:这个是核心计算模块，统计数据分布。ram中存放直方图统计数据，地址对应着数据分布区间。这里有一个问题需要考虑，在对ram中直方图统计数据计数时，需要读出然后计数。如果ram读端口没有寄存器，那么读出来直接加1，再写入。但是这样并不好，因为ram不经过寄存器时序不好。所以增加了一级寄存器，这样就造成了写入的延时，那么有可能下一次数据来临也会读取同样地址的数据，此时读取到的直方图数据就是还没有写入的。为了解决这个问题，判断进入的前后两个数据是否相同，如果相同就不写入而继续计数，如果不同就写入。并行多个statis模块的代码为：

genvar i;
generate
for(i=0;i

statis #(
.PIX_BW(PIX_BW),
.HIST_BW(HIST_BW),
.ADDR_BW(HIST_LEN_BW),
.BIN_W(BIN_W)

)u_statis(
.clk(clk),
.rst(rst),
.clr(clr),

.enable(1'b1),
.pix_valid(pix_valid),
.pix(img_i[i*PIX_BW +: PIX_BW]),

.hist_rd(branch_hist_rd),
.hist_raddr(branch_hist_raddr),
.hist(branch_hist[i*HIST_BW +: HIST_BW])
);

end
endgenerate

2）serders：这个是并转串。M个statis模块会产生M组hist结果，这些结果还要进行求和，那么就要用到加法树，如果M较大，会造成加法树很大，多以这里加了serders可以调节加法树资源。

3） addTree：加法树。
module addTree #(
parameter DATA_BW = 32,//bit width of data
parameter TREE_DEPTH = 3,//depth of the add tree
parameter ADD_N = 4//add number
)
(
input clk,
input rst,
input [ADD_N*DATA_BW-1:0] adnd_x,
input [ADD_N*DATA_BW-1:0] adnd_y,
input adnd_valid,
output reg[DATA_BW-1:0] finl_sum,
output reg finl_sum_valid

);

reg [TREE_DEPTH-1:0]midl_valid;

genvar dept_i, leaf_i;
generate
for(dept_i=TREE_DEPTH-1;dept_i>=0;dept_i=dept_i-1)begin: ADD_DPET
localparam LEAF_N = 2**dept_i;

wire[DATA_BW-1:0] midl_sum[LEAF_N-1:0];

for(leaf_i=0;leaf_i

reg [DATA_BW-1:0] midl_add_x;
reg [DATA_BW-1:0] midl_add_y;

if(dept_i==TREE_DEPTH-1)begin
always @(posedge clk)begin
midl_add_x midl_add_y end
end
else begin
always @(posedge clk)begin
midl_add_x midl_add_y end
end

adder #(
.DATA_BW(DATA_BW)
)
u_adder(
.adnd_x(midl_add_x),
.adnd_y(midl_add_y),
.sum(midl_sum[leaf_i])

);

end

if(dept_i==TREE_DEPTH-1)
always @(posedge clk)begin
midl_valid[dept_i] end
else
always @(posedge clk)begin
midl_valid[dept_i] end

end

endgenerate

always @(posedge clk)begin
finl_sum end

always @(posedge clk)begin
if(rst)
finl_sum_valid else
finl_sum_valid end

endmodule

4） accum：累加器。如果加法树没有完成M个hist数据的求和，那么就需要通过累加器来完成。

图2.3 对ram的处理

验证结构

1） img_trans：这个是随机化图像数据定义，主要通过SV中constraint来对图像大小做一些约束；

class img_trans;

rand int img_w;
rand int img_h;
rand int img_blank;
rand logic[`PIX_BW-1:0] img[`MAX_IMG_W*`MAX_IMG_H];

constraint img_cfg_cnst{
img_w img_w > 0;
img_w % `PARALL == 0;
img_h img_h > 0;
img_blank img_blank >= 0;

}

extern function void write(input string f_name);

endclass

2） driver：产生image并且发送给DUT，同时通过mailbox发送给ref_model用于对比；
class img_obj;
logic [`PIX_BW-1:0] img_que[$];
endclass

class driver;

int img_w;
int img_h;
int img_blank;
logic [`PARALL*`PIX_BW-1:0] img;
logic [`PIX_BW-1:0] img_ele;
img_obj imgObj;
img_trans imgTrans;

extern task drive(mailbox img_mbx, virtual img_inf.test imgInf);

endclass

3） ref_model：自己统计直方图和DUT的结果进行比对；

class ref_modl;

logic [`PIX_BW-1:0] img;
int addr;
img_obj imgObj;
int hist[`HIST_LEN];

extern task calc(input logic clk, mailbox img_mbx);
extern task comp(virtual img_inf.test imgInf);
extern task run(input logic clk, mailbox img_mbx, virtual img_inf.test imgInf);
extern function void clear();

endclass

图3.1 验证架构图

最后添加一下modelsim 仿真波形文件和结果，纯粹为了增加篇幅。

图3.2 modelsim仿真波形和结果

编辑：hfy

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

FPGA

FPGA

+关注

关注
1630

文章
21796

浏览量
605663
直方图

直方图

+关注

关注
0

文章
21

浏览量
7910

基于FPGA实现图像直方图设计

简单，单采用FPGA来实现直方图的统计就稍显麻烦。若使用Xilinx和Altera的FPGA芯片，可以使用HLS来进行图像的加速处理。但这暂时不是我的重点。用C语言实现

发表于 12-24 10:24 •203次阅读

基于<b class='flag-5'>FPGA</b>实现图像<b class='flag-5'>直方图</b>设计

ISP算法及架构分析介绍

），从结果上看就是将RAW数据转换成压缩后的RGB（一般）数据，供后续CPU使用（识别、压缩等）。市面上很少有直接介绍ISP的书籍或者资料，今天我们主要是聊一聊ISP算法的架构，这样大家就能明白为什么很少有专用的书籍对这方面进行

发表于 11-26 10:05 •614次阅读

ADS7057EVM-PDK直方图测试数据异常怎么解决？

对ADS7057EVM-PDK进行直方图测试，发现直方图数据异常，具体表现为个别码值的采样点数异常增多，怀疑评估板出现问题。测试条件具体如下：使用TI公司的PSIEVM提供正弦输入信号，输入

发表于 11-22 13:16

深入理解 Llama 3 的架构设计

最新的自然语言处理（NLP）技术和深度学习算法，旨在提供更加自然、流畅和智能的对话体验。 1. 核心组件 Llama 3的架构设计可以分为以下几个核心组件： 1.1 预处理模块预处理模块负责将原始文本数据转换为模型可以理解的格式。这包括文本清洗

发表于 10-27 14:41 •619次阅读

边缘计算架构设计最佳实践

边缘计算架构设计最佳实践涉及多个方面，以下是一些关键要素和最佳实践建议：一、核心组件与架构设计边缘设备与网关边缘设备：包括各种嵌入式设备、传感器、智能手机、智能摄像头等，负责采集原始数据

发表于 10-24 14:17 •532次阅读

FPGA芯片架构和资源有深入的理解，精通Verilog HDL、VHDL

岗位职责 1.负责FPGA的架构设计、代码编写、仿真等； 2.协同软、硬件工程师完成系统联调和测试； 3.负责项目中FPGA设计的相关文档编写及维护；任职要求 1.硕士及以上学历，电子、通信

发表于 09-15 15:23

为什么FPGA属于硬件，还需要搞算法？

开始就掌握。单纯搞算法是不够的，还需要理解硬件的架构和资源，以便更有效地将算法映射到 FPGA 上，实现最优的性能和资源利用。总的来说，学习

发表于 09-09 16:54

FPGA设计经验之图像处理

处理窗口对资源影响成倍增加基于FPGA设计框架举例： 1、灰度直方图统计 直方图是图像的灰度分布统计的一种表示方法，统计目标图像中各个灰度点的像素个数，很多对于图像的调整算法

发表于 06-12 16:26

FPGA设计中，对SPI进行参数化结构设计

今天给大侠带来FPGA设计中，对SPI进行参数化结构设计，话不多说，上货。为了避免每次SPI驱动重写，直接参数化，尽量一劳永逸。SPI master有啥用呢，你发现各种外围芯片的配置一般

发表于 05-07 16:09

FPGA设计中，对SPI进行参数化结构设计

今天给大侠带来FPGA设计中，对SPI进行参数化结构设计，话不多说，上货。为了避免每次SPI驱动重写，直接参数化，尽量一劳永逸。SPI master有啥用呢，你发现各种外围芯片的配置一般

发表于 04-11 18:29

fpga封装技术和arm架构的优缺点

FPGA封装技术和ARM架构是两个不同的概念，分别属于硬件设计的不同领域。

发表于 03-26 15:51 •963次阅读

交换芯片架构设计

交换芯片的架构设计是网络设备性能和功能的关键。一个高效的交换芯片架构能够处理大量的数据流量，支持高速数据传输，并提供先进的网络功能。

发表于 03-21 16:28 •602次阅读

交换芯片架构设计

交换芯片架构设计是网络通信中的关键环节，它决定了交换机的性能、功能和扩展性。

发表于 03-18 14:12 •805次阅读

fpga芯片架构介绍

FPGA（现场可编程门阵列）芯片架构是一种高度灵活和可编程的集成电路架构，它以其独特的结构和功能，在现代电子系统中扮演着至关重要的角色。FPGA芯片

发表于 03-15 14:56 •828次阅读

fpga是什么架构

FPGA（现场可编程门阵列）的架构主要由可配置逻辑模块（CLB）、输入/输出模块（IOB）以及可编程互连资源组成。

发表于 03-14 17:05 •974次阅读

搜索历史

基于直方图算法进行FPGA架构设计

评论

基于FPGA实现图像直方图设计

ISP算法及架构分析介绍

ADS7057EVM-PDK直方图测试数据异常怎么解决？

深入理解 Llama 3 的架构设计

边缘计算架构设计最佳实践

FPGA芯片架构和资源有深入的理解，精通Verilog HDL、VHDL

为什么FPGA属于硬件，还需要搞算法？

FPGA设计经验之图像处理

FPGA设计中，对SPI进行参数化结构设计

FPGA设计中，对SPI进行参数化结构设计

fpga封装技术和arm架构的优缺点

交换芯片架构设计

交换芯片架构设计

fpga芯片架构介绍

fpga是什么架构