FFT(快速傅里叶变换)作为数字信号处理的核心算法具有重要的研究价值,可应用于傅里叶变换所能涉及的任何领域,如图像处理、音频编码、频谱分析、雷达信号脉冲压缩等数字信号处理领域。FFT的鲜明特征之一是计算离散傅里叶变换(DFT)的高效算法,把计算N点DFT的乘法运算量从N2次降低到N/2*log2N次。而采用FPGA实现FFT的缘由在于:FPGA具有并行处理、流水线处理、易编程、片上资源丰富等方面特点,用于实现高速、大点数的FFT优势明显。 本设计使用的软件编程环境是Xilinx公司的Vivado 2018.3,笔者将从FFT IP核的创建,模块文件的编写,波形仿真等方面来具体讲解FFT在Xilinx FPGA上的实现。
1.FFT IP核的创建
(1)在Vivado软件主界面,打开IP Catalog,在搜索框内输入FFT,然后找到Digital Signal Processing->Transforms->FFTs目录下的Fast Fourier Transform,双击进入配置界面。
(2)进入到配置界面,左边是IP核的接口图、实现的一些细节信息和FFT的延迟,右边是Configuration、Implementation和Detailed Implementation三个标签卡。 Vivado的FFT IP核支持多通道输入(Number of Channels)和实时更改FFT的点数(Run Time Configurable Transform Length)。Configuration标签下可设置FFT的点数(Transform Length)和工作时钟(Target Clock Frequency),以及选择一种FFT结构。FFT的结构包括流水线Streaming、基4 Burst、基2 Burst和轻量级基2 Burst,它们的计算速度和消耗的资源依次减少,可根据工程实际进行选择。
Implementation标签卡下可设置FFT的数据格式为定点Fixed Point或浮点Float Point;输出截位方式选择:不截位(Unscaled),截位(Scaled),块浮点(Block Floating Point);设置输入数据的位宽和相位因子位宽。还有一些可选的附加信号,如时钟使能(ACLKEN),复位信号(ARESETn,低有效)等。“Output Ordering”用以选择FFT计算结果以自然顺序(Nature Order)或位倒序(Bit/Digit Reversed Order)输出。
Detailed Implementation里可设置优化方式、存储的类型。存储类型分为两种:Block RAM(块RAM)和Distributed RAM(分布式RAM);优化方式可选择资源最优或者速度最优。
(3)配置完成后,可在Latency下看到计算fft所需的时间,可以以此衡量设计是否满足实时处理的要求。如不满足,可选择性能更好的FFT结构或选择可以提高运算速度的优化选项
2.模块文件的编写 IP核工作必须要满足一定的时序要求,所以需要将数据按照一定时序送入IP核。IP核交互是用AXI-Stream接口,关于AXI-Stream接口的时序可自行查一些相关资料,这里不做详细介绍。简言之,AXI-Stream接口分为主机(master)和从机(slave),主机为发起端,从机为响应端,只有ready信号和valid信号同时为高时数据才能被有效写入或读出。举个例子,主机检测从机发出的ready信号,当为高时将valid信号拉高即可从从机读出或向从机写入数据。 module fft_test( input clk, input rst_n, input tvalid_i, input [31:0] tdata_i, //input fft_s_data_tlast, output fft_s_config_tready, output
fft_s_data_tready, output [47:0] fft_m_data_tdata, output
fft_m_data_tvalid, output
fft_m_data_tlast, output [7:0]
fft_m_data_tuser, output
fft_event_frame_started, output
fft_event_tlast_unexpected, output
fft_event_tlast_missing, output
fft_event_status_channel_halt, output
fft_event_data_in_channel_halt, output
fft_event_data_out_channel_halt ); reg fft_s_data_tvalid=1'b0; reg [31:0] fft_s_data_tdata=32'd0; reg fft_s_data_tlast=1'b0; reg[7:0] count=8'd0;
always @(posedge clk) begin if(!rst_n) begin
fft_s_data_tvalid<=1'b0;
fft_s_data_tdata<=32'd0; fft_s_data_tlast<=1'b0;
count<=8'd0; end else if (tvalid_i && fft_s_data_tready) begin
if(count==127)begin
fft_s_data_tvalid<=1'b1;
fft_s_data_tlast<=1'b1;
fft_s_data_tdata<=tdata_i;
count<=0; end
else begin
fft_s_data_tvalid=1'b1;
count<=count+1;
fft_s_data_tlast<=1'b0;
fft_s_data_tdata<=tdata_i;
end end else begin
fft_s_data_tvalid<=1'b0; fft_s_data_tlast<=1'b0; fft_s_data_tdata<=fft_s_data_tdata; end end
xfft_0 u_fft(
.aclk(clk),
// input wire aclk
.aresetn(rst_n),
// input wire aresetn
.s_axis_config_tdata(8'd1),
// input wire [7 : 0] s_axis_config_tdata
.s_axis_config_tvalid(1'b1),
// input wire s_axis_config_tvalid
.s_axis_config_tready(fft_s_config_tready),
// output wire s_axis_config_tready
.s_axis_data_tdata(fft_s_data_tdata),
// input wire [31 : 0] s_axis_data_tdata
.s_axis_data_tvalid(fft_s_data_tvalid),
// input wire s_axis_data_tvalid
.s_axis_data_tready(fft_s_data_tready),
// output wire s_axis_data_tready
.s_axis_data_tlast(fft_s_data_tlast),
// input wire s_axis_data_tlast
.m_axis_data_tdata(fft_m_data_tdata),
// output wire [47 : 0] m_axis_data_tdata
.m_axis_data_tuser(fft_m_data_tuser),
// output wire [7 : 0] m_axis_data_tuser
.m_axis_data_tvalid(fft_m_data_tvalid),
// output wire m_axis_data_tvalid
.m_axis_data_tready(1'b1),
// input wire m_axis_data_tready
.m_axis_data_tlast(fft_m_data_tlast),
// output wire m_axis_data_tlast
.event_frame_started(fft_event_frame_started),
// output wire event_frame_started
.event_tlast_unexpected(fft_event_tlast_unexpected),
// output wire event_tlast_unexpected
.event_tlast_missing(fft_event_tlast_missing),
// output wire event_tlast_missing
.event_status_channel_halt(fft_event_status_channel_halt),
// output wire event_status_channel_halt
.event_data_in_channel_halt(fft_event_data_in_channel_halt),
// output wire event_data_in_channel_halt
.event_data_out_channel_halt(fft_event_data_out_channel_halt)
// output wire event_data_out_channel_halt ); endmodule
3.功能仿真 模块编写完成后,需要通过功能仿真来验证我们设计逻辑的正确性。进行仿真之前,我们需要编写仿真测试文件(testbench)。
module testbench; reg clk; reg rst_n; reg [15:0] dati_in; reg [15:0] datq_in; reg [23:0]
dati_out; reg [23:0] datq_out; reg [15:0]
dataI [127:0]; reg [47:0] fft_abs;
reg fft_s_data_tvalid; wire [31:0] fft_s_data_tdata; //reg fft_s_data_tlast; wire fft_s_config_tready; wire
fft_s_data_tready; wire [47:0] fft_m_data_tdata; wire
fft_m_data_tvalid; wire
fft_m_data_tlast; wire [7:0]
fft_m_data_tuser; wire
fft_event_frame_started; wire
fft_event_tlast_unexpected; wire
fft_event_tlast_missing; wire
fft_event_status_channel_halt; wire
fft_event_data_in_channel_halt; wire
fft_event_data_out_channel_halt;
initial begin clk=1; rst_n=0; //fft_s_data_tlast=1'b0; fft_s_data_tvalid=1'b0;
dati_in=0; datq_in=0; dati_out=0; datq_out=0; fft_abs=0;
$readmemb("C:/Users/radar/Desktop/Science/FPGA/FFT/y1.txt",dataI); #100 rst_n=1; end
always #5 clk=~clk; reg[7:0] count=0;
always @(posedge clk) begin
if (fft_s_data_tready) begin
if(count==128) begin
fft_s_data_tvalid=1'b0;
//fft_s_data_tlast=1'b0;
#10000
count=0;
end else if(count==127)begin
dati_in<= dataI[count];
datq_in<=16'd0;
fft_s_data_tvalid<=1'b1;
//fft_s_data_tlast<=1'b1;
count<=count+1;
end
else begin
dati_in<= dataI[count];
datq_in<=16'd0;
fft_s_data_tvalid=1'b1;
count<=count+1;
//fft_s_data_tlast<=1'b0;
end
end
end
assign fft_s_data_tdata = {datq_in,dati_in};
fft_test u_fft_test( .clk(clk), .rst_n(rst_n), .tvalid_i(fft_s_data_tvalid), .tdata_i(fft_s_data_tdata), //.fft_s_data_tlast(fft_s_data_tlast),
.fft_s_config_tready(fft_s_config_tready), .fft_s_data_tready(fft_s_data_tready), .fft_m_data_tdata(fft_m_data_tdata),
.fft_m_data_tvalid(fft_m_data_tvalid), .fft_m_data_tlast(fft_m_data_tlast), .fft_m_data_tuser(fft_m_data_tuser),
.fft_event_frame_started(fft_event_frame_started),
.fft_event_tlast_unexpected(fft_event_tlast_unexpected), .fft_event_tlast_missing(fft_event_tlast_missing),
.fft_event_status_channel_halt(fft_event_status_channel_halt), .fft_event_data_in_channel_halt(fft_event_data_in_channel_halt),
.fft_event_data_out_channel_halt(fft_event_data_out_channel_halt) );
always @(posedge clk) begin
if(fft_m_data_tvalid) begin
dati_out<=fft_m_data_tdata[23:0];
datq_out<=fft_m_data_tdata[47:24];
end end always @(posedge clk) begin
fft_abs<=$signed(dati_out)* $signed(dati_out)+ $signed(datq_out)* $signed(datq_out);
end endmodule testbench中输入的时域波形数据是我们通过matlab生成的,在matlab中我们仿真的是采样率为2kHz情况下,频率分别为50Hz和200Hz的两正弦波叠加后的信号。
N=128; n=1:N; f0=50; f1=200; fs=2e3;
y=sin(2*pi*f0.*n/fs)+2*sin(2*pi*f1.*n/fs);
figure; plot(y); Y=fft(y);
figure; plot(abs(Y)); y1=y';
q=quantizer([16 12]);
y2=num2bin(q,y1);
fid1=fopen('C:/Users/radar/Desktop/y1.txt','wt'); for i=1:N
fwrite(fid1,y2(i,:));
fprintf(fid1,' ');
end fclose(fid1); 利用modelsim进行功能仿真时我们将仿真时长设置为20us。为了直观验证fft是否正确,可将输入的时域数据的实部和做完fft后信号功率值的数据格式均设置为anolog(模拟),如下图,可以看到fft后的功率谱为两根独立的谱线,分别代表50Hz和200Hz两个频率点,和matlab仿真结果一致。
对于该IP核更复杂的应用,大家可以阅读Xilinx官方提供的文档,根据自己的实际需要进行设计。
编辑:黄飞
评论
查看更多