基于OpenCL的FPGA开发设计方案

对于一个软件开发人员，可能听说过FPGA，甚至在大学课程设计中，可能拿FPGA做过计算机体系架构相关的验证，但是对于它的第一印象可能觉得这是硬件工程师干的事儿。目前，随着人工智能的兴起，GPU 借助深度学习，走上了历史的舞台，并且正如火如荼的跑者各种各样的业务，从 training 到 inference 都有它的身影。FPGA 也借着这股浪潮，慢慢地走向数据中心，发挥着它的优势。所以接下来就讲讲 FPGA 如何能让程序员们更好友好的开发，而不需要写那些烦人的 RTL 代码，不需要使用 VCS，Modelsim 这样的仿真软件，就能轻轻松松实现 unit test。实现这一编程思想的转变，是因为 FPGA 借助 OpenCL 实现了编程，程序员只需要通过 C/C++ 添加适当的 pragma 就能实现 FPGA 编程。为了让您用 OpenCL 实现的 FPGA 应用能够有更高的性能，您需要熟悉如下介绍的硬件。另外，将会介绍编译优化选项，有助于将您的 OpenCL 应用更好的实现 RTL 的转换和映射，并部署到 FPGA 上执行。

FPGA 概览

FPGA 是高规格的集成电路，可以实现通过不断的配置和拼接，达到无限精度的函数功能，因为它不像 CPU 或者 GPU 那样，基本数据类型的位宽都是固定的，相反 FPGA 能够做的非常灵活。在使用 FPGA 的过程中，特别适合一些 low-level 的操作，比如像 bit masking、shifting、addition 这样的操作都可以非常容易的实现。

为了达到并行化计算，FPGA 内部包含了查找表（LUTs），寄存器（register），片上存储（on-chip memory）以及算术运算硬核（比如数字信号处理器 (DSP) 块）。这些 FPGA 内部的模块通过网络连接在一起，通过编程的手段，可以对连接进行配置，从而实现特定的逻辑功能。这种网络连接可重配的特性为 FPGA 提供了高层次可编程的能力。（FPGA的可编程性就体现在改变各个模块和逻辑资源之间的连接方式）举个例子，查找表（LUTs）体现的 FPGA 可编程能力，对于程序猿来说，可以等价理解为一个存储器（RAM）。

对于 3-bits 输入的 LUT 可以等价理解为一个拥有 3位地址线并且 8 个 1-bit 存储单元的存储器（一个8长度的数组，数组内每个元素是 1bit）。那么当需要实现 3-bits 数字按位与操作的时候，8长度数组存的是 3-bits 输入数字的按位与结果，一共是 8 种可能性。当需要实现 3-bits 按位异或的时候，8长度数组存的是 3-bits 输入数字的按位异或结果，一共也是 8 种可能性。这样，在一个时钟周期内，3-bits 的按位运算就能够获取到，并且实现不同功能的按位运算，完全是可编程的（等价于修改 RAM 内的数值）。 3-bits 输入 LUT 实现按位与（bit-wise AND）示例：

注：3-bits 输入 LUT 查找表我们看到的三输入的按位与操作，如下所示，在 FPGA 内部，可通过 LUT 实现。

如上展示了 3输入，1输出的 LUT 实现。当将 LUT 并联，串联等方式结合起来后就可以实现更加复杂的逻辑运算了。 传统 FPGA 开发 ▍传统 FPGA 与软件开发对比 对于传统的 FPGA 开发与软件开发，工具链可以通过下表简单对比：

注：传统 FPGA 与软件开发对比表重点介绍一下，编译阶段的 Synthesis (综合)，这部分与软件开发的编译有较大的不同。一般的处理器 CPU、GPU等，都是已经生产出来的 ASIC，有各自的指令集可以使用。但是对于 FPGA，一切都是空白，有的只是零部件，什么都没有，但是可以自己创造任何结构形式的电路，自由度非常的高。这种自由度是 FPGA 的优势，也是开发过程中的劣势。写到这里，让我想起了最近《神秘的程序员们》中的一个梗：

注：漫画来源《神秘的程序员们56》by 西乔
传统的FPGA开发就像10岁时候的 Linux，想吃一个蛋糕，需要自己从原材料开始加工。FPGA 正是这种状态，想要实现一个算法，需要写 RTL，需要设计状态机，需要仿真正确性。 ▍传统 FPGA 开发方式 复杂系统，需要使用有限状态机（FSM），一般就需要设计下图包含的三部分逻辑：组合电路，时序电路，输出逻辑。通过组合逻辑获取下一个状态是什么，时序逻辑用于存储当前状态，输出逻辑混合组合、时序电路，得到最终输出结果。

然后，针对具体算法，设计逻辑在状态机中的流转过程：

实现的 RTL 是这样的：

module fsm_using_single_always (
clock      , // clockreset      , // Active high, syn resetreq_0      , // Request 0req_1      , // Request 1gnt_0      , // Grant 0gnt_1      
);//=============Input Ports=============================input   clock,reset,req_0,req_1; //=============Output Ports===========================output  gnt_0,gnt_1;//=============Input ports Data Type===================wire    clock,reset,req_0,req_1;//=============Output Ports Data Type==================reg     gnt_0,gnt_1;//=============Internal Constants======================parameter SIZE = 3           ;
parameter IDLE  = 3'b001,GNT0 = 3'b010,GNT1 = 3'b100 ;//=============Internal Variables======================reg   [SIZE-1:0]          state        ;// Seq part of the FSMreg   [SIZE-1:0]          next_state   ;// combo part of FSM//==========Code startes Here==========================always @ (posedge clock)begin : FSMif (reset == 1'b1) begin
 state <= #1 IDLE;
 gnt_0 <= 0;
 gnt_1 <= 0;end else
case(state)
  IDLE : if (req_0 == 1'b1) begin
               state <= #1 GNT0;
               gnt_0 <= 1;              end else if (req_1 == 1'b1) begin
               gnt_1 <= 1;
               state <= #1 GNT1;              end else begin
               state <= #1 IDLE;              end
  GNT0 : if (req_0 == 1'b1) begin
               state <= #1 GNT0;              end else begin
               gnt_0 <= 0;
               state <= #1 IDLE;              end
  GNT1 : if (req_1 == 1'b1) begin
               state <= #1 GNT1;              end else begin
               gnt_1 <= 0;
               state <= #1 IDLE;              end
  default : state <= #1 IDLE;
endcaseendendmodule // End of Module arbiter

传统的 RTL 设计，对于程序员简直就是噩梦啊，梦啊，啊～～～工具链完全不同，开发思路完全不同，还要分析时序，一个 Clock 节拍不对，就要推翻重来，重新验证，一切都显得太底层，不是很方便。那么，这些就交给专业的 FPGAer 吧，下面介绍的 OpenCL 开发 FPGA，有点像 25 岁的 Linux 了。有了高层次的抽象。用起来自然也会更加方便。
▍基于 OpenCL 的 FPGA 开发
OpenCL 对于 FPGA 开发，注入了新鲜的血液，一种面向异构系统的编程语言，将 FPGA 最为异构实现的一种可选设备。由 CPU Host 端控制整个程序的执行流程，FPGA Device 端则作为异构加速的一种方式。异构架构，有助于解放 CPU，将 CPU 不擅长的处理方式，下发到 Device 端处理。目前典型的异构 Device 有：GPU、Intel Phi、FPGA。 OpenCL 是个 what？ 注：引用自 wiki
Open Computing Language (OpenCL) is a framework for writing programs that execute across heterogeneousplatforms consisting of central processing units (CPUs), graphics processing units (GPUs), digital signal processors(DSPs), field-programmable gate arrays (FPGAs) and other processors or hardware accelerators. OpenCL specifies aprogramming language (based on C99) for programming these devices and application programming interfaces (APIs) to control the platform and execute programs on the compute devices. OpenCL provides a standard interface for parallel computing using task-based and data-based parallelism. 大意是说：OpenCL 是一个用于异构平台编程的框架，主要的异构设备有 CPU、GPU、DSP、FPGA以及一些其它的硬件加速器。OpenCL 基于 C99 来开发设备端代码，并且提供了相应的 API 可以调用。OpenCL 提供了标准的并行计算的接口，以支持任务并行和数据并行的计算方式。
OpenCL 案例分析
这里采用 Altera 官网的矩阵乘法案例进行分析。可以通过如下链接下载案例：Altera OpenCL Matrix Multiplication 代码结构如下：

.|-- common|   |-- inc|   |   `-- AOCLUtils|   |       |-- aocl_utils.h|   |       |-- opencl.h|   |       |-- options.h|   |       `-- scoped_ptrs.h|   |-- readme.css|   `-- src|       `-- AOCLUtils|           |-- opencl.cpp|           `-- options.cpp`-- matrix_mult
   |-- Makefile
   |-- README.html
   |-- device
   |   `-- matrix_mult.cl
   `-- host
       |-- inc
       |   `-- matrixMult.h
       `-- src
           `-- main.cpp

其中，和 FPGA 相关的代码是 matrix_mult.cl ，该部分代码描述了 kernel 函数，这部分函数会通过编译器生成 RTL 代码，然后 map 到 FPGA 电路中。 kernel 函数的定义如下：

__kernel
__attribute((reqd_work_group_size(BLOCK_SIZE,BLOCK_SIZE,1)))
__attribute((num_simd_work_items(SIMD_WORK_ITEMS)))void matrixMult( __global float *restrict C, 
                __global float *A, 
                __global float *B, 
                int A_width, 
                int B_width)

模式比较固定，需要注意的是 __global 指明从 CPU 传过来的数据，存放到全局内存中，可以是 FPGA 片上存储资源，DDR，QDR 等，这个视 FPGA 的 OpenCL BSP 驱动，会有所区别。num_simd_work_items 用于指明 SIMD 的宽度。reqd_work_group_size 指明了工作组的大小。这些概念，可以参考 OpenCL 的使用手册。

函数实现如下：

// 声明本地存储，暂存数组的某一个 BLOCK__local float A_local[BLOCK_SIZE][BLOCK_SIZE];
__local float B_local[BLOCK_SIZE][BLOCK_SIZE];// Block indexint block_x = get_group_id(0);int block_y = get_group_id(1);// Local ID index (offset within a block)int local_x = get_local_id(0);int local_y = get_local_id(1);// Compute loop boundsint a_start = A_width * BLOCK_SIZE * block_y;int a_end   = a_start + A_width - 1;int b_start = BLOCK_SIZE * block_x;float running_sum = 0.0f;for (int a = a_start, b = b_start; a <= a_end; a += BLOCK_SIZE, b += (BLOCK_SIZE * B_width))
{  // 从 global memory 读取相应 BLOCK 数据到 local memory
 A_local[local_y][local_x] = A[a + A_width * local_y + local_x];
 B_local[local_x][local_y] = B[b + B_width * local_y + local_x];  // Wait for the entire block to be loaded.
 barrier(CLK_LOCAL_MEM_FENCE);  // 计算部分，将计算单元并行展开，形成乘法加法树
 #pragma unroll
 for (int k = 0; k < BLOCK_SIZE; ++k)
 {
   running_sum += A_local[local_y][k] * B_local[local_x][k];
 }  // Wait for the block to be fully consumed before loading the next block.
 barrier(CLK_LOCAL_MEM_FENCE);
}// Store result in matrix CC[get_global_id(1) * get_global_size(0) + get_global_id(0)] = running_sum;

采用 CPU 模拟仿真 FPGA
对其进行仿真，不需要 programer 关心具体的时序是怎么走的，只需要验证逻辑功能就可以，Altera OpenCL SDK 提供了 CPU 仿真 Device 设备的功能，采用如下方式进行：

# To generate a .aocx file for debugging that targets a specific accelerator board$ aoc -march=emulator device/matrix_mult.cl -o bin/matrix_mult.aocx --fp-relaxed --fpc --no-interleaving default --board # Generate Host exe.$ make# To run the application$ env CL_CONTEXT_EMULATOR_DEVICE_ALTERA=8 ./bin/host -ah=512 -aw=512 -bw=512

上述脚本中，通过 -march=emulator 设置创建一个可用于 CPU debug 的设备可执行文件。-g 添加调试 flag。—board 用于创建适配该设备的 debugging 文件。CL_CONTEXT_EMULATOR_DEVICE_ALTERA 为用于 CPU 仿真的设备数量。当执行上述脚本后，输出如下：

$ env CL_CONTEXT_EMULATOR_DEVICE_ALTERA=8 ./bin/host -ah=512 -aw=512 -bw=512Matrix sizes:
A: 512 x 512
B: 512 x 512
C: 512 x 512Initializing OpenCL
Platform: Altera SDK for OpenCL
Using 8 device(s)
EmulatorDevice : Emulated Device
...
EmulatorDevice : Emulated Device
Using AOCX: matrix_mult.aocx
Generating input matrices
Launching for device 0 (global size: 512, 64)
...
Launching for device 7 (global size: 512, 64)

Time: 5596.620 ms
Kernel time (device 0): 5500.896 ms
...
Kernel time (device 7): 5137.931 ms

Throughput: 0.05 GFLOPS

Computing reference output
Verifying
Verification: PASS
通过仿真时候设置 Device ＝ 8，模拟 8 个设备运行 (512, 512) * (512, 512) 规模的矩阵，最终验证正确。接下来就可以将其真正编译到 FPGA 设备上后运行。 FPGA 设备上运行矩阵乘 这个时候，真正要将代码下载到 FPGA 上执行了，这时候，只需要做一件事，那就是用 OpenCL SDK 提供的编译器，将 *.cl 代码适配到 FPGA 上，执行编译命令如下：
$ aoc device/matrix_mult.cl -o bin/matrix_mult.aocx --fp-relaxed --fpc --no-interleaving default --board 这个过程比较慢，一般需要几个小时到10几个小时，视 FPGA 上资源大小而定。（目前这部分时间太长暂时无法解决，因为这里的编译，其实是在行程一个能够正常工作的电路，软件会进行布局布线等工作）等待编译完成后，将生成的 matrix_mult.aocx文件烧写到 FPGA 上就 ok 啦。烧写的命令如下：

$ aocl program  matrix_mult.aocx

这时候，大功告成，可以运行 host 端程序了：

$ ./host -ah=512 -aw=512 -bw=512Matrix sizes:
 A: 512 x 512
 B: 512 x 512
 C: 512 x 512Initializing OpenCL
Platform: Altera SDK for OpenCL
Using 1 device(s)
  : Altera OpenCL QPI FPGA
Using AOCX: matrix_mult.aocx
Generating input matrices
Launching for device 0 (global size: 512, 512)


Time: 2.253 ms
Kernel time (device 0): 2.191 ms


Throughput: 119.13 GFLOPS


Computing reference output
Verifying
Verification: PASS

可以看到，矩阵乘法能够在 FPGA 上正常运行，吞吐大概在 119GFlops 左右。

小结

从上述的开发流程，OpenCL 大大的解放了 FPGAer 的开发周期，并且对于软件开发者，也比较容易上手。这是他的优势，但是目前开发过程中，还是存在一些问题，如：编译器优化不足，相比 RTL 写的性能存在差距；编译到 Device 端时间太长。不过这些随着行业的发展，一定会慢慢的进步。编辑：黄飞

阅读全文

FPGA(591969) FPGA(591969)
存储器(161623) 存储器(161623)
cpu(206163) cpu(206163)
异构计算(16151) 异构计算(16151)

Altera发布面向FPGA的OpenCL解决方案简化FPGA开发

Altera公司近日发布其面向FPGA的OpenCL （开放计算语言）早期使用计划（EAP），支持客户提前了解Altera面向FPGA的OpenCL解决方案。采用这一开放标准，设计团队可以在高级C语言框架中面向

2012-09-04 08:47:41

750

充分发挥FPGA优势 Altera首推新颖OpenCL工具

Altera宣布业界首款支持FPGA的OpenCL工具，进一步加速了FPGA在异构系统中的应用；OpenCL软件开发套件支持开发人员充分发挥FPGA的性能和效能优势。

2012-11-06 14:26:05

1344

什么是OpenCL？面向FPGA的OpenCL有何优点？

很多工程师朋友对OpenCL以及Altera相关开发套件非常感兴趣，也有很多问题提出。这里发一篇小小的技术普及文章，以供大家参考学习，欢迎参考、扩散...

2013-04-12 11:51:37

6521

基于FPGA的帧同步系统设计方案

本文介绍了集中式插入法帧同步系统的原理，分析了帧同步系统的工作流程。采用模块化的设计思想，利用VHDL设计了同步参数可灵活配置的帧同步系统，阐述了关键部件的设计方法，提出了一种基于FPGA的帧同步系统设计方案。

2013-11-11 13:36:01

4359

基于FPGA的数字核脉冲分析器硬件设计方案

为了研究数字化γ能谱仪，本文提出一种基于FPGA的数字核脉冲分析器硬件设计方案，该方案采用现场可编程逻辑部件（FPGA），完成数字多道脉冲幅度分析仪的硬件设计。用QuartusⅡ软件在FPGA平台上完成了数字核脉冲的幅度提取并生成能谱。

2013-11-21 10:57:26

1948

基于OpenCL标准的FPGA设计

开发方法相比，使用OpenCL标准、基于FPGA的混合系统（CPU + FPGA）具有明显的产品及时面市优势。

2014-05-26 09:10:18

3967

FPGA典型设计方案精华汇总

FPGA典型设计方案精华汇总

2012-08-16 16:29:32

FPGA编译openCL内核文件出错

` 用openCL写了个机器学习算法，用a10gx的板子的BSP编译运行没问题，但是a10gx板子太贵了。于是准备买DE10-Standard 来做研究，下了BSP在bashrc里改了文件后，编译

2019-04-18 17:30:30

FPGA设计大赛设计方案提交规则和截止时间须知

各位FPGA设计大赛参赛者注意了：小编这里帮大家解释一下设计方案提交规则和活动时间安排自4月23日比赛开始，参赛者报名之后即可提交设计方案。设计方案提交的截止日期是活动结束，暨设计方案评选的最后

2012-05-04 10:27:46

OpenCL平台和英特尔Stratix 10 FPGA的结合使用

在这个高度依赖图像的时代，英特尔® FPGA 可利用 OpenCL™ 平台满足巨大的图像处理和分类需求简介从 2015 年到 2020 年，互联网视频流量将增长四倍。[1] 鉴于可视数据的爆炸性

2019-07-17 06:34:16

opencl fpga 的仿真有大神会吗。

用opencl 写好代码之后，现在没有fpga板，怎么仿真运行一下，求大神解答

2021-04-13 14:38:20

opencl用于fpga开发

哪些人用过将fpga用于fpga开发啊？性能怎么样？优缺点分别是什么啊？大家都进来讨论讨论

2017-04-24 17:25:32

Altera OpenCL

各位大牛晚上好，是这样的，小弟目前在做一个Altera OpenCL的工作，具体是将OpenCL的kernel通过Altera提供的工具转换成aocx和Quartus工程，然后下载到FPGA板子上

2016-03-11 20:32:08

【深圳】诚聘FPGA开发工程师

猎头推荐职位：FPGA开发工程师工作职责：1. 编写设计方案，完成算法的封装固化；2. 基于FPGA硬件开发平台，调试、验证负责视频编码算法和图像处理算法；3. 利用***log/VHDL硬件描述

2017-07-04 15:27:02

【深圳】诚聘FPGA开发工程师

猎头职位：FPGA开发工程师工作职责：1.基于FPGA硬件开发平台，调试、验证负责视频编码算法和图像处理算法；2.编写设计方案，完成算法的封装固化；3.利用Verilo***L硬件描述语言实现相关

2017-07-17 15:15:12

【深圳】诚聘FPGA开发工程师

2017-09-11 15:59:18

什么是OpenCL？面向FPGA的OpenCL有什么优点？

　　很多工程师朋友对OpenCL以及面向FPGA的OpenCL很感兴趣，也有很多相关问题提出。这里发一篇小小的技术普及文章，以供大家参考学习，欢迎参考...　　

2019-09-17 08:26:12

介绍android下的OpenCL开发步骤

1、介绍android下OpenCL开发Firefly rk3288采用Mali-T764的GPU，该GPU支持OpeCL 1.1。下面一步一步介绍android下OpenCL开发。1.首先我们需要

2022-04-11 14:35:27

从ASIC到FPGA的转换系统时钟设计方案

从ASIC到FPGA的转换系统时钟设计方案

2011-03-02 09:37:37

关于避障小车的设计方案

请教下避障小车的设计方案 有几种选择？超声波避障如何？有没有其它设计方案

2012-08-31 11:54:02

分享一款不错的基于FPGA的简易频谱分析仪设计方案

一种基于FPGA的简易频谱分析仪设计方案，其优点是成本低，性能指标满足教学实验所要求的检测信号范围。

2021-04-30 06:43:21

分享一款不错的采用FPGA的集群通信移动终端设计方案

分享一款不错的采用FPGA的集群通信移动终端设计方案

2021-05-25 06:32:04

分享一种不错的基于FPGA和USB的通用CCD采集系统设计方案

提出一种基于FPGA和USB的通用CCD采集系统设计方案。该系统在不改变硬件的情况下可以采集多种CCD，并上传至PC机，使用软件处理采集到的数据。

2021-04-22 06:23:40

分享一种基于Actel Flash FPGA的高可靠设计方案

本文以星载测控系统为背景，提出了一种基于 Actel Flash FPGA的高可靠设计方案。采用不易发生单粒子翻转的 flash FPGA芯片，结合 FPGA内部的改进型三模冗余、分区设计和降级重构，实现了高实时、高可靠的系统。

2021-05-10 06:58:47

利用FPGA的无线通信收发模块设计方案

利用FPGA的无线通信收发模块设计方案[hide][/hide]

2009-11-26 10:25:56

压电马达的驱动设计方案

压电马达原理压电马达的驱动设计方案

2021-03-04 07:17:42

基于FPGA及VHDL的LED点阵汉字滚动显示设计方案

本帖最后由 eehome 于 2013-1-5 10:11 编辑基于FPGA及VHDL的LED点阵汉字滚动显示设计方案

2012-08-19 23:20:48

基于FPGA的变频器设计方案，利用simulink仿真

上学时做的变频器设计方案，利用simulink仿真，基于FPGA的变频器设计方案。

2014-09-10 10:40:12

基于FPGA的数据无阻塞交换设计方案，不看肯定后悔

基于FPGA的数据无阻塞交换设计方案，不看肯定后悔

2021-04-29 06:48:07

多种EDA工具的FPGA设计方案

多种EDA工具的FPGA设计方案

2012-08-17 10:36:17

如何用FPGA实现DVB码流分析功能的嵌入式设计方案？

如何用FPGA实现DVB码流分析功能的嵌入式设计方案？

2021-04-28 06:19:10

提交FPGA设计方案，赢取赛灵思FPGA开发板

“玩转FPGA：iPad2，赛灵思开发板等你拿”活动持续火爆进行中……………………活动得到了广大电子工程师积极强烈的支持，为了回报电子工程师和网站会员，现在只需提交fpga设计方案，就有机会获得赛灵

2012-07-06 17:24:41

求一款在PCI总线上利用FPGA技术设计PCI总线接口的设计方案

PCI总线特点及开发现状PCI接口配置空间的实现求一款在PCI总线上利用FPGA技术设计PCI总线接口的设计方案

2021-04-15 06:17:20

求一种基于FPGA的64点FFT处理器的设计方案

讨论了一种基于FPGA的64点FFT处理器的设计方案，输入数据的实部和虚部均以16位二进制数表示，采用基2DIT-FFT算法，以Altera公司的QuartusⅡ软件为开发平台对处理器各个的模块进行设计，在Stratix系列中的EP1S25型FPGA通过了综合和仿真，运算结果正确。

2021-04-29 06:25:54

求一种基于FPGA的HDLC协议控制器设计方案

求一种基于FPGA的HDLC协议控制器设计方案

2021-04-30 06:53:06

求一种基于FPGA的永磁同步电机控制器的设计方案

求一种基于FPGA的永磁同步电机控制器的设计方案。

2021-05-08 07:02:07

求一种多按键状态识别系统的设计方案

一种基于FPGA技术的多按键状态识别系统的设计方案

2021-05-06 08:44:59

求分享一种集中式插入法帧同步的FPGA的设计方案

本文主要提出一种集中式插入法帧同步的FPGA的设计方案。

2021-06-02 06:07:10

请问如何在Zynq Z-7020上使用opencl？

SDSoc网页显示2016.3 IDE可以在synq芯片上使用opencl，在这里，但我无法得到它？在哪里下载？是否有在synq芯片上使用opencl的andy demo？如果我不能得到支持opencl的SDSoc IDE，我如何在fpga上使用opencl？

2020-05-15 06:08:55

采用高级语言开发FPGA的探索

OpenCL(Open Computing Language,开放计算语言)开发实现的。本课题是在FPGA上采用OpenCL实现二叉树期权定价算法。实现框架如下：实验过程中发现，虽然OpenCL支持

2017-09-25 10:06:29

采用FPGA的嵌入式系统设计方案

采用FPGA的嵌入式系统设计方案 可编程片上系统设计是一个崭新的、富有生机的嵌入式系统设计技术研究方向。本文在阐述可编程逻辑器件特点及其发展趋势的

2010-03-22 11:21:49

基于FPGA的无线通信收发模块设计方案

基于FPGA的无线通信收发模块设计方案 1 前言　　近年来，随着半导体工艺技术和设计方法的迅速发展，系统级芯片SOC的设计得以高速发展，

2009-12-10 10:11:07

1707

基于FPGA的视频传输流发送系统设计方案

基于FPGA的视频传输流发送系统设计方案 　1 引言　　在目前的广播电视系统中ASI接口是使用非常广泛的一种接口形式，该接口随同SPI一起被欧

2009-12-14 09:39:33

1245

基于ADC和FPGA脉冲信号测量的设计方案

基于ADC和FPGA脉冲信号测量的设计方案 　0引言　　测频和测脉宽现在有多种方法。通常基于MCU的信号参数测量，由于其MCU工作频率很低，所以能够达到的精度也

2009-12-21 09:13:23

1501

基于FPGA的高速定点FFT算法的设计方案

基于FPGA的高速定点FFT算法的设计方案 引言快速傅里叶变换(FFT)作为计算和分析工具，在众多学科领域(如信号处理、图像处理、生物信息学、计算物理

2010-02-09 10:47:50

992

采用FPGA技术的智能导盲犬设计方案

采用FPGA技术的智能导盲犬设计方案 众所周知眼晴是“心灵之窗”，而对于突然失去或从未拥有过“心灵之窗”的盲人来说，生活上的困难与心理上

2010-03-22 09:40:28

869

基于Spartan-6的FPGA SP601开发设计方案

基于Spartan-6的FPGA SP601开发设计方案 Spartan-6是Xilinx公司的FPGA批量应用有最低成本的FPGA,采用45nm低功耗铜工艺,在成本,性能和功耗上有最好的平衡.该系

2010-04-02 14:25:28

2268

采用VC++程序的FPGA重配置设计方案

采用VC++程序的FPGA重配置设计方案利用现场可编程逻辑器件FPGA的多次可编程配置特点，通过重新下载存储于存储器的不同系统数据

2010-04-14 15:14:57

580

多种EDA工具的FPGA设计方案

多种EDA工具的FPGA设计方案 概述：介绍了利用多种EDA工具进行FPGA设计的实现原理及方法,其中包括设计输入、综合、功能仿真、实现、时序仿真、配

2010-05-25 17:56:59

670

Altera发布业界第一个面向FPGA的OpenCL计划

Altera公司(NASDAQ: ALTR)今天发布FPGA和SoC FPGA的开放计算语言(OpenCL™)标准开发计划。OpenCL标准是基于C语言的开放标准，适用于并行编程。Altera的OpenCL计划结合了FPGA的并行能力以及OpenCL标准

2011-11-16 16:12:08

599

Altera的FPGA OpenCL计划大幅度缩短了早期试用客户的开发时间

　　2012年4月11号，北京——Altera公司（Nasdaq： ALTR）今天宣布，goHDR作为FPGA OpenCL计划的早期试用客户，通过Altera的FPGA OpenCL计划，大幅度缩短了开发时间，显著提高了性能。与Altera密切

2012-04-12 08:58:10

705

面向Altera FPGA的OpenCL:提高性能和设计效能

开放计算语言（OpenCL）编程模型与Altera的并行FPGA体系结构相结合，实现了功能强大的系统加速解决方案。面向OpenCL的Altera SDK为您提供了设计环境，工程师很容易在FPGA上实现OpenCL应用。

2012-11-06 14:56:42

1091

Altera面向OpenCL的SDK是FPGA业界首个实现Khronos标准

产品名录。Altera是唯一能够提供FPGA最优OpenCL解决方案的公司，支持软件开发人员充分利用FPGA大规模并行体系结构来实现系统加速。Altera将在10月16-17日在加州圣克拉拉举办的2013 Linley处理器大会上演示其OpenCL解决方案。

2013-10-17 15:55:07

1174

Altera面向OpenCL的软件开发套件快速提供原型开发流程

Altera公司近日宣布，帮助编程人员在FPGA中大幅度加速实现算法。Altera面向OpenCL的SDK 14.0版包括对程序设计非常熟悉的快速原型设计流程，支持用户在FPGA加速板上快速进行设计原型开发。

2014-07-03 09:52:07

907

基于FPGA技术的RS232接口时序电路设计方案

基于FPGA技术的RS232接口时序电路设计方案

2017-01-26 11:36:55

基于FPGA的OLED真彩色显示设计方案

基于FPGA的OLED真彩色显示设计方案

2017-01-18 20:35:09

数字电路设计方案中DSP与FPGA的比较与选择

数字电路设计方案中DSP与FPGA的比较与选择

2017-01-18 20:39:13

Xilinx与IBM通过SuperVesselOpenPOWER开发云平台实现FPGA加速

SuperVessel将包括赛灵思SDAccel开发环境，支持用C、C++和OpenCL实现FPGA加速 All Programmable 技术和器件的全球领先企业赛灵思公司与IBM公司今天联合宣布

2017-02-08 16:06:08

228

抢攻数据中心赛灵思发布OpenCL开发工具

赛灵思(Xilinx)推出首款支持OpenCL的开发工具。现场可编程门阵列(FPGA)厂商正积极推出可支持OpenCL设计工具的新一代解决方案，期能协助FPGA深入到主流异质架构运算领域，并加速软件定义数据中心软硬件运算架构的整合

2017-02-10 06:15:06

1066

用于OpenCL的英特尔FPGA SDK资料

用于OpenCL的英特尔FPGA SDK

2017-03-22 15:02:03

OpenCL 代码的可移植性优势及异构系统中的应用

编程模型。利用这一 SDK，熟悉 C 语言的系统开发人员和编程人员能够迅速方便的在高级语言环境中开发高性能、高功效、基于 FPGA 的应用。Altera 面向 OpenCL 的 SDK 使得 FPGA 能够与主处理器协同工作，加速并行计算，而功耗远远小于硬件方案。 Altera 将在 SuperCom

2017-09-15 15:46:56