硬件实现 - 添加硬件加速器可以加快处理器的正弦计算

虽然与数学库的原始计算相比，算法的速度有了明显的改善，但客户需要的是速度快得多的实现。不过前文所述的最后一步给我们提供了一种能够轻松转向硬件实现的方法。

这种实现方法需要某些用于拆分 xi值的运算。要在硬件中做到这一点，只需将所需的位进行连接即可。然后我们需要三个表；我们使用以我们的PC模型计算出的预定义值推导出ROM，然后将其转入IP的VHDL代码中。该IP能够一次读取所有三个表，从而能够再度节省时间。最后，我们需要进行一次浮点MUL和一次浮点ADD运算。

对于该任务，我们发现用于浮点运算的CORE GeneratorTM模块非常适合。

无流水线功能的加速器

图 3 — 无流水线功能的加速器 IP

我们使用一些Slice和乘法器，对这些硬件模块中的两个进行例化。两个内核都要求4到5个周期的延迟，以匹配我们设计的时序要求。延迟在此不是什么问题，我们将在下面的步骤中进行讨论。

我们将最终的IP以MicroBlaze的快速单工链路 (FSL) IP 的形式进行实现。对时序的第一次估算结果表明：

• 将数据从MicroBlaze传输到FSL总线需用一个时钟周期
• 将数据从FSL总线传输至FSL IP（当正弦计算的自变量从FSL总线读出时，将立即从BRAM读取数据，因而无需时钟周期）需用一个时钟周期
• 完成MUL运算 (cos(x)*sin(d)) 需用四个时钟周期
• 将方程的结果存储到寄存器中需用一个时钟周期
• 完成ADD运算需用四个时钟周期
• 将数据发送回FSL总线需用一个时钟周期
• MicroBlaze从FSL IP读取数据需用一个时钟周期。

请注意，在没有使用任何额外流水线（我们将在下一步骤中讨论这一点）的情况下，自变量数据在整个过程中必须保持稳定。这就意味着MicroBlaze仅能请求一次正弦计算，且必须读取该值，然后至少要等上13个时钟周期，才能请求下一次计算。

因此，我们估计进行该实现需要13个时钟周期。当然，要处理软件上的函数调用以及某些其他运算，还需要更多的时钟周期。

我们简单地把一些标准时钟组合在一起，不到一天就实现了该IP，随即在硬件中对该算法进行测量。整个算法（软硬件混合）耗用了360个时钟周期（包括所有的函数调用）。虽然这已是显著的进步，但是仍不足以充分满足客户的需求。

在我们的加速器IP处理所有数据之前，我们使用一个SRL16来延迟信号的写入。

虽然该算法现在可与我们的MicroBlaze并行运行，但它每次只能计算一个值。

步骤六：添加流水线和适配客户代码

设计到了这一步，我们就可以开始向我们的内核添加流水线。浮点ADD和浮点MUL的CORE Generator模块已采用流水线实现，因而我们在此无需再做什么。第一个版本的算法要求自变量保持恒定，直至计算完成。在开始新计算之前（自变量数据到达FSL IP内部），立刻读取两个BRAM并执行浮点MUL。运算的结果在数个时钟周期后生效。

我们的 sin(xi) 的自变量 xi 是一个20位宽的整数，它分为 x 和 d 两个部分。因此，我们必须对自变量 xi的MSB部分 x 进行几个时钟周期的延迟，以读取 BRAM 的内容，存储自变量xi，并将其与MUL运算的结果相匹配。

我们为我们的10位宽数值使用了少量SRL16元件（总共 10 个），共占用了10个LUT（但由于Spartan-6具有LUT组合功能，如果采用该器件较宽的LUT6结构，则仅需 5 个 LUT 即可）。

最后的工作量相当小。在图4中已对增加的SRL16x10位用红圈进行了标注。

带流水线的加速器内核

图 4：带流水线的加速器内核

然后我们使用EDK向导来修改我们的FSL总线FIFO，以便存储多个值（我们确定能够存储8个值就足以达到我们的目的，但可根据需要轻松增加更多）。

这就意味着我们的客户甚至在请求第一个结果之前即能获得多达8个值。这足以满足我们客户当前的需求，但如果想请求更多正弦值的话，则可以轻松将FIFO缓冲参数扩展为较大的值。

我们在与客户讨论这种新的方案时，发现可将正弦计算进一步划分为两个部分：

1. 请求正弦计算（fslput 运算）
2. 请求正弦计算的结果（fslget运算）

由于我们在运算中有一个固定时延，所以如果这两个运算依次衔接、紧密地按顺序执行，那么MicroBlaze将停顿，并等待FSL IP完成对请求的处理。如果能够将这两组运算分开（这在客户的算法中是可以的），那么我们即可进一步提
升运算的总体速度。通过增加流水线，在MicroBlaze上执行的最终代码如下：

putfsl(arg1,fsl1_id);
putfsl(arg2,fsl1_id);
putfsl(arg3,fsl1_id);
putfsl(arg4,fsl1_id);
putfsl(arg5,fsl1_id);
putfsl(arg6,fsl1_id);
putfsl(arg7,fsl1_id);
putfsl(arg8,fsl1_id);
...
getfsl(result1,fsl1_id);
getfsl(result2,fsl1_id);
getfsl(result3,fsl1_id);
getfsl(result4,fsl1_id);
getfsl(result5,fsl1_id);
getfsl(result6,fsl1_id);
getfsl(result7,fsl1_id);
getfsl(result8,fsl1_id);

这给我们带来了显著的优势。内核不仅可完全实现流水线功能，而且还能够将正弦计算的两个调用分开。IP核的时延依然存在，但不再明显。MicroBlaze也不再发生停顿和等待未完成的IP计算的情况，从而提高了整体性能。

客户同意对代码进行相应调整，这对客户来说只是小量工作。通过使用C语言的宏命令取代函数调用，我们就能够把所有要求的调用插入代码库中。

EDK为FSL总线实现了深度为 8 的 FIFO 以提升流水线的性能

图 5 － EDK为FSL总线实现了深度为 8 的 FIFO 以提升流水线的性能

最终实现的算法一次计算只需要四个时钟周期。处理的总体时延不再明显，而被调用的划分以及结果请求所隐藏。另外，整体IP需要一些额外的BRAM（需为我们的三个表增加六个BRAM）和一定数量的乘法器或DSP Slice以及一些其他Slice。

但结果非常令人吃惊。我们的MicroBlaze现在就能够如同超高端处理器内核一样运行，而且其运行频率仍然相当低（现在比原来的正弦计算约快9,600 倍）。

步骤七：进一步优化？

当我们达到这种实现水平时，我们的客户对结果感到非常满意，并且我们也完成了加速器IP方面的工作。速度和精度都非常不错。

当然，还有一项最终优化需要完成。如果我们在d值非常小的情况下对sin(d) 值进行考察，算法还可以进一步完善：

sin(d) = ~d

若d值小于2*π/1024，即小于0.0061359，那么总体误差则小于 1E-8（针对有 1,024 个值的表）。
我们算法的最后步骤将为：

sin(x+d) = sin(x) + cos(x) * d

这样只会存在非常小的额外误差，但我们可以去掉第三个表。当然，我们必须保留 fadd 和 fmul运算器。虽然我们还可以通过其他方式来计算浮点值的正弦值，但这种方案充分显示了增添硬件加速器的强大功能。我们的开发经历表明，你们无需为了将含有浮点计算的算法在硬件中实现而担心。

阅读全文

上一页 1 23全文

本文导航

第 1 页：添加硬件加速器可以加快处理器的正弦计算
第 2 页：正弦计算
第 3 页：硬件实现

硬件加速器(12610) 硬件加速器(12610)
正弦计算(1503) 正弦计算(1503)

充分利用数字信号处理器上的片内FIR和IIR硬件加速器

我们看到如何利用不同的加速器使用模型实现所需的MIPS和处理目标，从而将大量内核MIPS转移到ADSP-2156x处理器上的FIRA和IIRA加速器。

2020-06-22 14:42:33

1451

21489的IIR加速器滤波参数设置如何对应加速器的滤波参数？

目前在用21489内部的IIR加速器去做一个低通滤波器，在例程的基础上修改参数。通过平板的fda 工具工具去设计参数，但是设计出来的参数不知道如何对应加速器的滤波参数，手册里也看得不是很明白。设计的参数如下：请问这些参数应该如何对应起来？

2023-11-30 08:11:55

ADAU1451硬件加速器摆动什么用？

Hi，HenryLj.mo请问下在Sigma 300里面使用硬件加速器slew，slew mode为RC type时，对应的time constant 与数据从当前值到目标值得时间有什么关系,或者说不同的time constant的值有什么用？ Thanks,Jack

2019-01-29 06:55:13

ARM Cortex-R7 MPCore处理器技术参考手册

，并且提供了可选的硬件加速器一致性端口(ACP)，以减少与其他主机共享存储器区域时的软件高速缓存维护操作。中断延迟通过中断和重新启动加载-存储多条指令以及使用集成中断控制器来保持低。 Cortex-R7 MPCore处理器为低延迟和确定性提供了两种专门的内存解决方案

2023-08-18 06:34:29

ARM定制说明：在ARM上实现创新和更大的灵活性

的加速器。 3.ARM定制指令通过实现与处理器数据路径更紧密耦合的紧密耦合加速器，进一步扩展了硬件加速器的这一视图

2023-08-23 08:19:20

GNN（图神经网络）硬件加速的FPGA实战解决方案

。如上所述种种设计挑战的存在，使得业界急需一种可以支持高度并发实时计算、巨大内存容量和带宽、以及在数据中心范围可扩展的GNN加速解决方案。5.GNN加速器的FPGA设计方案Achronix公司推出

2021-07-07 08:00:00

H.264解码器中CABAC硬件加速器怎么实现？

2021-06-07 06:48:58

Intel媒体加速器参考软件用户指南

英特尔媒体加速器参考软件是用于数字标志、交互式白板(IWBs)和亭位使用模型的参考媒体播放器应用软件,它利用固定功能硬件加速来提高媒体流速、改进工作量平衡和资源利用,以及定制的图形处理股(GPU)管道解决方案。该用户指南将介绍和解释如何使用英特尔媒体加速器视窗参考软件。

2023-08-04 07:07:34

MCU厂推多样解决方案 DSP/FPU硬件加速芯片整合

处理对应至各式演算法应用，两者功能可以说是各有互补效用，比较难被独立拆分。以ARM Cortex-M4来看，若仅提供DSP硬件加速处理器反而没设置FPU浮点运算加速器反而会造成应用限制，因为在

2016-10-14 17:17:54

c6670中运行bcp硬件加速器例程发现中断服务程序未能响应

你好，目前，我想运用6670中bcp硬件加速器，在调试Bcp_testProject例程中，在test_lte_dl.c文件中pend hRxSem信号量时halt住，发现中断服务程序未能响应

2018-12-25 11:27:45

【FPGA干货分享六】基于FPGA协处理器的算法加速的实现

移动的数据具有较低的延时和更高的数据速率。3. 指令流水线连接指令流水线连接加速器直接连接到CPU的计算内核。通过与指令流水线连接，CPU不能识别的指令可以由协处理器执行。操作数、结果以及状态直接从数据

2015-02-02 14:18:19

【FPGA开发者项目连载】基于MiniStar的简易AI加速器

分析了高云Github上GoAI的项目5.购买了TinyML书籍、ov7670摄像头5.17-6.11.实现硬件加速模块（主要是卷积包括PW DW、全连接、pool）2.M3实现任务分发调度3.基于TensorFlow Lite搭建微处理器运行神经网络架构

2021-05-14 14:04:28

【书籍评测活动NO.18】 AI加速器架构设计与实现

NPU架构合二为一，总结并提炼出本书内容。本书主要讨论神经网络硬件层面，尤其是芯片设计层面的内容，主要包含神经网络的分析、神经网络加速器的设计以及具体实现技术。通过阅读本书，读者可以深入了解主流

2023-07-28 10:50:51

【国产FPGA+OMAPL138开发板体验】（原创）7.硬件加速Sora文生视频源代码

了TextToVideoHardwareAccelerator的实例化，并添加了对文本到视频帧转换逻辑的占位符。同时，为了保证时序正确性，在实际设计中加入了硬件加速器处理完成的信号反馈： module

2024-02-22 09:49:01

一种基于FPGA的图神经网络加速器解决方案

位置。因此对存储访问没有挑战，但是矩阵的计算量非常大。基于上述分析，我们决定在GNN内核加速器设计中选择使用两种不同的硬件结构来分别处理聚合和合并操作（如下图示）：聚合器——通过单指令多数据（SIMD

2021-09-25 17:20:41

为什么FPGA协处理器可以实现算法加速？

代码加速和代码转换到硬件协处理器的方法如何采用FPGA协处理器实现算法加速？

2021-04-13 06:39:25

为什么要进入最佳硬件加速板？

我想进入硬件加速。什么板对此有好处，为什么？

2019-10-10 07:00:38

为什么说MCU中导入DSP/FPU是未来的发展主流？

运算结果得出时间会相对拉长，而在导入硬件加速器处理浮点运算时，因为硬件呼叫或是资料传递就能透过硬件算出数据，MCU本身耗在浮点运算的记忆体资源可以因硬件加速整合减少至少10%。当然，从目的性来看，不管

2016-09-13 15:12:49

使用AMD-Xilinx FPGA设计一个AI加速器通道

模块。Vivado 通过 Run Connection Automation 将 cdma 和 bram 连接到处理器。那么设计应该类似于下图。加速器IP加速器 IP 由 4 个源文件组成。加速器：连接

2023-02-21 15:01:58

关于长整加速器的工作步骤：

关于长整加速器的工作步骤：1. 系统置位后，CPU向加速器的源地址寄存器发送当前长整计算的源操作数地址（位于Memory中）2. 接着，CPU向加速器的目标地址寄存器发送当前长整计算的目标操作数地址

2018-03-17 10:53:37

华为FPGA加速云服务器如何加速让硬件应用高效上云？

华为FPGA加速云服务器让“硬用”上云成为新增长点随着通信和互联网产业的快速发展，FPGA作为高性能计算加速器在大数据、深度学习、图像视频处理、基因计算、金融分析和加解密等众多领域得到广泛应用，市场空间巨大。

2019-10-22 07:12:32

协调屏幕旋转和硬件加速器

）。而且，在我的测试中，我发现关闭“硬件加速器”允许屏幕在旋转时正确地绘制，但是这使得系统使用起来非常缓慢和痛苦（坏的用户体验）。谢谢任何帮助。

2020-04-03 10:56:36

在Sigma 300里面使用硬件加速器slew，slew mode为RC type时不同的time constant的值有什么用？

请问下在Sigma 300里面使用硬件加速器slew，slew mode为RC type时，对应的time constant 与数据从当前值到目标值得时间有什么关系,或者说不同的time constant的值有什么用？谢谢, 中 J Jj

2023-11-29 07:25:43

基于ARM11飞思卡尔i.mx35高端多媒体芯片有哪些应用方式？

飞思卡尔联合Khronos Group 推出了一款集成了OpenVG硬件加速器的汽车多媒体嵌入式微处理器i.MX35，成为全球首款集成OpenVG硬件加速器的汽车多媒体微处理器，i.MX35卓越的多媒体性能将车载多媒体推向一个新的高度，确定了Freescale在汽车电子行业不可撼动的引领地位。

2019-11-01 07:59:24

基于Fast Model的加速器软件开发

加速器适配不同的arm系统，这对软硬件接口和驱动提出了非常大的挑战，因为今天的arm产品非常丰富，从低功耗的微处理器，主流的移动平台，到高端的服务器，高性能计算处理器都有相应产品。对于一个加速器团队来说

2022-07-29 15:38:43

基于Xilinx XCKU115的半高PCIe x8硬件加速卡

基于Xilinx XCKU115的半高PCIe x8 硬件加速卡北京太速科技有限公司一、概述本板卡系我公司自主研发，采用Xilinx公司的XCKU115-3-FLVF1924-E芯片作为主处理器

2018-08-22 17:31:55

基于arm Cortex-M3处理器与深度学习加速器的实时人脸口罩检测SoC设计方案

CMSDK工具设计了AHB总线系统，在基于单级AHB总线的框架下，通过APB桥接器和AXI桥接器扩展了APB总线和AXI总线，进而构成该SoC高效的总线框架。通过搭建高效的总线系统将M3处理器与硬件加速器

2022-08-26 15:23:33

如何充分利用数字信号处理器上的片内FIR和IIR硬件加速器？

上的片内FIR和IIR硬件加速器也分别称为FIRA和IIRA，我们可以利用这些硬件加速器来分担FIR和IIR处理任务，让内核去执行其他处理任务。在本文中，我们将借助不同的使用模型以及实时测试示例来探讨如何在实践中利用这些加速器。

2020-12-28 06:26:54

如何用ARM处理器加速遵循安全至上的规范?

运用ARM处理器系列软件工具可加速遵循安全至上的规范ARM处理器逐渐拓展应用

2021-02-24 06:35:28

工业应用理想选择多核处理器

嵌入式处理器所实现的网络访问。虽然目前嵌入式处理器已经能够完美地应用于多种工业应用，但Sitara AM57x处理器所提供的视频与图形加速器使其在人机界面（HMI）的应用中大发异彩。ARM

2018-09-04 10:07:50

找不到3d硬件加速器怎么办

--高级--疑难解答中的硬件加速是否完全开启。　　3、如果是游戏不能玩了。显示属性--设置--高级--适配器--列出所有模式，将该项的数据设置的比平时稍低一些。也就是降低刷新率及分辨率。　　3d硬件加速器

2019-08-21 09:04:31

整合双ARM内核和DDR3内存接口的嵌入式处理器

与硬件加速器和 I/O模块的一致性能够提高数据吞吐量以及简化软件开发过程。加速器一致性端口（ACP）结合芯片的NoC路由功能，可满足硬件加速和I/O性能的最新应用需求。ECC（错误校验码）保护功能可防止

2018-12-12 10:20:29

无法导入硬件加速器

嗨！我已经创建了一个硬件加速器（在vhdl中）并且合成成功完成。但是，当我使用创建和导入外围设备向导时，它向我显示我的包在库中不可用，尽管它是。我能做什么？？？L'enfer，c'est l

2019-02-27 14:15:31

机器学习实战：GNN加速器的FPGA解决方案

，但是矩阵的计算量非常大。基于以上分析，我们决定在GNN Core加速器设计中用两种不同的硬件结构来处理聚合操作与合并操作，功能框图如下图所示：图7: GNN Core功能框图聚合器

2020-10-20 09:48:39

汽车信息娱乐系统嵌入式设计方案

作为汽车半导体的领军企业飞思卡尔联合Khronos Group 推出了一款集成了OpenVG硬件加速器的汽车多媒体嵌入式微处理器i.MX35，成为全球首款集成OpenVG硬件加速器的汽车多媒体

2019-07-22 08:11:07

电脑的处理器可以更改吗？处理器是硬件吗？

电脑的处理器可以更改吗？处理器是硬件吗？还是芯片？

2023-03-15 10:26:13

英特尔媒体加速器参考软件Linux版用户指南

英特尔媒体加速器参考软件是用于数字标志、交互式白板(IWBs)和亭位使用模型的参考媒体播放器应用软件,它利用固定功能硬件加速来提高媒体流速、改进工作量平衡和资源利用,以及定制的图形处理股(GPU)管道解决方案。该用户指南将介绍和解释如何为Linux* 使用英特尔媒体加速器参考软件。

2023-08-04 06:34:54

请教达芬奇系列产品的一些概念问题：hdvicp 高清视频协处理器视频加速器视频处理前端视频编解码器

你好，学习达芬奇系列的产品有一段时间了，对一些概念不是很清楚，想咨询下大家。1、视频解码器是指TVP5158 吗，和视频加速器是一个东西还是加速器属于独立的模块.2、hdvicp 高清视频协处理器

2018-07-27 06:23:52

请问66ak系列芯片加密加速器的调用？在程序设计中如何调用此加速器？

本帖最后由一只耳朵怪于 2018-6-19 10:42 编辑请问，在66ak系列有加密加速器，现在的项目需要此功能，请问，在程序设计中如何调用此加速器？采用pdk平台，openmpacc开发。

2018-06-19 05:53:08

请问c6670中bcp硬件加速器的下行thoughput值在什么范围

在ti的Thoughput performance guid的文档中看到了bcp加速器上行的Thoughput在240-500Mbps范围内，请问下行的Thoughput值大概在什么范围？

2018-12-26 14:04:28

请问c6670中多核怎样同时正确使用bcp加速器？

本帖最后由一只耳朵怪于 2018-6-19 14:25 编辑在C6670中，因只有一个bcp硬件加速器，不同核所来数据怎样同时运行起来而不发生一个核经常抢占BCP加速器，导致其它核数据

2018-06-19 00:42:40

调节多核处理器硬件适应软件设计方法

;CPE_DATA_MEM_SIZE_KB 8　　使用减负器来加快处理速度　　第四个问题和创建硬件加速器有关。可能有一部分程序会占用太多的周期。要减少周期就需要更多的处理器，而使用硬件加速器就能

2008-09-25 17:17:55

采用控制律加速器的Piccolo MCU

日前，德州仪器 (TI) 宣布推出采用控制律加速器 (CLA) 的新型 TMS320F2803x Piccolo 微处理器 (MCU)，可促进具有更高可靠性与效率的嵌入式控制应用的开发。CLA

2019-07-26 06:21:46

问下ARM3的硬件加速器只能用verilog写吗？

问下ARM3的硬件加速器只能用verilog写吗？

2022-09-30 10:45:39

高速数据转换器与基带处理器连接的宽带接收器系统设计

减轻计算密集型 2D FFT 运算负载的 FFTC 硬件加速器，可实现低延迟和高精度附加了 JESD 的宽带采样信号处理解决方案，包含数字信号处理器 (DSP)、ADC 和 DAC 板、演示软件、配置

2018-09-20 09:07:06

#硬声创作季云计算从入门到精通：2.8、【Docker系列】配置加速器

加速器Docker

Mr_haohao发布于 2022-10-15 14:03:32

#硬声创作季电子制作：磁性加速器

加速器DIY

Mr_haohao发布于 2022-10-19 00:19:38

采用硬件加速发挥MicroBlaze处理能力

采用硬件加速发挥MicroBlaze处理能力　　MicroBlaze处理器是赛灵思(Xilinx)在嵌入式开发套件 (EDK) 中提供的两款32位内核之一，是实现硬件加速的灵活工具。图1是MicroBlaze的

2010-03-10 10:24:16

1132

加速处理器的正弦函数计算步骤

有很多种算法可对单精度浮点数字的正弦值进行计算，但添加硬件加速器是功能最为强大的方法之一。之所以得出这一结论，是因为客户的应用要求使用此类正弦计算，而我们又针对能

2011-08-31 15:36:46

基于FPGA Nios-Ⅱ的矩阵运算硬件加速器设计

针对复杂算法中矩阵运算量大, 计算复杂, 耗时多, 制约算法在线计算性能的问题, 从硬件实现角度, 研究基于FPGA/Nios-Ⅱ的矩阵运算硬件加速器设计, 实现矩阵并行计算。首先根据矩阵运算

2011-12-06 17:30:41

Nios II C语言至硬件加速编译器

电子发烧友网核心提示: 获奖的Nios II 嵌入式处理器C语言至硬件（C2H）加速编译器将对时间要求较高的ANSI C函数转换为FPGA中的硬件加速器，从而提高了性能。特性： (1)ANSI/ISO C 代码按键

2012-10-17 14:29:34

1901

Bitfusion支持通过云访问基于赛灵思All Programmable器件的FPGA硬件加速功能

硬件加速功能不谋而合，Bitfusion 正在开发基于赛灵思 Kintex UltraScale 器件的硬件加速器，并将提供基于 SDAccel 等赛灵思工具的云开发工具，作为为高性能计算（HPC

2017-02-08 19:48:30

238

UVM验证平台执行硬件加速

UVM已经成为了一种高效率的、从模块级到系统级完整验证环境开发标准，其中一个关键的原则是UVM可以开发出可重用的验证组件。获得重用动力的一个方面表现为标准的仿真器和硬件加速之间的验证组件和环境的复用

2017-09-15 17:08:11

硬件加速边缘检测优化处理方案

针对计算机处理高清图像或视频的边缘检测时存在延时长和数据存储带宽受限的缺点，提出了用Vivado HLS将边缘检测软件代码转换成RTL级硬件电路的硬件加速方法。硬件加速是将运算量大的功能模块由硬件

2017-11-15 18:02:01

1874

利用硬件加速器提高处理器的性能

处理器内部集成的硬件加速器可以实现三种广泛使用的信号处理操作：FIR(有限冲激响应)、IIR(无限冲激响应)和FFT(快速傅里叶变换)。硬件加速器减轻了核处理器的负担，能潜在的提升处理器的计算吞吐

2017-12-04 15:22:36

1036

MD5算法硬件加速模型

验证、分析。相比非流水线硬件加速模型，流水线硬件加速模型能提高MD5运算效率5倍，可用于网络处理器等硬件加密引擎，有效提高网络处理器等硬件设备的安全性和处理效率。

2018-01-12 16:45:07

Veloce仿真环境下的SoC端到端硬件加速器功能验证

很多人认为硬件加速器无非是一种速度更快的仿真器而已。毫无疑问，由于硬件加速器使用物理硬件进行仿真，使用硬件加速器验证复杂的集成电路和大型片上系统（SoC）能比软件仿真器快若干数量级。与仿真用通用计算机相比，仿真用单一功能计算机能提供更高容量、更高效的系统。

2018-03-28 14:50:00

3160

利用硬件加速器提高仿真速度时的验证平台考虑

个设计时钟的速度运行相关设计。硬件加速器的运行速度则是每秒lM左右个时钟，因此可以将原始性能提高1000倍。原始性能相当于硬件加速器在无需等待验证平台或外部事件的条件下自由运行时的性能。验证平台对硬件加速性能影响很大。

2018-03-05 10:13:13

斯坦福机器学习硬件加速器的课程学芯片技术机会来了

学芯片技术的机会来了！斯坦福大学2018秋季学期推出《机器学习硬件加速器》课程，深入介绍机器学习系统中设计训练和推理加速器的架构技术。课程涵盖经典的ML算法，用于ML模型推理和训练的加速器设计等，超多专业材料和PPT，是本领域不可多得的专业课程。

2018-07-21 09:27:10

5663

使用协处理器加速器的方法介绍

了解协处理的价值，Zynq-7000加速器一致性端口，使用协处理器加速器的方法以及协处理器设计实例的概述。

2018-11-30 06:15:00

3960

基于Xilinx FPGA的Memcached硬件加速器的介绍

本教程讨论基于Xilinx FPGA的Memcached硬件加速器的技术细节，该硬件加速器可为10G以太网端口提供线速Memcached服务。

2018-11-27 06:41:00

3433

毫米波传感器1443硬件加速器的简单介绍

2.6 mmWave波形传感器简介1443硬件加速器

2019-05-08 06:20:00

2982

分享硬件加速仿真的 11 个谬论介绍和说明

硬件加速仿真可以实现寄存器传输级(RTL)和现代SoC设计门级的最佳功耗分析。只有硬件加速仿真才有处理大量逻辑以及产生针对所有元素的切换活动的独有能力。

2019-10-11 17:54:29

4550

如何将硬件加速器关闭？

硬件加速是指在计算机中通过把计算量非常大的工作分配给专门的硬件来处理以减轻中央处理器的工作量之技术。尤其是在图像处理中这个技术经常被使用。

2019-08-15 15:29:35

6839

硬件加速器提升下一代SHARC处理器的性能

硬件加速器提升下一代SHARC处理器的性能

2021-04-23 13:06:32

基于RISC-V处理器和卷积加速器的SoC系统

卷积计算的效率。基于软硬件协同设计思想，构建包含RISCⅤ处理器和卷积加速器的SoC系统，RISC-V处理器基于开源的指令集标准，可以根据具体的设计需求扩展指令功能。将该SoC系统部署在 Xilinx ZCU102开发板上ISC-V处理器和卷积加速器分别工作在100M

2021-06-02 15:08:22

第七届硬创大赛与中城智能硬件加速器达成战略合作，推动智能硬件创新发展

日前，中国硬件创新创客大赛组委会与中城智能硬件加速器正式达成战略合作伙伴关系。中城智能硬件加速器天集社是2020年入选工信部中小企业服务平台和国家级科技企业孵化器，链接全球硬件创新者建立

2021-07-15 15:18:02

2961

2021华为开发者大会华秋电子OpenHarmony新硬件加速器

今天的2021华为开发者大会上，OpenHarmony分论坛上展示了华秋电子OpenHarmony新硬件加速器。 HDC分论坛-OpenHarmony 分论坛推荐链接：http://t.elecfans.com/live/1708.html 责任编辑：haq

2021-10-23 15:43:42

1125

OpenHarmony 分论坛-华秋电子新硬件加速器

OpenHarmony 分论坛-华秋电子新硬件加速器 今天的华为开发者大会2021上，OpenHarmony分论坛上展示了华秋电子新硬件加速器 。 HDC分论坛-OpenHarmony 分论坛推荐链接：http://t.elecfans.com/live/1708.html 责任编辑：haq

2021-10-23 16:53:48

1500

OpenHarmony Dev-Board-SIG专场：OpenHarmony 新硬件加速器

OpenHarmony Dev-Board-SIG专场：OpenHarmony 新硬件加速器

2021-12-28 15:12:30

1104

什么是AI加速器如何确需要AI加速器

AI加速器是一类专门的硬件加速器或计算机系统旨在加速人工智能的应用，主要应用于人工智能、人工神经网络、机器视觉和机器学习。

2022-02-06 12:47:00

3645

如何利用不同的加速器使用模型实现所需的MIPS和处理目标

2022-05-05 14:08:16

1034

基于CORTEX-M3硬件加速的目标跟踪锁定系统

本项目采用Cortex-M3软核做控制部分，大规模专用硬件加速器做滤波跟踪计算和智能目标检测部分，视频输入输出通过HDMI直接进入硬件加速器，绕过软核实现更快的数据处理速度。

2022-05-16 10:04:26

959

全新ROS 2 Humble硬件加速特性

自 2021 年 10 月起，NVIDIA 和 Open Robotics 开始合作并推出了两项重要的改动，现已发布在Humble ROS 2版本中，以提高提供硬件加速器的计算平台的性能。

2022-07-07 09:45:07

2471

如何确定一个硬件加速应用

在开发一个加速程序的之前，有一个很重要的步骤：正确设计程序架构。开发人员需要明确软件应用程序中哪一部分是需要硬件加速的，并且它多少的并行量，以保证硬件加速器件（FPGA）能完美发挥其作用。本文将分为5个步骤来介绍

2022-08-02 10:33:07

386

用于 AI 应用的硬件加速器设计师指南

当 AI 设计人员将硬件加速器整合到用于训练和推理应用的定制芯片中时，应考虑以下四个因素

2022-08-19 11:35:55

1267

为什么石墨烯在低温下的特性使量子计算越来越可行

　　有一些处理任务的示例已由专用硬件处理。例如，图形处理通过用于图像处理和显示渲染的专用芯片加速。然而，研究人员预计，与传统的硬件加速器相比，量子计算机的使用方式将大不相同。通过一个简单的比较，我们可以认为量子计算机优于当今带有硬件加速器的多核处理器，就像现代PC优于基于阀门的计算机一样。

2022-11-22 11:42:40

417

利用数字信号处理器上的片上FIR和IIR硬件加速器

处理器上的片上FIR和IIR硬件加速器（也称为FIRA和IIRA）可用于卸载FIR和IIR处理任务，从而腾出内核用于其他处理。在本文中，我们将讨论如何借助经过测试的实时示例说明的不同使用模型在实践中使用这些加速器。

2022-12-20 11:22:36

855

利用数字信号处理器上的片上FIR和IIR硬件加速器

2022-12-20 11:39:25

782

借助硬件加速器开发您的设计

借助硬件加速器开发您的设计

2023-01-03 09:45:15

594

硬件加速器提升下一代SHARC处理器的性能

SHARC ADSP-2146x处理器集成了硬件加速器，可实现三种广泛使用的信号处理操作：FIR（有限脉冲响应）、IIR（无限脉冲响应）和FFT（快速傅里叶变换）。加速器卸载了核心处理器，并有可能使处理器的计算吞吐量增加一倍以上。本文以加速器在下一代音频系统中的应用为例。®

2023-03-03 14:46:51

761