基于FPGA的边缘设备开发深度神经网络检测程序

机器学习是使用算法解析数据，从中学习，然后做出决策或预测的过程。机器不是准备程序代码来完成任务，而是使用大量数据和算法“训练”以自行执行任务。

机器学习正在使用神经网络（NN）算法发生革命性变化，神经网络算法是我们大脑中发现的生物神经元的数字模型。这些模型包含像大脑神经元一样连接的层。许多应用程序都受益于机器学习，包括图像分类/识别、大数据模式检测、ADAS、欺诈检测、食品质量保证和财务预测。

作为机器学习的算法，神经网络包括由多个层组成的广泛的拓扑结构和大小；第一层（“输入层”）、中间层（“隐藏层”）和最后一层（“输出层”）。隐藏层对输入执行各种专用任务并将其传递到下一层，直到在输出层生成预测。

一些神经网络相对简单，只有两层或三层神经元，而所谓的深度神经网络（DNN）可能包含多达 1000 层。为特定任务确定正确的 NN 拓扑和大小需要与类似网络进行实验和比较。

设计高性能机器学习应用程序需要网络优化，这通常使用修剪和量化技术完成，以及计算加速，使用 ASIC 或 FPGA 执行。

在本文中，我们将讨论 DNN 的工作原理、为什么 FPGA 在 DNN 推理中越来越受欢迎，并考虑使用 FPGA 开始设计和实现基于深度学习的应用程序所需的工具。

开发 DNN 应用程序的设计流程

设计 DNN 应用程序是一个三步过程。这些步骤是选择正确的网络，训练网络，然后将新数据应用于训练模型进行预测（推理）。

如前所述，DNN 模型中有多个层，每一层都有特定的任务。在深度学习中，每一层都旨在提取不同层次的特征。例如，在边缘检测神经网络中，第一个中间层检测边缘和曲线等特征。然后将第一个中间层的输出馈送到第二层，第二层负责检测更高级别的特征，例如半圆或正方形。第三个中间层组装其他层的输出以创建熟悉的对象，最后一层检测对象。

在另一个示例中，如果我们开始识别停车标志，则经过训练的系统将包括用于检测八边形形状、颜色以及其中的字母“S”、“T”、“O”和“P”的层秩序和孤立。输出层将负责确定它是否是停车标志。

DNN 学习模型

有四种主要的学习模型：

监督：在这个模型中，所有的训练数据都被标记了。NN 将输入数据分类为从训练数据集中学习的不同标签。

无监督：在无监督学习中，深度学习模型被交给一个数据集，而没有明确说明如何处理它。训练数据集是没有特定期望结果或正确答案的示例集合。然后，NN 会尝试通过提取有用的特征并分析其结构来自动找到数据中的结构。

半监督：这包括带有标记和未标记数据的训练数据集。这种方法在难以从数据中提取相关特征时特别有用，并且标记示例对于专家来说是一项耗时的任务。

强化：这是奖励网络以获得结果并提高性能的行为。这是一个迭代过程：反馈的轮次越多，网络就越好。这种技术对于训练机器人特别有用，机器人会在诸如驾驶自动驾驶汽车或管理仓库库存等任务中做出一系列决策。

训练与推理

在训练中，未经训练的神经网络模型从现有数据中学习新的能力。一旦训练好的模型准备好，它就会被输入新数据并测量系统的性能。正确检测图像的比率称为推理。

在图 1 给出的示例中（识别猫），在输入训练数据集后，DNN 开始调整权重以寻找猫；其中权重是每个神经元之间连接强度的度量。

如果结果错误，错误将被传播回网络层以修改权重。这个过程一次又一次地发生，直到它得到正确的权重，这导致每次都得到正确的答案。

如何实现高性能 DNN 应用

使用 DNN 进行分类需要大数据集，从而提高准确性。然而，一个缺点是它为模型产生了许多参数，这增加了计算成本并且需要高内存带宽。

优化 DNN 应用程序有两种主要方法。首先是通过修剪冗余连接和量化权重并融合神经网络来缩小网络规模的网络优化。

修剪：这是 DNN 压缩的一种形式。它减少了与其他神经元的突触连接数，从而减少了数据总量。通常，接近零的权重会被移除。对于分类［2］等任务，这有助于消除冗余连接，但精度会略有下降。

量化：这样做是为了使神经网络达到合理的大小，同时实现高性能的准确性。这对于内存大小和计算数量必然受到限制的边缘应用程序尤其重要。在此类应用中，为了获得更好的性能，模型参数保存在本地内存中，以避免使用 PCIe 或其他互连接口进行耗时的传输。在该方法中，执行通过低位宽数的神经网络（INT8）来逼近使用浮点数的神经网络（FTP32）的过程。这极大地降低了使用神经网络的内存需求和计算成本。通过量化模型，我们稍微损失了精度和准确度。但是，对于大多数应用程序来说，不需要 32 位浮点。

优化 DNN 的第二种方法是通过计算加速，使用 ASIC 或 FPGA。其中，后一种选择对机器学习应用程序有很多好处。这些包括：

电源效率： FPGA 提供了一种灵活且可定制的架构，它只允许使用我们需要的计算资源。在 ADAS 等许多应用中，为 DNN 配备低功耗系统至关重要。

可重构性：与 ASIC 相比，FPGA 被认为是原始可编程硬件。此功能使它们易于使用，并显着缩短了上市时间。为了赶上每天发展的机器学习算法，拥有对系统重新编程的能力是非常有益的，而不是等待 SoC 和 ASIC 的长时间制造。

低延迟：与最快的片外存储器相比，FPGA 内部的 Block RAM 提供的数据传输速度至少快 50 倍。这是机器学习应用程序的游戏规则改变者，低延迟是必不可少的。

性能可移植性：您无需任何代码修改或回归测试即可获得下一代 FPGA 设备的所有优势。

灵活性： FPGA 是原始硬件，可以针对任何架构进行配置。没有固定的架构或数据路径可以束缚您。这种灵活性使 FPGA 能够进行大规模并行处理，因为数据路径可以随时重新配置。灵活性还带来了任意对任意 I/O 连接能力。这使 FPGA 无需主机 CPU 即可连接到任何设备、网络或存储设备。

功能安全：： FPGA 用户可以在硬件中实现任何安全功能。根据应用程序，可以高效地进行编码。FPGA 广泛用于航空电子设备、自动化和安全领域，这证明了这些设备的功能安全性，机器学习算法可以从中受益。

成本效率： FPGA 是可重新配置的，应用程序的上市时间非常短。ASIC 非常昂贵，如果没有出现错误，制造时间需要 6 到 12 个月。这是机器学习应用程序的一个优势，因为成本非常重要，而且 NN 算法每天都在发展。

现代 FPGA 通常在其架构中提供一组丰富的 DSP 和 BRAM 资源，可用于 NN 处理。但是，与 DNN 的深度和层大小相比，这些资源已不足以进行完整和直接的映射；当然不会像前几代神经网络加速器中经常使用的那样。即使使用像 Zynq MPSoC 这样的设备（即使是最大的设备也仅限于 2k DSP 片和总 BRAM 大小小于 10 MB），将所有神经元和权重直接映射到 FPGA 上也是不可能的。

那么，我们如何利用 FPGA 的功率效率、可重编程性、低延迟等特性进行深度学习呢？

需要新的 NN 算法和架构修改才能在 FPGA 等内存资源有限的平台上进行 DNN 推理。

现代 DNN 将应用程序分成更小的块，由 FPGA 处理。由于 FPGA 中的片上存储器不足以存储网络所需的所有权重，我们只需要存储当前阶段的权重和参数，它们是从外部存储器（可能是 DDR 存储器）加载的。

然而，在 FPGA 和内存之间来回传输数据将使延迟增加多达 50 倍。首先想到的是减少内存数据。除了上面讨论的网络优化（剪枝和量化）之外，还有：

权重编码：在FPGA中，编码格式可以随意选择。可能会有一些准确性损失，但是与数据传输引起的延迟及其处理的复杂性相比，这可以忽略不计。权重编码创建了二元神经网络（BNN），其中权重减少到只有一位。这种方法减少了传输和存储的数据量，以及计算复杂度。然而，这种方法只会导致具有固定输入宽度的硬件乘法器的小幅减少。

批处理：在这种方法中，我们使用流水线方法将芯片上已有的权重用于多个输入。它还减少了从片外存储器传输到 FPGA ［5］的数据量。

在 FPGA 上设计和实现 DNN 应用

让我们深入研究在 FPGA 上实现 DNN。在此过程中，我们将利用最合适的商用解决方案来快速跟踪应用程序的开发。

例如，Aldec 有一个名为TySOM-3A-ZU19EG的嵌入式开发板。除了广泛的外设，它还搭载 Xilinx Zynq UltraScale+ MPSoC 系列中最大的 FPGA，该器件具有超过一百万个逻辑单元，并包括一个运行频率高达 1.5GHz 的四核 Arm Cortex-A53 处理器。

重要的是，就我们的目的而言，这款庞大的 MPSoC 还支持赛灵思为机器学习开发人员创建的深度学习处理单元（DPU）。

DPU 是专用于卷积神经网络（CNN）处理的可编程引擎。它旨在加速计算机视觉应用中使用的 DNN 算法的计算工作量，例如图像/视频分类和对象跟踪/检测。

DPU 有一个特定的指令集，使其能够有效地与许多 CNN 一起工作。与常规处理器一样，DPU 获取、解码和执行存储在 DDR 内存中的指令。该单元支持多种 CNN，如 VGG、ResNet、GoogLeNet、YOLO、SSD、MobileNet、FPN 等［3］。

DPU IP 可以作为一个块集成到所选 Zynq®-7000 SoC 和 Zynq UltraScale™+ MPSoC 器件的可编程逻辑（PL）中，并直接连接到处理系统（PS）。

为了创建 DPU 的说明，Xilinx 提供了深度神经网络开发套件（DNNDK）工具包。赛灵思声明：

DNNDK 被设计为一个集成框架，旨在简化和加速深度学习处理器单元（DPU）上的深度学习应用程序开发和部署。DNNDK是一个优化推理引擎，它使DPU的计算能力变得容易获得。它为开发深度学习应用程序提供了最佳的简单性和生产力，涵盖了神经网络模型压缩、编程、编译和运行时启用［4］的各个阶段。

DNNDK 框架包括以下单元：

DECENT：执行剪枝和量化以满足低延迟和高吞吐量

DNNC：将神经网络算法映射到 DPU 指令

DNNAS：将 DPU 指令组装成 ELF 二进制代码

N 2 Cube：充当 DNNDK 应用程序的加载器，处理资源分配和 DPU 调度。其核心组件包括 DPU 驱动程序、DPU 加载程序、跟踪器和用于应用程序开发的编程 API。

Profiler：由 DPU 跟踪器和 DSight 组成。D 跟踪器在 DPU 上运行 NN 时收集原始分析数据。DSight 使用此数据生成可视化图表以进行性能分析。

Dexplorer：为 DPU 提供运行模式配置、状态检查和代码签名检查。

DDump：转储 DPU ELF、混合可执行文件或 DPU 共享库中的信息。它加速了用户的调试和分析。

这些符合图 2 所示的流程。

图 2.上述深度神经网络开发套件（DNNK）框架使基于 FPGA 的机器学习项目的设计过程对开发人员来说更加容易。

使用 DNNDK 可以让开发人员更轻松地设计基于 FPGA 的机器学习项目；此外，Aldec 的 TySOM-3A-ZU19EG 板等平台也可提供宝贵的启动功能。例如，Aldec 准备了一些针对板的示例——包括手势检测、行人检测、分割和交通检测——这意味着开发人员不是从一张白纸开始的。

让我们考虑一下今年早些时候在 Arm TechCon 上展示的一个演示。这是使用 TySOM-3A-ZU19EG 和 FMC-ADAS 子卡构建的交通检测演示，该子卡为 5 倍高速数据（HSD）摄像头、雷达、激光雷达和超声波传感器提供接口和外围设备——大多数人的感官输入ADAS 应用程序。

图 3 显示了演示的架构。FPGA 中实现了两个 DPU，它们通过 AXI HP 端口连接到处理单元，以执行深度学习推理任务，例如图像分类、对象检测和语义分割。DPU 需要指令来实现由 DNNC 和 DNNAS 工具准备的神经网络。他们还需要访问输入视频和输出数据的内存位置。

图 3. 流量检测演示具有 5 个视频输入管道，用于数据打包、AXI4 到 AXI 流数据传输、色彩空间转换（YUV2RGB）以及将视频发送到内存。

应用程序在应用程序处理单元（APU）上运行，以通过管理中断和执行单元之间的数据传输来控制系统。DPU 和用户应用程序之间的连接是通过 DPU API 和 Linux 驱动程序实现的。有一些功能可以将新图像/视频读取到 DPU、运行处理并将输出发送回用户应用程序。

开发和训练模型是使用 FPGA 之外的 Caffe 完成的，而优化和编译是使用作为 DNNDK 工具包的一部分提供的 DECENT 和 DNNC 单元完成的（图 2）。在本设计中，SSD 对象检测 CNN 用于背景、行人和车辆检测。

在性能方面，使用四个输入通道实现了 45 fps，展示了使用 TySOM-3A-ZU19EG 和 DNNDK 工具包的高性能深度学习应用程序。

审核编辑：郭婷

阅读全文

FPGA(591969) FPGA(591969)
机器学习(130422) 机器学习(130422)
深度学习(119797) 深度学习(119797)

神经网络信号对故障电池检测方法深度分析

本文主要以锂电池组为研究对象，通过LSTM神经网络以及深度学习等科学方法对锂电池的故障信号进行相关的检测与研究。对LSTM神经网络设计的结构、规模、计算速率以及输出参数等进行介绍，构建检测基本模型。

2022-10-01 06:33:00

989

详解深度学习、神经网络与卷积神经网络的应用

在如今的网络时代，错综复杂的大数据和网络环境，让传统信息处理理论、人工智能与人工神经网络都面临巨大的挑战。近些年，深度学习逐渐走进人们的视线，通过深度学习解决若干问题的案例越来越多。一些传统的图像

2024-01-11 10:51:32

596

FPGA在深度学习应用中或将取代GPU

系统等其他行业也面临着类似的挑战。 FPGA 和深度学习 FPGA 是可定制的硬件设备，可对其组件进行调节，因此可以针对特定类型的架构 (如卷积神经网络) 进行优化。其可定制性特征降低了对电力的需求

2024-03-21 15:19:45

深度神经网络是什么

多层感知机深度神经网络in collaboration with Hsu Chung Chuan, Lin Min Htoo, and Quah Jia Yong. 与许忠传，林敏涛和华佳勇合作

2021-07-12 06:35:22

神经网络Matlab程序

神经网络Matlab程序

2009-09-15 12:52:24

神经网络和反向传播算法

03_深度学习入门_神经网络和反向传播算法

2019-09-12 07:08:05

神经网络基本介绍

神经网络基本介绍

2018-01-04 13:41:23

神经网络教程（李亚非）

网络BP算法的程序设计　　多层前向网络BP算法源程序　　第4章 Hopfield网络模型　　4.1 离散型Hopfield神经网络　　4.2 连续型Hopfield神经网络　　Hopfield网络模型

2012-03-20 11:32:43

神经网络移植到STM32的方法

将神经网络移植到STM32最近在做的一个项目需要用到网络进行拟合，并且将拟合得到的结果用作控制，就在想能不能直接在单片机上做神经网络计算，这样就可以实时计算，不依赖于上位机。所以要解决的主要是两个

2022-01-11 06:20:53

神经网络简介

神经网络简介

2012-08-05 21:01:08

神经网络系统辨识程序

神经网络系统辨识程序

2018-01-04 13:29:33

神经网络解决方案让自动驾驶成为现实

制造业而言，深度学习神经网络开辟了令人兴奋的研究途径。为了实现从诸如高速公路全程自动驾驶仪的短时辅助模式到专职无人驾驶旅行的自动驾驶，汽车制造业一直在寻求让响应速度更快、识别准确度更高的方法，而深度

2017-12-21 17:11:34

神经网络资料

基于深度学习的神经网络算法

2019-05-16 17:25:05

边缘计算的相关资料推荐

面向边缘计算的嵌入式FPGA平台卷积神经网络的构建通过设计卷积神经网络函数中的网络层间可复用的加速器核心以减少硬件资源实现性能优化卷积神经网络硬件。边缘计算：克服云计算固有的问题，将应用、数据

2021-12-23 07:26:12

CMSIS-NN神经网络内核助力微控制器效率提升

目前，在许多需要在本地进行数据分析的“永远在线”的物联网边缘设备中，神经网络正在变得越来越普及，主要是因为可以有效地同时减少数据传输导致的延时和功耗。而谈到针对物联网边缘设备上的神经网络，我们

2019-07-23 08:08:59

ETPU-Z2全可编程神经网络开发平台

TPU神经网络加速器开发流程 EEP-TPU的开发流程与传统的嵌入式开发流程类似，拥有Host（主机）和Device（从机）两类设备。ETPU的开发流程通常也被分为两部分：神经网络算法开发流程

2020-05-18 17:13:24

EdgeBoard中神经网络算子在FPGA中的实现方法是什么？

FPGA加速的关键因素是什么？EdgeBoard中神经网络算子在FPGA中的实现方法是什么？

2021-09-28 06:37:44

MATLAB神经网络

2013-07-08 15:17:13

labview BP神经网络的实现

请问：我在用labview做BP神经网络实现故障诊断，在NI官网找到了机器学习工具包（MLT），但是里面没有关于这部分VI的帮助文档，对于”BP神经网络分类“这个范例有很多不懂的地方，比如

2017-02-22 16:08:08

【PYNQ-Z2申请】基于PYNQ-Z2的神经网络图形识别

的神经网络编程，想基于此开发板，进行神经网络的学习，训练和测试神经网络。项目计划：1.基于官方的文档及资料，熟悉此开发板。2.测试官方demo，学习ARM内核和FPGA如何协调工作。3.基于自己最近

2019-01-09 14:48:59

【PYNQ-Z2申请】基于PYNQ的神经网络自动驾驶小车

项目名称：基于PYNQ的神经网络自动驾驶小车试用计划：一、本人技术背景本人有四年以上的嵌入式开发和三年以上的机器视觉领域项目实践经验，在计算机视觉与FPGA数字图像处理方面有较多的理论研究与项目实践

2018-12-19 11:36:24

【PYNQ-Z2申请】基于PYNQ的卷积神经网络加速

，得到训练参数2、利用开发板arm与FPGA联合的特性，在arm端实现图像预处理已经卷积核神经网络的池化、激活函数和全连接，在FPGA端实现卷积运算3、对整个系统进行调试。4、在基本实现系统的基础上

2018-12-19 11:37:22

【PYNQ-Z2试用体验】神经网络基础知识

前言前面我们通过notebook，完成了在PYNQ-Z2开发板上编写并运行python程序。我们的最终目的是基于神经网络，完成手写的数字识别。在这之前，有必要讲一下神经网络的基本概念和工作原理。何为

2019-03-03 22:10:19

【PYNQ-Z2试用体验】基于PYNQ的神经网络自动驾驶小车 - 项目规划

，神经网络技术的第三次发展浪潮仍在继续，在其背后，高性能CPU、GPU和FPGA、ASIC以强大的算力为技术的应用落地提供了有力的支持。然而目前基于FPGA平台搭建神经网络作为控制器，适合我们自己动手实现

2019-03-02 23:10:52

【专辑精选】人工智能之神经网络教程与资料

电子发烧友总结了以“神经网络”为主题的精选干货，今后每天一个主题为一期，希望对各位有所帮助！（点击标题即可进入页面下载相关资料）人工神经网络算法的学习方法与应用实例（pdf彩版）卷积神经网络入门资料MATLAB神经网络30个案例分析《matlab神经网络应用设计》深度学习和神经网络

2019-05-07 19:18:14

【案例分享】ART神经网络与SOM神经网络

今天学习了两个神经网络，分别是自适应谐振（ART）神经网络与自组织映射（SOM）神经网络。整体感觉不是很难，只不过一些最基础的概念容易理解不清。首先ART神经网络是竞争学习的一个代表，竞争型学习

2019-07-21 04:30:00

人工神经网络原理及下载

人工神经网络是根据人的认识过程而开发出的一种算法。假如我们现在只有一些输入和相应的输出，而对如何由输入得到输出的机理并不清楚，那么我们可以把输入与输出之间的未知过程看成是一个“网络”，通过不断地给

2008-06-19 14:40:42

人工神经网络实现方法有哪些？

人工神经网络(Artificial Neural Network，ANN)是一种类似生物神经网络的信息处理结构，它的提出是为了解决一些非线性，非平稳，复杂的实际问题。那有哪些办法能实现人工神经网络呢？

2019-08-01 08:06:21

什么是深度学习？使用FPGA进行深度学习的好处？

) 来解决更复杂的问题，深度神经网络是一种将这些问题多层连接起来的更深层网络。这称为深度学习。目前，深度学习被用于现实世界中的各种场景，例如图像和语音识别、自然语言处理和异常检测，并且在某些情况下，它

2023-02-17 16:56:59

什么是LSTM神经网络

简单理解LSTM神经网络

2021-01-28 07:16:57

从AlexNet到MobileNet，带你入门深度神经网络

摘要：在2018年3月13日云栖社区，来自哈尔滨工业大学的沈俊楠分享了典型模式-深度神经网络入门。本文详细介绍了关于深度神经网络的发展历程，并详细介绍了各个阶段模型的结构及特点。哈尔滨工业大学的沈

2018-05-08 15:57:47

全连接神经网络和卷积神经网络有什么区别

全连接神经网络和卷积神经网络的区别

2019-06-06 14:21:42

卷积神经网络CNN介绍

【深度学习】卷积神经网络CNN

2020-06-14 18:55:37

卷积神经网络—深度卷积网络：实例探究及学习总结

《深度学习工程师-吴恩达》03卷积神经网络—深度卷积网络：实例探究学习总结

2020-05-22 17:15:57

卷积神经网络一维卷积的处理过程

以前的神经网络几乎都是部署在云端（服务器上），设备端采集到数据通过网络发送给服务器做inference（推理），结果再通过网络返回给设备端。如今越来越多的神经网络部署在嵌入式设备端上，即

2021-12-23 06:16:40

卷积神经网络为什么适合图像处理？

卷积神经网络为什么适合图像处理？

2022-09-08 10:23:10

卷积神经网络如何使用

卷积神经网络(CNN)究竟是什么，鉴于神经网络在工程上经历了曲折的历史，您为什么还会在意它呢? 对于这些非常中肯的问题，我们似乎可以给出相对简明的答案。

2019-07-17 07:21:50

卷积神经网络模型发展及应用

神经网络已经广泛应用于图像分类、目标检测、语义分割以及自然语言处理等领域。首先分析了典型卷积神经网络模型为提高其性能增加网络深度以及宽度的模型结构，分析了采用注意力机制进一步提升模型性能的网络结构，然后归纳

2022-08-02 10:39:39

卷积神经网络的层级结构和常用框架

　　卷积神经网络的层级结构　　卷积神经网络的常用框架

2020-12-29 06:16:44

卷积神经网络（CNN）是如何定义的？

什么是卷积神经网络？ImageNet-2010网络结构是如何构成的？有哪些基本参数？

2021-06-17 11:48:22

可分离卷积神经网络在 Cortex-M 处理器上实现关键词识别

我们可以对神经网络架构进行优化，使之适配微控制器的内存和计算限制范围，并且不会影响精度。我们将在本文中解释和探讨深度可分离卷积神经网络在 Cortex-M 处理器上实现关键词识别的潜力。关键词识别

2021-07-26 09:46:37

基于FPGA的神经网络的性能评估及局限性

FPGA实现神经网络关键问题分析基于FPGA的ANN实现方法基于FPGA的神经网络的性能评估及局限性

2021-04-30 06:58:13

基于深度神经网络的激光雷达物体识别系统

的激光雷达物体识别技术一直难以在嵌入式平台上实时运行。经纬恒润经过潜心研发，攻克了深度神经网络在嵌入式平台部署所面临的算子定制与加速、量化策略、模型压缩等难题，率先实现了高性能激光检测神经网络并成功地在嵌入式平台（德州仪TI TDA4系列）上完成部署。系统功能目前该系统：•支持接入禾赛Pandar 40和

2021-12-21 07:59:18

基于深度神经网络的激光雷达物体识别系统及其嵌入式平台部署

基于深度神经网络的激光雷达物体识别系统及其嵌入式平台部署

2021-01-04 06:26:23

基于BP神经网络的PID控制

最近在学习电机的智能控制，上周学习了基于单神经元的PID控制，这周研究基于BP神经网络的PID控制。神经网络具有任意非线性表达能力，可以通过对系统性能的学习来实现具有最佳组合的PID控制。利用BP

2021-09-07 07:43:47

基于带NNIE神经网络海思3559A方案边缘计算主板开发及接口定义

多种分类神经网络-支持 Faster R-CNN、YOLO、SSD、RFCN 、YoloV2 等多种目标检测神经网络-支持SegNet、FCN 等场景分割网络-4.0Tops 神经网络运算性能-支持完整

2020-06-20 11:32:14

基于赛灵思FPGA的卷积神经网络实现设计

FPGA 上实现卷积神经网络 (CNN)。CNN 是一类深度神经网络，在处理大规模图像识别任务以及与机器学习类似的其他问题方面已大获成功。在当前案例中,针对在 FPGA 上实现 CNN 做一个可行性研究

2019-06-19 07:24:41

如何使用stm32cube.ai部署神经网络？

如何用stm32cube.ai简化人工神经网络映射？如何使用stm32cube.ai部署神经网络？

2021-10-11 08:05:42

如何构建神经网络？

原文链接：http://tecdat.cn/?p=5725 神经网络是一种基于现有数据创建预测的计算系统。如何构建神经网络？神经网络包括：输入层：根据现有数据获取输入的层隐藏层：使用反向传播优化输入变量权重的层，以提高模型的预测能力输出层：基于输入和隐藏层的数据输出预测

2021-07-12 08:02:11

如何用ARM和FPGA搭建神经网络处理器通信方案？

某人工神经网络的FPGA处理器能够对数据进行运算处理，为了实现集数据通信、操作控制和数据处理于一体的便携式神经网络处理器，需要设计一种基于嵌入式ARM内核及现场可编程门阵列FPGA的主从结构处理系统满足要求。

2021-05-21 06:35:27

如何移植一个CNN神经网络到FPGA中？

训练一个神经网络并移植到Lattice FPGA上，通常需要开发人员既要懂软件又要懂数字电路设计，是个不容易的事。好在FPGA厂商为我们提供了许多工具和IP，我们可以在这些工具和IP的基础上做

2020-11-26 07:46:03

如何设计BP神经网络图像压缩算法？

(Digital Signal Processor)相比，现场可编程门阵列(Field Programma-ble Gate Array，FPGA)在神经网络的实现上更具优势。DSP处理器在处理时采用指令顺序执行

2019-08-08 06:11:30

怎么解决人工神经网络并行数据处理的问题

本文提出了一个基于FPGA 的信息处理的实例：一个简单的人工神经网络应用Verilog 语言描述，该数据流采用模块化的程序设计，并考虑了模块间数据传输信号同步的问题，有效地解决了人工神经网络并行数据处理的问题。

2021-05-06 07:22:07

怎么设计ARM与神经网络处理器的通信方案？

人工神经网络在很多领域得到了很好的应用，尤其是具有分布存储、并行处理、自学习、自组织以及非线性映射等特点的网络应用更加广泛。嵌入式便携设备也越来越多地得到应用，多数是基于ARM内核及现场可编程门阵列

2019-09-20 06:15:20

改善深层神经网络--超参数优化、batch正则化和程序框架学习总结

《深度学习工程师-吴恩达》02改善深层神经网络--超参数优化、batch正则化和程序框架学习总结

2020-06-16 14:52:01

有提供编写神经网络预测程序服务的吗？

有提供编写神经网络预测程序服务的吗？

2011-12-10 13:50:46

求利用LABVIEW 实现bp神经网络的程序

谁有利用LABVIEW 实现bp神经网络的程序啊（我用的版本是8.6的）

2012-11-26 14:54:59

求助地震波神经网络程序

求助地震波神经网络程序，共同交流！！

2013-05-11 08:14:19

求助基于labview的神经网络pid控制

小女子做基于labview的蒸发过程中液位的控制，想使用神经网络pid控制，请问这个控制方法可以吗？有谁会神经网络pid控制么。。。叩谢

2016-09-23 13:43:16

求助大神关于神经网络的问题

求助大神小的现在有个难题：一组车重实时数据对应一个车重的最终数值（一个一维数组输入对应输出一个数值）这其中可能经过均值、方差、去掉N个最大值、、、等等的计算我的目的就是弄清楚这个中间计算过程最近实在想不出什么好办法就打算试试神经网络 请教大神用什么神经网络好求神经网络程序

2016-07-14 13:35:44

求基于labview的BP神经网络算法的实现过程

求高手，基于labview的BP神经网络算法的实现过程，最好有程序哈，谢谢！！

2012-12-10 14:55:50

用FPGA去实现大型神经网络的设计

1、加速神经网络的必备开源项目　　到底纯FPGA适不适合这种大型神经网络的设计？这个问题其实我们不适合回答，但是FPGA厂商是的实际操作是很有权威性的，现在不论是Intel还是Xilinx都没有在

2022-10-24 16:10:50

离散小波转换（DWT）深度神经网络是什么

2018年全球第三大风力发电机制造商论文下载地址：https://arxiv.org/pdf/1902.05625v1.pdf论文代码地址：https://github.com/BinhangYuan/WaveletFCNN需要简单储备的知识离散小波转换（DWT）深度神经网络回顾离散小波变

2021-07-12 07:38:36

脉冲耦合神经网络在FPGA上的实现谁会？

脉冲耦合神经网络（PCNN）在FPGA上的实现，实现数据分类功能，有报酬。QQ470345140.

2013-08-25 09:57:14

解析深度学习：卷积神经网络原理与视觉实践

解析深度学习：卷积神经网络原理与视觉实践

2020-06-14 22:21:12

请问一下fpga加速神经网络为什么要用arm核呢

请问一下fpga加速神经网络为什么要用arm核呢？用其他的不行吗

2022-07-25 14:37:58

轻量化神经网络的相关资料下载

原文链接：【嵌入式AI部署&基础网络篇】轻量化神经网络精述--MobileNet V1-3、ShuffleNet V1-2、NasNet深度神经网络模型被广泛应用在图像分类、物体检测等机器

2021-12-14 07:35:25

针对Arm嵌入式设备优化的神经网络推理引擎

专门针对Arm嵌入式设备优化的神经网络推理引擎Tengine + HCL，不同人群的量身定制

2021-01-15 08:00:42

非局部神经网络，打造未来神经网络基本组件

`将非局部计算作为获取长时记忆的通用模块，提高神经网络性能在深度神经网络中，获取长时记忆（long-range dependency）至关重要。对于序列数据（例如语音、语言），递归运算

2018-11-12 14:52:50

人工神经网络,人工神经网络是什么意思

人工神经网络,人工神经网络是什么意思 神经网络是一门活跃的边缘性交叉学科.研究它的发展过程和前沿问题，具有重要的理论意义

2010-03-06 13:39:01

3296

一种基于深度神经网络的基音检测算法

一种基于深度神经网络的基音检测算法_曹猛

2017-01-07 19:08:43

《神经网络与深度学习》讲义

《神经网络与深度学习》讲义

2017-07-20 08:58:24

基于深度卷积神经网络的航空器目标检测与识别

针对军用机场大尺寸卫星图像中航空器检测识别的具体应用场景，建立了一套实时目标检测识别框架，将深度卷积神经网络应用到大尺寸图像中的航空器目标检测与识别任务中。首先，将目标检测的任务看成空间上独立

2017-12-01 15:55:09

NVIDIA深度神经网络加速库cuDNN软件安装教程

计基于GPU的加速库。cuDNN为深度神经网络中的标准流程提供了高度优化的实现方式，例如convolution、pooling、normalization以及activation layers的前向以及后向过程。 cuDNN只是NVIDIA深度神经网络软件开发包中的其中一种加速库。

2017-12-08 10:40:02

2094

【人工神经网络基础】为什么神经网络选择了“深度”？

由 Demi 于星期四, 2018-09-06 09:33 发表现在提到“神经网络”和“深度神经网络”，会觉得两者没有什么区别，神经网络还能不是“深度”（deep）的吗？我们常用

2018-09-06 20:48:01

556

快速了解神经网络与深度学习的教程资料免费下载

本文档的详细介绍的是快速了解神经网络与深度学习的教程资料免费下载主要内容包括了：机器学习概述，线性模型，前馈神经网络，卷积神经网络，循环神经网络，网络优化与正则化，记忆与注意力机制，无监督学习，概率图模型，玻尔兹曼机，深度信念网络，深度生成模型，深度强化学习

2019-02-11 08:00:00

Socionext成功开发了一款集成有量化深度神经网络技术的原型芯片

为提高边缘计算处理器AI处理性能并减少系统功耗，Socionext成功开发了一款集成有量化深度神经网络（DNN）技术的原型芯片，通过“YOLOv3”它能以不到5W的低功耗及30fps的速度实现了目标检测，其效率是通用GPU的10倍，可为小型、低功耗边缘计算设备提供先进的AI处理。

2020-11-04 16:27:13

1426

基于FPGA的神经网络硬件实现方法

基于FPGA的神经网络硬件实现方法说明。

2021-06-01 09:35:16

基于神经网络的图像边缘检测方案介绍

的分布更为明确；在机器人视觉领域，通过图像边缘检测技术提高机器人视觉的精度等。随着科技的发展，人们将神经网络加载进入图像检测中，但现有的神经网络还存在不少缺陷。 1.检测时间较长：ChouY等提出了一种改进的基于CNN的神经

2021-07-06 10:00:18

1759

基于神经网络的图像边缘检测方案说明

2021-07-13 15:39:42

2320

基于深度神经网络的多领域实时目标检测算法

基于深度神经网络的目标检测器不断发展，并用于多种应用，每个应用都有自己的一组要求。安全关键型的应用程序需要高精度和可靠性，而低延迟的任务需要节约资源的神经网络结构。

2022-11-04 17:27:04

1057

什么是神经网络？什么是卷积神经网络？

在介绍卷积神经网络之前，我们先回顾一下神经网络的基本知识。就目前而言，神经网络是深度学习算法的核心，我们所熟知的很多深度学习算法的背后其实都是神经网络。

2023-02-23 09:14:44

2252

浅析三种主流深度神经网络

来源：青榴实验室 1、引子深度神经网络(DNNs)最近在图像分类或语音识别等复杂机器学习任务中表现出的优异性能令人印象深刻。在本文中，我们将了解深度神经网络的基础知识和三个最流行神经网络：多层

2023-05-15 14:20:01

549

浅析三种主流深度神经网络

来源：青榴实验室1、引子深度神经网络(DNNs)最近在图像分类或语音识别等复杂机器学习任务中表现出的优异性能令人印象深刻。在本文中，我们将了解深度神经网络的基础知识和三个最流行神经网络：多层神经网络

2023-05-17 09:59:19

946

卷积神经网络原理：卷积神经网络模型和卷积神经网络算法

卷积神经网络原理：卷积神经网络模型和卷积神经网络算法卷积神经网络（Convolutional Neural Network，CNN）是一种基于深度学习的人工神经网络，是深度学习技术的重要应用之

2023-08-17 16:30:30

806

卷积神经网络和深度神经网络的优缺点卷积神经网络和深度神经网络的区别

深度神经网络是一种基于神经网络的机器学习算法，其主要特点是由多层神经元构成，可以根据数据自动调整神经元之间的权重，从而实现对大规模数据进行预测和分类。卷积神经网络是深度神经网络的一种，主要应用于图像和视频处理领域。

2023-08-21 17:07:36

1860

浅析深度神经网络压缩与加速技术

深度神经网络是深度学习的一种框架，它是一种具备至少一个隐层的神经网络。与浅层神经网络类似

2023-10-11 09:14:33

363

已全部加载完成

搜索历史

基于FPGA的边缘设备开发深度神经网络检测程序

评论