0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

3个DNN的项目介绍

FPGA技术江湖 来源:FPGA技术江湖 作者:FPGA技术江湖 2022-06-16 09:27 次阅读

介绍

深度神经网络 (DNN) 是一种人工神经网络(ANN),在输入层和输出层之间具有多层。有不同类型的神经网络,但它们基本由相同的组件组成:神经元、突触、权重、偏差和函数。这些组件的功能类似于人类大脑,可以像任何其他 ML 算法一样进行训练。

3241cbd6-ed13-11ec-ba43-dac502259ad0.png

例如,经过训练以识别狗品种的 DNN 将遍历给定的图像并计算图像中的狗是某个品种的概率。用户可以查看结果并选择网络应该显示哪些概率(超过某个阈值等)并返回建议的标签。每个数学操作都被认为是一个层,复杂的 DNN 有很多层,因此被称为“深度”网络。

324f329e-ed13-11ec-ba43-dac502259ad0.png

关于DNN、ANN、CNN区别,请看下图:

326b7cf6-ed13-11ec-ba43-dac502259ad0.png

https://blog.csdn.net/lff1208/article/details/77717149

IBM_AccDNN

https://github.com/IBM/AccDNN

AccDNN(深度神经网络加速器核心编译器)又名;DNNBuilder

项目介绍

在这个项目中,我们提出了一种新颖的解决方案,可以自动将经过 Caffe 训练的深度神经网络转换为 FPGA RTL 级别的实现,无需任何编程工作,并为用户的识别任务提供统一的 API

因此,没有任何 FPGA 编程经验的开发人员可以将他们的 FPGA 加速深度学习服务部署在数据中心或边缘设备中,仅提供他们经过训练的 Caffe 模型。该作品发表在 ICCAD'18 上,并获得了前端最佳论文奖。了解更多设计细节。请参考我们的论文(https://docs.wixstatic.com/ugd/c50250_77e06b7f02b44eacb76c05e8fbe01e08.pdf)。

转换过程

转换包括三个阶段:

首先对 Caffe 网络文件进行解析,得到网络结构。我们估计每一层的工作量以确定在 FPFA 资源约束下的并行度。

该网络中定义的每一层通过在库中实例化相应的神经层来生成一个定制的 Verilog 模块。顶层模块也是根据net文件中定义的层顺序将这些自定义实例连接在一起生成的,并且在这个阶段也生成了权重所需的片上内存。

综合生成的源文件、布线和布局,生成可执行的 FPGA 位文件。

327d5520-ed13-11ec-ba43-dac502259ad0.png

AccDNN 缺点

仅支持 Caffe 框架训练的模型。

仅支持卷积层、最大池化层、全连接层和批量归一化层。

Caffe .prototxt 中定义的网络中卷积层和全连接层的总数应少于 15 层

DNN-Hardware-Accelerator

https://github.com/ryaanluke/DNN-Hardware-Accelerator

https://github.com/gwatcha/dnn_accelerator

介绍

在本实验中,将以嵌入式 Nios II 系统为核心构建深度神经网络加速器。在本项目中还将学习如何与片外 SDRAM 连接,以及如何使用 PLL 生成具有特定属性的时钟

由于整个系统比我们之前构建的系统更复杂,因此在将设计的所有部分连接在一起之前,编写大量的测试单元并仔细调试将变得尤为重要。

深度神经网络

我们将使用一种称为多层感知器 (MLP) 的神经网络对 MNIST 手写数字数据集进行分类。也就是说,我们的 MLP 将以 28×28 像素的灰度图像作为输入,并确定该图像对应的数字 (0..9)。

MLP 由几个线性层组成,它们首先将前一层的输出乘以权重矩阵,并为每个输出添加一个恒定的“偏差”值,然后应用非线性激活函数来获得当前层的输出(称为激活)。我们的 MLP 将有一个 784 像素的输入(28×28 像素的图像)、两个 1000 个神经元的隐藏层和一个 10 个神经元的输出层;具有最高值的输出神经元将告诉我们网络认为它看到了哪个数字。对于激活函数,我们将使用整流线性单元 (ReLU),它将所有负数映射到 0,将所有正数映射到自身。

在推理过程中,每一层计算a' = ReLU( W · a + b ),其中W是权重矩阵,a是前一层的激活向量,b是偏置向量,a'是当前层的激活向量。

不要被神经网络等花哨的术语吓倒——你实际上是在构建一个加速器来进行矩阵向量乘法。这里的大部分挑战来自与片外 SDRAM 存储器的交互以及正确处理诸如waitrequest和readdatavalid 之类的信号

不需要知道这些网络是如何训练的,因为我们已经为您训练了网络并预先格式化了图像(请参阅data文件夹的内容和测试输入列表)。但是,如果好奇,可以查看scripts/train.py我们是如何训练 MLP 的。

328a56a8-ed13-11ec-ba43-dac502259ad0.png

关于该项目的一些补充说明请查看下面的PDF:

https://github.com/ryaanluke/DNN-Hardware-Accelerator/blob/main/Deep%20Neural%20Networks%20on%20FPGA.pdf

DNN-accelerator-on-zynq

https://github.com/joycenerd/DNN-accelerator-on-zynq

https://github.com/karanam1997/Dnnweaver-Zed-board-/tree/master/DNNWeaver_original

https://github.com/anonsum/DNNWeaver_Simulations

设计要求:

329b95a8-ed13-11ec-ba43-dac502259ad0.png

整个系统框图如下:

32adb51c-ed13-11ec-ba43-dac502259ad0.png

相关的设计文档:

https://github.com/joycenerd/DNN-accelerator-on-zynq/blob/master/2019DD_lab12Finalv4.pdf

Handwritting-number-distinguishing-with-DNN-by-Nexys-4-DDR-in-Verilog-HDL

https://github.com/MaxMorning/Handwritting-number-distinguishing-with-DNN-by-Nexys-4-DDR-in-Verilog-HDL

用 Verilog HDL 实现 DNN 区分手写数字,在Nexys 4 DDR 上运行。

32bd3b18-ed13-11ec-ba43-dac502259ad0.png

总结

今天介绍了3个DNN的项目,主要是DNN复杂度较TPU或者CNN高了几个台阶,所以用它来直接对FPGA进行移植难度很大,还是只建议对第一个IBM项目进行研究,其他在ZYNQ上进行数字识别适合实现,其他都不怎么推荐

关于DNN或者CNN也介绍了几十个项目了,这些只适合学习研究,并不适合拿来商用,所以后台喷我的小伙伴要求也不要太高,这些开源的项目能直接商用的少之又少,大部分项目只适合学习。还有一些项目是学生做的,所以你们也不必喷:说是拿一些学生做的项目能干什么,我这里只想说,这些项目至少能给您一些参考,什么事情总比从零开始好,或者让你们了解一些同龄人在学校里在干什么,最后,这些项目您又看不上您开源几个出来~

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4765

    浏览量

    100565
  • dnn
    dnn
    +关注

    关注

    0

    文章

    59

    浏览量

    9042

原文标题:​优秀的 Verilog/FPGA开源项目- 深度神经网络 (DNN)

文章出处:【微信号:HXSLH1010101010,微信公众号:FPGA技术江湖】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    如何将布局受限的从属entity应用到另一项目

    为了方便大家理解,以下将准备两项目,分别为 [项目A] 和 [项目B]。我们需要在 [项目B] 中实现 [
    的头像 发表于 08-22 16:42 452次阅读
    如何将布局受限的从属entity应用到另一<b class='flag-5'>个</b><b class='flag-5'>项目</b>

    重装PSoC Creator后无法打开CCG3PA项目,为什么?

    我有一旧的 CCG3PA 项目 (CYPD3171),正在尝试重新编译。 我用新笔记本电脑安装了 PSoC Creator(与旧笔记本电脑上的一样),但软件提示项目已过期,需要更新。
    发表于 07-17 07:03

    深度神经网络(DNN)架构解析与优化策略

    深度神经网络(Deep Neural Network, DNN)作为机器学习领域中的一种重要技术,以其强大的特征学习能力和非线性建模能力,在多个领域取得了显著成果。DNN的核心在于其多层结构,通过
    的头像 发表于 07-09 11:00 1602次阅读

    BP神经网络属于DNN

    深度神经网络(Deep Neural Network,简称DNN)则是指具有多个隐藏层的神经网络,可以处理复杂的数据和任务。那么,BP神经网络是否属于DNN呢? 神经网络是一种模拟人脑神经元网络的计算
    的头像 发表于 07-03 10:18 677次阅读

    第0章_项目方案介绍

    本课程来自一真实项目:多个气体传感器的管理。由于气体传感器比较昂贵,本课程里使用普通传感器来做实验。
    的头像 发表于 06-29 14:02 377次阅读
    第0章_<b class='flag-5'>项目</b>方案<b class='flag-5'>介绍</b>

    分享6实用的ESP32-S3物联网项目:从智能设备到安全创新

    开发人员友好特性和超低功耗,使其在可穿戴设备到智能家居等领域备受推崇。本篇文章分享了6ESP32-S3 DIY项目,例如智能手表、植物生长监测系统和使用行空板和FireBeetle 2 ESP32S
    的头像 发表于 05-17 10:15 716次阅读

    自制一3D打印的移动终端——T3rminal

    T3rminal是我过去几个月一直在努力开发的一CyberDeck,并希望将其开源。 我从不同设备如Decktility、YARH和其他项目中获得了灵感。 你可以在我的Github上协助并关注该
    的头像 发表于 05-09 10:38 482次阅读
    自制一<b class='flag-5'>个</b><b class='flag-5'>3</b>D打印的移动终端——T<b class='flag-5'>3</b>rminal

    基于FPGA进行DNN设计的经验总结

    DNN中应用最广泛的是CNN和RNN,CNN是一种卷积网络,在图片识别分类中用的较多,RNN可以处理时间序列的信息,比如视频识别和语音识别。
    发表于 04-07 10:23 568次阅读
    基于FPGA进行<b class='flag-5'>DNN</b>设计的经验总结

    【Longan Pi 3H 开发板试用连载体验】基于 Longan Pi 3H 开发板完成智能家居控制小型项目

    及4铜柱 与树莓派3B来个对比,尺寸差不多只有树莓派3B的三分之一,性能可是提升不少 详细板卡介绍可以看官网板卡介绍 二、开机 手头上有一
    发表于 04-02 22:37

    Eclipse EZ-USB1.3.5为CX3创建一新的配置项目时报向导无法启动的原因?怎么解决?

    当尝试在最新的 Eclipse EZ-USB 套件 1.3.5 集成开发环境中为 CX3 创建一新的配置项目时,该工具报告了以下错误: 所选向导无法启动。 插件“com.CYPRESS
    发表于 03-04 07:45

    基于OpenCV DNN实现YOLOv8的模型部署与推理演示

    基于OpenCV DNN实现YOLOv8推理的好处就是一套代码就可以部署在Windows10系统、乌班图系统、Jetson的Jetpack系统
    的头像 发表于 03-01 15:52 1429次阅读
    基于OpenCV <b class='flag-5'>DNN</b>实现YOLOv8的模型部署与推理演示

    重庆公布SiC重大项目 三安2工厂即将点亮投产

    昨天,“行家说三代半”报道了三安在重庆的2碳化硅项目进展(.点这里.),今天,三安又公布了最新的项目消息
    的头像 发表于 02-21 09:51 3825次阅读
    重庆公布SiC重大<b class='flag-5'>项目</b> 三安2<b class='flag-5'>个</b>工厂即将点亮投产

    Arduino模组的KiCad符号与封装库介绍

    介绍包含 Arduino 模组(模块、接插件、扩展板)KiCad 原理图符号和 PCB 封装的开源项目
    的头像 发表于 01-13 17:08 1870次阅读
    Arduino模组的KiCad符号与封装库<b class='flag-5'>介绍</b>

    关于FPGA的开源项目介绍

    Hello,大家好,之前给大家分享了大约一百多个关于FPGA的开源项目,涉及PCIe、网络、RISC-V、视频编码等等,这次给大家带来的是不枯燥的娱乐项目,主要偏向老的游戏内核使用FPGA进行硬解,涉及的内核数不胜数,主要目标是高的可实现性及复现性。
    的头像 发表于 01-10 10:54 1363次阅读
    关于FPGA的开源<b class='flag-5'>项目</b><b class='flag-5'>介绍</b>

    idea怎么创建Java项目

    创建Java项目是一相对较为复杂的过程,需要考虑到各种细节和步骤。本文将详细介绍如何创建一Java项目。 一、准备工作 在创建Java
    的头像 发表于 12-06 14:09 886次阅读