电子发烧友App

硬声App

0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示
电子发烧友网>电子资料下载>电子资料>ESP32上的深度强化学习

ESP32上的深度强化学习

2022-12-27 | zip | 0.13 MB | 次下载 | 免费

资料介绍

描述

这是在使用 32 位浮点精度的微控制器上训练深度学习模型的尝试。我们通过构建一个机器人来实现这一点,该机器人学习如何使用深度强化学习以最小距离跟随最近的障碍物。训练过程的演示可以在这里找到

训练过程的演示可以在这里找到。该项目的灵感来自于Pete Warden ( Google TensorFlow)、Neil Tan (ARM) 在微控制器上运行神经网络所做的工作。

介绍

实时机器学习 (RTML) 是指主动解释和学习实时到达的数据。它要求代理人根据先前的知识解决不熟悉的问题,并经常做出实时决策。我们在嵌入式系统的开发和部署环境中讨论 RTML。

目前,地球上活跃着近 150 亿个嵌入式处理器,它们收集并有时处理大量数据。这些数据中的大部分都被丢弃了,因为这些微型计算机通常不具备在其上运行复杂解释任务的硬件功能。出于这个原因,数据通过无线网络发送到功能更强大的中央计算机进行处理。但是这种形式的基于云的架构(其中边缘设备仅执行数据收集)可能由于以下原因而变得不利:

  • 发送数据需要边缘设备和中央计算机之间的通信这个过程对处理器来说是非常耗能的,因此只能间歇性地完成
  • 由于无线通信协议的设计方式,传输数据时的延迟保证权衡是不可避免的。这可能会严重延迟从数据中采取关键行动的时间。
  • 关于数据包从微处理器到达和被微处理器接收所花费的时间,无线通信协议也具有不确定的行为,这对于需要关键响应的任务来说也是非常不希望的。
  • 这种不确定的通信链路要求微处理器几乎一直处于活动状态,这是空闲功耗的主要来源之一。

这就是深度学习的力量所在。深度学习算法实现中最大最密集的操作是矩阵乘法,硬件高效实现已经存在并且完全受算术限制。即使使用现有技术,微处理器和 DSP 也能够在不到一毫瓦的情况下处理数千万或数亿次计算,而且更高效的低能耗加速器即将出现。经过训练后,这些模型能够运行复杂的推理任务并保持对噪声的稳健性,这是实时数据的典型特征。通过在边缘设备中加入深度学习功能使边缘设备更智能,将解决所有源于数据交换的问题,并使其成为从现实世界数据中快速做出重要决策的合适且可靠的候选者。设备在部署到现场后还可以进行持续改进。

以下是深度学习框架如何在资源受限的嵌入式系统上开发和运行的一些更广泛的方法:

  • 现有算法的内存高效实现
  • 低精度量化训练/推理
  • 训练期间的低精度乘法
  • 使用修剪和霍夫曼编码压缩神经网络
  • 使浮点数学对 AI 硬件高效

在本项目中,我们重点介绍第一种方法,并简要介绍第二种方法。据我们所知,这将是第一个开发用于在具有平台独立性的嵌入式系统上训练和运行推理的深度学习库。

使用深度策略梯度网络进行强化学习

有关策略梯度网络的精彩介绍,请参阅本教程所有用于矩阵操作和实施深度学习算法的库都是用 C++ 自定义编写的。

对于这个项目,网络构建如下:

  • 输入层的维度为 1x1。它携带超声波传感器测量到的最近障碍物的距离。
  • 隐藏层的维度为 3x1,具有 RELU 激活。
  • 输出层的维度为 5x1,具有 softmax 激活,对应于机器人可以行进的 5 种可能速度。

训练在每一集之后进行,其中网络对 5 个动作进行采样,执行它们并存储计算出的奖励。


下载该资料的人也在下载 下载该资料的人还在阅读
更多 >

评论

查看更多

下载排行

本周

  1. 1使用单片机实现七人表决器的程序和仿真资料免费下载
  2. 2.96 MB   |  44次下载  |  免费
  3. 2Keysight B1500A 半导体器件分析仪用户手册、说明书 (中文)
  4. 19.00 MB  |  4次下载  |  免费
  5. 3BT134双向可控硅手册
  6. 1.74 MB   |  2次下载  |  1 积分
  7. 4一种新型高效率的服务器电源系统
  8. 0.85 MB   |  1次下载  |  1 积分
  9. 5PR735,使用UCC28060的600W交错式PFC转换器
  10. 540.03KB   |  1次下载  |  免费
  11. 6WTS-100(1.1) UWB 信标定位系统 彩页
  12. 540.48 KB  |  1次下载  |  免费
  13. 7DV2004S1/ES1/HS1快速充电开发系统
  14. 2.08MB   |  1次下载  |  免费
  15. 8MATLAB绘图合集
  16. 27.12 MB   |  1次下载  |  5 积分

本月

  1. 1使用单片机实现七人表决器的程序和仿真资料免费下载
  2. 2.96 MB   |  44次下载  |  免费
  3. 2UC3842/3/4/5电源管理芯片中文手册
  4. 1.75 MB   |  15次下载  |  免费
  5. 3DMT0660数字万用表产品说明书
  6. 0.70 MB   |  13次下载  |  免费
  7. 4ST7789V2单芯片控制器/驱动器英文手册
  8. 3.07 MB   |  11次下载  |  1 积分
  9. 5TPS54202H降压转换器评估模块用户指南
  10. 1.02MB   |  8次下载  |  免费
  11. 6STM32F101x8/STM32F101xB手册
  12. 1.69 MB   |  8次下载  |  1 积分
  13. 7TPS92682-Q1帧定义和示例
  14. 891.71KB   |  6次下载  |  免费
  15. 8HY12P65/HY12P66数字万用表芯片规格书
  16. 0.69 MB   |  6次下载  |  免费

总榜

  1. 1matlab软件下载入口
  2. 未知  |  935119次下载  |  10 积分
  3. 2开源硬件-PMP21529.1-4 开关降压/升压双向直流/直流转换器 PCB layout 设计
  4. 1.48MB  |  420061次下载  |  10 积分
  5. 3Altium DXP2002下载入口
  6. 未知  |  233084次下载  |  10 积分
  7. 4电路仿真软件multisim 10.0免费下载
  8. 340992  |  191367次下载  |  10 积分
  9. 5十天学会AVR单片机与C语言视频教程 下载
  10. 158M  |  183335次下载  |  10 积分
  11. 6labview8.5下载
  12. 未知  |  81581次下载  |  10 积分
  13. 7Keil工具MDK-Arm免费下载
  14. 0.02 MB  |  73807次下载  |  10 积分
  15. 8LabVIEW 8.6下载
  16. 未知  |  65987次下载  |  10 积分