AI简报：内存256KB设备也能人脸检测！-电子发烧友网

1. 内存256KB设备也能人脸检测！微软提出用RNN代替CNN | NeurIPS 2020

Github：
https://github.com/microsoft/EdgeML/blob/master/pytorch/edgeml_pytorch/graph/rnnpool.py

https://github.com/microsoft/EdgeML/tree/master/examples/pytorch/vision

Paper：
https://www.microsoft.com/en-us/research/publication/rnnpool-efficient-non-linear-pooling-for-ram-constrained-inference/

为了让更多IoT设备用上AI，在条件“简陋”的单片机上跑图像识别模型也成为一种需求。

但是图像识别对内存有较高的要求，一般搭载MCU的设备内存都不高，怎样才能解决这个问题呢？

最近，微软提出了一种RNNPool方法，甚至可在内存只有256 KB的STM32开发板上运行人脸检测模型。它可以在不损失准确度的情况下大幅降低激活图的采样率。

RNNPool在语法上等效于池化算子，可以快速减小中间图的大小。它的模型层数更少，对内存要求更低，可以在内存受限的小型设备上分析图像。

RNNPool由两个学习递归神经网络（RNN）组成，它们以每个模块为单个向量，在水平和垂直方向上扫过激活图的每个模块。

RNNPool获取一个激活图的模块并将其汇总为1×1体素，然后逐步执行下采样步骤。RNNPool可以支持8×8，甚至16×16的模块大小，并且可以以步长s = 4或s = 8采样，而不会显著降低精度。

2. 1瓦功耗，5GHz频率：全球最快Risc-V 芯片出世，效率超越苹果M1

根据全球半导体行业知名媒体 EE Times 的报道，前些天，一家位于加州森尼维尔的小型电子设计公司 Micro Magic 宣称：他们设计、生产出了全世界最快的 64 位 RISC-V 内核，比苹果的 M1 芯片和 Arm Cortex-A9 表现还要出色。

Micro Magic 的声明中提到，这款原型 CPU 在 1.1v 电压下可以达到 5GHz 的时钟速度，远高于运行速度为 3.2GHz 的英特尔 Xeon 服务器芯片 E7，CoreMarks 跑分达到 13000 分。而 1.1 伏时，该芯片只需要消耗 1 瓦的功率，不到英特尔 Xeon 功率的 1%。此外，单个 Micro Magic 核心在 0.8V 下可以达到 4.25GHz，CoreMarks 跑分达到 11000 分，但消耗的功率仅为 200mW。

这款 RISC-V 芯片的速度和能效也超过了 Exynos 4。Exynos 4 是三星电子为其智能手机生产的顶级部件，基于 ARM Holdings Plc 提供的计算核心，是英特尔的主要竞争对手。

这款芯片不仅在低功耗下速度更快，在基准得分上也赶超英特尔和三星的芯片。在 CoreMark 基准测试中，这款 RISC-V 芯片的得分为 13000 分，是基于 ARM 的 Exynos 单核性能得分的两倍多。虽然英特尔 Xeon 名义上单核性能更高，达到 26009 分，但 Xeon 需要更多线程，120 个线程才能达到上述结果。

图灵奖获得者，计算机体系结构先驱 David Patte rson：「这真是太神奇了。」

3. VS Code竟然能约会！找对象不看脸，看编程水平

VS Code现在居然可以用来谈恋爱了。

为了用最硬核的方式找到男（女）朋友，23岁的程序员Ben Awad在VS Code里打造一个约会软件VSinder。

顾名思义，VSinder = VS Code + Tinder，就是把约会软件集成到了代码编辑器里，简直太对程序员胃口了。

VSinder和Tinder的操作逻辑一样，左滑把不喜欢的人pass掉，右滑收藏喜欢的人。

这款插件一上线，就快速赢得程序员们的认可，GitHub上已收获800 Star，3天的下载量超过9000次。

既然是面向程序员的约会软件，自然不能和其他约会App一样，一定要有特色。

VSinder的特点就是，可以根据编程语言和代码风格筛选对象。

比如你用的是Python，她用的是C，那么你们之间可能没有共同语言。（以免将来为哪种语言最好吵架。）

4. AI把特朗普变成了dancer，跟着蔡徐坤跳起了『鸡你太美』

“好家伙！”

“现在的Paper也是越来越皮了”。正在开心摸鱼的同事，边说边给我发过来一段Demo。

原来『宝藏男孩』特朗普又被玩坏了。

『被逼着』跟蔡徐坤跳起了“鸡你太美”（谐音梗）。

逼着川宝大秀舞姿的是上海科技大学研究团队的最新AI，这篇AI论文名:

《Liquid Warping GAN with Attention：A Unified Frame work for Human Images Synthesis》

简单理解就是，基于特定框架的AI，能够完成运动仿真、外观转换以及新视图合成等人体图像处理任务。上面特朗普的舞蹈Demo是AI合成的最终演示效果。

5. 57.3 AP！刷新COCO目标检测和实例分割新记录！谷歌提出 Copy-Paste 大法

Paper：https://arxiv.org/abs/2012.07177

上个月，Scaled-YOLOv4刚刚刷新COCO 目标检测的新记录：55.8% AP！

昨天该数据又双叒叕被打破了！

谷歌拿下COCO目标检测和实例分割双项第一名！其中：

目标检测数据刷到57.3 AP；

实例分割数据刷到49.1 AP！

本文主要创新点：

1. Blending Pasted Objects

公式：I1 × α + I2 × (1 - α)

2. Large Scale Jittering

3. Self-training Copy-Paste

这三点其实很容易理解（不用翻译，直接看懂），没有花哨的处理，但实验证明涨点明显！

6. Github Star 7.2K，超级好用的OCR数据合成与半自动标注工具，强烈推荐！

Github:

https://github.com/PaddlePaddle/PaddleOCR

OCR 方向的工程师，一定需要知道这个 OCR 开源项目：PaddleOCR。短短几个月，累计 Star 数量已超过 7.2K，频频登上 Github Trending 日榜月榜，称它为 OCR 方向目前最火的 repo 绝对不为过。

10 月，发布 PP-OCR 算法，开源 3.5M 超超轻量模型，再下 Paperswithcode 趋势榜第一

12 月，它又带来四大新发布与升级，核心内容先睹为快：

全新发布数据合成工具 Style-Text：可以批量合成大量与目标场景类似的图像，在多个场景验证，效果均提升 15% 以上。

全新发布半自动数据标注工具 PPOCRLabel：有了它数据标注工作事半功倍，相比 labelimg 标注效率提升 60% 以上，社区小规模测试，好评如潮。

多语言识别模型效果升级：中文、英文、韩语、法语、德语、日文识别效果均优于 EasyOCR。

PP-OCR 开发体验再升级：支持动态图开发（训练调试更方便），静态图部署（预测效率更高），鱼与熊掌可以兼得。

7. TensorFlow 2.4 正式发布！提供GPU支持的新功能，推出 tf.experimental.numpy

TensorFlow 2.4 正式发布！随着对分布式训练和混合精度提供更多支持，加入新的 Numpy 前端及用于监控和诊断性能瓶颈的工具，这个版本的亮点在于推出新功能，以及对性能和扩展方面的增强。

TensorFlow 2.4 以 tf.experimental.numpy 形式，实验性引入了对 NumPy API 子集的支持。您可借此模块，运行由 TensorFlow 加速的 NumPy 代码。由于此 API 基于 TensorFlow 构建而成，因此可支持访问所有 TensorFlow API，与 TensorFlow 实现无缝互操作，并会通过编译和自动矢量化开展优化。例如，TensorFlow ND 数组可以与 NumPy 函数进行交互，同样地，TensorFlow NumPy 函数也可以接受包括 tf.Tensor 和 np.ndarray 在内的不同类型的输入。

8. 保姆级教程: 个人深度学习工作站配置指南 | 稚晖@知乎

本文记录了组装深度学习工作站过程中的超详细操作流程，文章分为

硬件篇
1.1 工作站配置选型

1.2 电脑组装

系统篇 - Ubuntu20.04

DL开发环境配置篇

工作站的维护

供有类似需求的同学作为参考。

责任编辑：lq

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

芯片

芯片

+关注

关注
455

文章
50697

浏览量
423052
微软

微软

+关注

关注
4

文章
6589

浏览量
104019
图像识别

图像识别

+关注

关注
9

文章
520

浏览量
38265

原文标题：【20201218期AI简报】内存256KB设备也能人脸检测！

文章出处：【微信号：RTThread，微信公众号：RTThread物联网操作系统】欢迎添加关注！文章转载请注明出处。

探索三轴AI智能人脸跟踪云台的神奇驱动方案

在当今数字化的时代，直播已经成为一种流行的社交和商业活动方式。为了提供更优质、更流畅的直播体验，各种创新的技术和设备应运而生。其中，三轴 AI 智能人脸跟踪云台 360 度旋转全自动手机直播云台的驱动方案无疑是一项引人瞩目的创新

发表于 10-21 17:42 •187次阅读

深度伪造人脸检测项目

各位 AI 爱好者们，准备好通过各种 AI 技术来应对一个迫切需要被解决的全球问题了吗？MathWorks 诚邀您参加 2025 IEEE Signal Processing Cup 挑战赛：“野外深度伪造人脸

发表于 10-17 10:46 •311次阅读

深度伪造<b class='flag-5'>人脸</b><b class='flag-5'>检测</b>项目

可穿戴设备氧饱和度 (SpO2) 测量应用简报

电子发烧友网站提供《可穿戴设备氧饱和度 (SpO2) 测量应用简报.pdf》资料免费下载

发表于 09-10 09:20 •0次下载

可穿戴<b class='flag-5'>设备</b>氧饱和度 (SpO2) 测量应用<b class='flag-5'>简报</b>

可穿戴设备上的心电图信号采集应用简报

电子发烧友网站提供《可穿戴设备上的心电图信号采集应用简报.pdf》资料免费下载

发表于 09-10 09:19 •0次下载

可穿戴<b class='flag-5'>设备</b>上的心电图信号采集应用<b class='flag-5'>简报</b>

基于迅为RK3568/RK3588开发板的AI图像识别方案

01_官方模型测试 02_人脸识别 03_口罩检测 04_工地防护 05_扑克牌识别 06_手掌关键点检测 07_人脸特征点检测

发表于 08-28 09:50

人脸检测模型的精确度怎么算

人脸检测模型的精确度评估是一个复杂的过程，涉及到多个方面的因素。本文将从以下几个方面进行介绍：人脸检测模型的基本概念、评估指标、评估方法、影响因素以及提高精确度的策略。

发表于 07-04 09:14 •495次阅读

人脸检测模型有哪些

人脸检测是计算机视觉领域的一个重要研究方向，它涉及到从图像或视频中检测出人脸的位置和大小。随着深度学习技术的发展，人脸检测模型的性能得到了显

发表于 07-03 17:05 •991次阅读

人脸检测和人脸识别的区别是什么

人脸检测和人脸识别是计算机视觉领域的两个重要技术，它们在许多应用场景中都有广泛的应用，如安全监控、身份验证、社交媒体等。尽管它们在某些方面有相似之处，但它们之间存在一些关键的区别。本文将详细介绍

发表于 07-03 14:49 •1155次阅读

人脸检测与识别的方法有哪些

越来越重要的角色。随着计算机技术的发展，人脸检测与识别技术也在不断地进步和完善。本文将从人脸检测与识别的基本概念出发，详细介绍各种方法和技术

发表于 07-03 14:45 •696次阅读

FreeRTOS能否与PSoC 4100S Plus 256KB和PSoC 4100S Plus一起使用？

FreeRTOS 能否与 PSoC 4100S Plus 256KB 和 PSoC 4100S Plus 一起使用？

发表于 06-04 13:43

基于FPGA的内存128M flash芯片控制器设计方案

这款flash芯片的的存储是一个扇区4KB，一个扇区可以存256个字，一个字是8位，一个块是64KB，一共有256个块组成一个存储flash内存

发表于 04-19 09:52 •1147次阅读

智能人脸识别一体机+门禁考勤解决方案

一、概述随着物联网和人工智能等技术的快速发展，“扫脸”跟扫码开门逐渐走入写字楼、智慧园区、智慧校园、智慧社区、景区人脸验票、工地实名核验等场所并赋能智慧场景，智能人脸识别一体机作为提供数字门禁考勤

发表于 04-02 14:18 •1472次阅读

STM32G474RCT6超出FLASH之外的地址，依然可以正常读写，这正常吗？

有大佬碰到过超出FLASH之外的内存，也可以正常读写的情况吗？我用的芯片是STM32G474RCT6，FLASH为 256kB的，但是我对 Page64页、Page65页或者后面几页读写，都是正常的

发表于 03-15 08:17

智能门禁的人脸识别设备有哪些功能优势？

如今，智能人脸识别门禁设备被广泛应用于安防领域，无论是在小区物业、园区写字楼、景区等出入口通道，还是在学校、企业、工厂工地等场景下，都不难发现它的身影。不仅能为管理者提供更安全、更便捷、更智能

发表于 03-13 14:06 •766次阅读

AT28C256 EEPROM芯片简单介绍

AT28C256是一款由Atmel公司生产的256KB的EEPROM芯片，具有高速读写特性，适用于多种应用场合，包括数据存储、程序存储、固件升级等。

发表于 02-01 17:34 •2102次阅读

搜索历史

AI简报：内存256KB设备也能人脸检测！

评论