阿里达摩院提出MogFace：人脸检测新工作-电子发烧友网

一、开源

MogFace: Towards a Deeper Appreciation on Face Detection

1. 论文链接：

https://openaccess.thecvf.com/content/CVPR2022/papers/Liu_MogFace_Towards_a_Deeper_Appreciation_on_Face_Detection_CVPR_2022_paper.pdf

2. 代码模型：

https://modelscope.cn/models/damo/cv_resnet101_face-detection_cvpr22papermogface/summary

3. 可玩应用：

https://modelscope.cn/studios/baigui/face_album/summary

二、背景

人脸检测算法是在一幅图片或者视频序列中检测出来人脸的位置，给出人脸的具体坐标，一般是矩形坐标。它是人脸关键点、属性、编辑、风格化、识别等模块的基础。本文通过实验观察发现，对应设计出如下三个模块构建出一个高性能的人脸检测器MogFace：1.）动态标签分配策略（dynamic label assignment），2.）误检上下文相关性分析（FP context analysis），3.）金字塔层级监督信号分配（pyramid layer level GT assignment）。该方法的模型在WIDER FACE榜单上取得了截止目前将近两年的六项第一。

三、观察

1.1 动态标签分配策略（dynamic label assignment）

为每个anchor点定义cls和reg目标是训练检测器的必要过程，在人脸检测中这个过程称之为标签分配（Label Assignment）。最近，标签分配吸引了诸多研究人员的注意，在人脸检测及通用物体检测领域提出了一系列方法，例如：OTA、PAA，ATSS以及HAMBox。如示例图(a)，标签分配过程依赖4个元素。分别是：1.）offline information: a.）IoU (anchor与ground-truth框的IoU) ， b.）CPD (anchor与ground-truth中心点的距离) ，2.）online information: a.）PCS (cls分支对anchor的前景分类概率值) ，b.）PLC (reg分支对anchor的预测坐标值)。

但是，目前的标签分配方法存在三个问题。1.）若只用offline information做静态标签分配，那么会有很多具备更强回归能力的negative anchor无法被有效利用起来，会导致标签分配策略欠饱和。2.）若过度信任online information动态调整正负anchor时（如OTA和Hambox），由于online information属于预测信息可信度不高，会导致标签分配策略错误多，极端情况下会陷入trivial 的分配结果。3.) 若引入大量超参（K in ATSS, alpha in OTA）做标签分配，则当数据集分布发生变化时，需要大量的调参时间。

1.2 误检上下文相关性分析（FP context analysis）

在实际应用中，人脸检测器并不会十分care AP的指标，而对误检（false positive [FP]）的数量十分敏感。针对这个问题，目前的做法是收集大量带有FP的图片去fine-tune或者from scratch训练检测器，来帮助检测器了解更多范式的FP，但是我们发现有些频繁出现在训练集中的的FP在这种策略下无法有效解决。这篇文章，我们发现了一个有趣的现象：对于同一个FP，当它的context发生变化时，对于同一个检测器来说它可能就不是FP了。如下图(c)，最左面的图片里日历是FP，剩余两张日历都不是FP。

1.3 金字塔层级监督信号分配（pyramid layer level GT assignment）

scale-level 数据增强策略常常作通用物体检测以及人脸检测中解决scale variance主要手段。如图(b)所示，相对于COCO，人脸检测数据集Wider Face 中人脸的尺度分布更为严峻。为此，我们分提出了一个新的问题，如何合理的分配ground-truth 在不同pyramidlayer上的分布？即检测器的性能与每个pyramidlayer匹配ground-truth的个数之间的关系是什么？是否越多越好？通过严格的对比实验我们发现：“对于所有的pyramid layer来说，并不是这个pyramid layer匹配到越多的ground-truth就越好”。这说明要挖掘每一个pyramidlayer的最好性能，需要控制在这个pyramidlayer上的ground-truth分配的比例。

四、方法

2.1 Adaptive Online Incremental Anchor Mining Strategy (Ali-AMS)

针对上述“动态标签分配策略（dynamic label assignment）”观察分析，本文提出了在里面一种自适应的在线增量锚挖掘策略（Ali-AMS），它基于standard anchor matching 策略，并进一步adaptive 帮助outlier face匹配anchor。如下：

2.2 Hierachical Context-Aware Module (HCAM)

基于上述“误检上下文相关性分析（FP context analysis）”观察分析，发现“对于同一个FP，当它的context发生变化时，对于同一个检测器来说他可能就不是FP了”，我们进一步提出了一个two-step的模块来显示的encode context 信息来帮助区分FP和TP，显著减少了FP的数量。

2.3 Selective Scale Enhancement Strategy （SSE）

基于上述的“金字塔层级监督信号分配（pyramid layer level GT assignment）”观察分析，发现“对于所有的pyramid layer来说，并不是这个pyramid layer匹配到越多的ground-truth就越好”，我们提出通过控制pyramid layer 匹配的ground-truth的数量来最大化pyramid layer 的性能。

五、实验

3.1 Ablation Study

3.2 Comparison with sota

审核编辑：李倩

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

模块

模块

+关注

关注
7

文章
2707

浏览量
47474
检测器

检测器

+关注

关注
1

文章
864

浏览量
47688
检测算法

检测算法

+关注

关注
0

文章
119

浏览量
25220

原文标题：WIDER FACE六项第一！阿里达摩院提出MogFace：人脸检测新工作 | CVPR 2022

文章出处：【微信号：CVer，微信公众号：CVer】欢迎添加关注！文章转载请注明出处。

如何用OpenCV的相机捕捉视频进行人脸检测--基于米尔NXP i.MX93开发板

本篇测评由优秀测评者“eefocus_3914144”提供。本文将介绍基于米尔电子MYD-LMX93开发板（米尔基于NXP i.MX93开发板）的基于OpenCV的人脸检测方案测试。 OpenCV

发表于 11-15 17:58

阿里达摩院发布玄铁R908 CPU

在杭州第四届RISC-V中国峰会上，阿里达摩院再次展现技术实力，隆重推出了玄铁处理器家族的最新成员——R908 CPU。此次发布标志着玄铁系列在高端计算领域的全面升级，吸引了业界的广泛瞩目。

发表于 08-23 16:27 •1001次阅读

人脸识别技术的原理介绍

的应用。本文将详细介绍人脸识别技术的原理，包括人脸检测、人脸特征提取、人脸匹配等关键步骤。一、人脸

发表于 07-04 09:22 •1199次阅读

人脸检测模型的精确度怎么算

人脸检测模型的精确度评估是一个复杂的过程，涉及到多个方面的因素。本文将从以下几个方面进行介绍：人脸检测模型的基本概念、评估指标、评估方法、影响因素以及提高精确度的策略。

发表于 07-04 09:14 •527次阅读

人脸检测模型有哪些

人脸检测是计算机视觉领域的一个重要研究方向，它涉及到从图像或视频中检测出人脸的位置和大小。随着深度学习技术的发展，人脸检测模型的性能得到了显

发表于 07-03 17:05 •1040次阅读

人脸检测和人脸识别的区别是什么

人脸检测和人脸识别是计算机视觉领域的两个重要技术，它们在许多应用场景中都有广泛的应用，如安全监控、身份验证、社交媒体等。尽管它们在某些方面有相似之处，但它们之间存在一些关键的区别。本文将详细介绍

发表于 07-03 14:49 •1224次阅读

人脸检测的五种方法各有什么特征和优缺点

人脸检测是计算机视觉领域的一个重要研究方向，主要用于识别和定位图像中的人脸。以下是五种常见的人脸检测方法及其特征和优缺点的介绍：基于肤色的

发表于 07-03 14:47 •841次阅读

人脸检测与识别的方法有哪些

人脸检测与识别是计算机视觉领域中的一个重要研究方向，具有广泛的应用前景，如安全监控、身份认证、智能视频分析等。本文将详细介绍人脸检测与识别的方法。引言

发表于 07-03 14:45 •723次阅读

阿里达摩院提出“知识链”框架，降低大模型幻觉

近日，阿里巴巴达摩院（湖畔实验室）携手新加坡南洋理工大学等研究机构，共同推出了大模型知识链（CoK）框架。该框架不仅可实时检索异构知识源，还能逐步纠正推理错误，有效提高了大模型在回答知识型问题时的准确率，并显著降低了所谓的“幻觉

发表于 05-10 11:46 •695次阅读

润开鸿荣膺达摩院“玄铁优选伙伴”奖

江苏润和软件股份有限公司的控股子公司润开鸿数字科技有限公司，在近期阿里巴巴达摩院玄铁团队主办的2024玄铁RISC-V生态大会上，荣获了备受瞩目的“玄铁优选伙伴”奖。这一荣誉是对润开鸿在推动RISC-V生态发展方面所做出的杰出贡

发表于 03-21 10:41 •1368次阅读

玄铁RISC-V生态大会深圳召开，达摩院引领RISC-V创新应用

：达摩院院长张建锋在玄铁RISC-V生态大会上致词，RISC即将迎来蝶变进入应用爆发期从2018年起，阿里巴巴开始投入RISC-V架构，是国内最早涉足RISC-V的技术团队之一。2019年玄铁C910处理器推出，成为全球R

发表于 03-19 10:02 •4477次阅读

达摩院院长张建锋：RISC-V迎来蝶变，进入应用爆发期

3月14日，在2024玄铁RISC-V生态大会上，达摩院院长张建锋表示，随着新型算力需求激增，RISC-V发展迎来蝶变，即将进入应用爆发期。他表示，达摩院将持续加大RISC-V的研发投

发表于 03-14 16:59 •1498次阅读

达摩院牵头成立“无剑联盟”，探索RISC-V产业合作新范式

3月14日，由达摩院举办的2024玄铁RISC-V生态大会在深圳举行，来自Arteris、新思科技（Synopsys）、Imagination、中国科学院软件研究所、中国电信研究院等全球数百家企业

发表于 03-14 16:56 •376次阅读

阿里达摩院北京公司新增AI业务

阿里巴巴达摩院（北京）科技有限公司近日进行了工商变更，经营范围有所调整。具体来说，公司去除了智联网、芯片技术、量子计算等数据通信、电子产品、软件和硬件技术及产品的研究、开发等业务，而新增了人工智能应用软件开发、人工智能基础软件开

发表于 02-23 11:39 •1045次阅读

阿里达摩院在上海成立新公司，聚焦人工智能与软件开发

天眼查信息显示，达摩院（上海）科技有限公司已正式成立，法定代表人为张建锋，注册资本为1000万人民币。该公司由阿里巴巴旗下阿里巴巴达摩

发表于 02-04 10:52 •1009次阅读

搜索历史

阿里达摩院提出MogFace：人脸检测新工作

评论

如何用OpenCV的相机捕捉视频进行人脸检测--基于米尔NXP i.MX93开发板

阿里达摩院发布玄铁R908 CPU

人脸识别技术的原理介绍

人脸检测模型的精确度怎么算

人脸检测模型有哪些

人脸检测和人脸识别的区别是什么

人脸检测的五种方法各有什么特征和优缺点

人脸检测与识别的方法有哪些

阿里达摩院提出“知识链”框架，降低大模型幻觉

润开鸿荣膺达摩院“玄铁优选伙伴”奖

玄铁RISC-V生态大会深圳召开，达摩院引领RISC-V创新应用

达摩院院长张建锋：RISC-V迎来蝶变，进入应用爆发期

达摩院牵头成立“无剑联盟”，探索RISC-V产业合作新范式

阿里达摩院北京公司新增AI业务

阿里达摩院在上海成立新公司，聚焦人工智能与软件开发